计算机科学与技术硕士,专注计算机视觉(目标检测、深度学习),关注Linux环境下各算法配置。
线性SVM算法的一般过程 线性SVM的推导 超平面方程 SVM是用来分类的。给定一系列输入数据(n维向量),需要找到一个切分界线(n-1维的超平面),这里假定数据是线性可分的。比如,二维数据的超平面是直线,三维数据的超平面是二维平面。
朴素贝叶斯 标签(空格分隔): 机器学习 朴素贝叶斯算法适合给文档分类。 词向量 先对文档分词,所有文档中所有不同的词构成词汇表。每个文档根据词汇表能形成一个词向量,1表示对应维度的词条出现在文档中,0表示词条未出现。
kNN算法笔记 标签(空格分隔): 机器学习 kNN是什么 kNN算法是k-NearestNeighbor算法,也就是k邻近算法。是监督学习的一种。所谓监督学习就是有训练数据,训练数据有label标好(也就是分类分好的)。
玩坏前端 标签(空格分隔): 前端 发现自己好久没更博了,最近一直在努力学习数学,哈哈。十月的最后一天,分享一些有趣的东西。 浏览器To编辑器 在html5中多了一个特性,叫做contenteditable,这个特性可以让html里的一个元素变成可编辑状态。
公式推导 paper闪光点 找到了一个很简洁的假设。 paper不足 代码跑起来很慢。据说2010年的ECCV那篇是改进的。
号外,号外 -几乎所有的binary search和mergesort都有错 这是Joshua Bloch(Effective Java的作者)在google blog上发的帖子。在说这个帖子之前,不得不强力重复Joshua Bloch的推荐:如果你还没有读过Programming Pearls (中文版叫《编程珠玑》)这本书,现在就去读吧。
为什么不去读顶级会议上的论文?适应于机器学习、计算机视觉和人工智能? 看了版上很多贴子,发现很多版友都在问“热门研究方向”、“最新方法”等。有同学建议国内某教授的教材、或者CNKI、或者某些SCI期刊。
Java门派的风险 正在看周思博(www.joelonsoftware.com)的新文章。这次是疯狂攻击Java。主要论点是:Java不够难,作为工业语言不错,但作为学校的教学语言,就忒差了。学校应该用指针和递归这类东西把真正的程序员筛选出来。
[软件工程师需要数学的真正理由](http://blog.csdn.net/g9yuayon/article/details/8737) 作者:Keith Devlin 翻译:g9yuayon 本文译自 The Communication of ACM 第44卷,2001年第10期 软件工程师们常常宣称他们从来不用在大学里学到的任何数学知识. 说到这个,他们还会说连大学里学到的计算机专业知识都用不了多少。
Python中的json操作 标签(空格分隔): python 编码 json 字符串前缀问题 字符串前缀可以有r,ur:表示原始(raw)字符串,比如'\n'不会被转义。常用于正则。 u:表示unicode字符串。
SICP第三章题解 标签(空格分隔): SICP [toc] ex3-17 统计一个表结构中的序对个数 (define (count-pairs x) (count-helper x '())) (define (count-helper x seq) (if (memq? x seq) (count-helper (cdr x) seq) (count-helper (cdr x) (list x seq)) ) ) ex3-18 判断一个表中是否包含环。
配置OpenCV+VS2013环境 准备工作 win7系统 下载opencv的windows编译版 安装vs2013 express 设定环境变量 按windows窗键输入path,选择第二个结果编辑系统环境变量 新建系统变量OPENCV,值为你opencv解压后的build子目录路径,build表示为vc编译器编译好的。
在用《有道云笔记》等软件时候,软件自身不提供代码高亮功能,对于需要记录code的学习笔记,视觉效果丢失。 有很多在线工具能用来代码高亮,比如oschina就有代码高亮页面用于着色。 但是我想要sublime里那种效果,有没有方法做到? 应该已经有人开发过这种插件了吧:代码高亮,主题选取,甚至字体、行号......各种js插件? 为了练手我自己手用python写了一个web app用来代码高亮:服务端用pygments进行语法解析,前端用pygments生成的颜色主题css进行配色。
2015年5月3日 22:15:43 在win7下安装了python、simplecv,试着运行simplecv官网第一个hello world程序结果报错,提示说%python%/lib/site-packages/SimpleCV/sampleimages目录不存在。
本文转载自http://zengrong.net/post/2169.htm,感谢原作者。 一、困惑 作为一个 Python 初学者,我在包管理上感到相当疑惑(嗯,是困惑)。主要表现在下面几个方面: 这几个包管理工具有什么不同? distutils setuptools distribute disutils2 distlib pip 什么时候该用pip,什么时候该用 setup.
1.设计一个函数,输入为一个32位的26个字母组成的字符串,输出为三个个位数组成的字符串,并且每个数字都是0-6中选出的。 要求多次调用此函数后,0-6中每个数字出现频率基本一致。 2.用python的编写正则表达式:判断一个字符串是否为合法ip地址。 3.设计全文检索lucene的数据结构。
C#中用GDT+的一系列方式,可以绘制各种图形:点,直线,圆形,矩形...... C#中这些图形的绘制,一般教程的demo中给出的代码,是在Form1_Paint(object sender, PaintEventArgs e)函数中完成绘图。
C#写的一个GUI窗口,有几百个矩形区域。每个矩形区域的颜色随时都可能改变,并且多次改变。 我放弃使用label绘制矩形,因为效果不好。拖控件的界面使用power packs中的rectangleshape绘制。
代理服务器是在client和server之间的一个服务器,一般起到缓存的作用,所以也叫缓存服务器。比如: A ----(HTTP)----》 B ----(HTTP)----》 C 其中A是客户端,C是服务器端,那么B就是proxy server了,是代理服务器,也是缓存服务器:当A发起请求时要求获得C上的一个文件,需要先经过B,B在自己的文件系统中寻找是否有A所请求的文件,如果有,就发给A,完成一次响应;如果没有,则在B上创建新的HTTP请求,发送到C,并将C的响应缓存到文件中,同时回发给A。
发送邮件可以用smtp协议,整个过程为: 用户代理(user-agent,比如outlook、foxmail等邮件客户端)---(smtp协议)--->本地邮件服务器 --- (smtp协议)---> 远程邮件服务器 --- (imap,pop3或http协议)--->远程客户代理(收取邮件) 其中本地邮件服务器和远程邮件服务器是直通式,一般不经过中转,如果远程邮件服务器没开启等原因导致发送失败那么过一段时间后重复发送。
网络编程一项基本功是socket编程,包括TCP socket,UDP socket的客户端、服务器端编程。 应用层的各路协议如http,smtp,telnet,ftp等都依赖于传输层的TCP或者UDP,具体讲就是这两种socket为应用层提供传输功能。
转载自http://blog.csdn.net/hbhhww/article/details/8152838 栈与堆都是Java用来在Ram中存放数据的地方。与C++不同,Java自动管理栈和堆,程序员不能直接地设置栈或堆。
fedora作为linux主流发行版之一,大部分功能还是很赞的。只是在美观性和其他一些细节上还是需要手工调整才有更加体验。 以下解决方案,使用fedora20+gnome3环境 eclipse界面难看 eclipse中各种按钮组件占用太多的空白空间,看起来臃肿不堪。
运行lisp方言——scheme,在windows下,用eclipse。 1.eclipse装好 2.eclipse安装插件scheme48 development took, http://www.s48.
2015年1月20日 14:41:47 阶段性暂停!! 把运行结果截图给了老师,老师说先整理下文档,然后下学期来了再部署到服务器上。 那么,下学期来了,估计也要把Epm和CR1000什么的搞好了。 先总结一下目前的情况好了: 0.用到的技术 python语言,webpy框架,mysql数据库,nginx部署,emacs和vim编辑器,bootstrap框架,echarts图表库 1.python搭建网站 用的是webpy框架 主要看webpy.org官方文档 2.部署 用nginx做web server。
关于linux下权限操作chmod的一些说明!比rxw高级内容! 转载自http://blog.chinaunix.net/uid-26642180-id-3378119.html Set uid, gid,sticky bit的三个权限的详细说明 一个文件都有一个所有者, 表示该文件是谁创建的.
C++ "multiple definition of .. first defined here" 在C++中,有时候需要在不同文件中使用同一个变量。对于这类变量如果处理不当,很容易出现“multiple definition of... first defined here”的错误。
sublime text配置fcitx输入法 环境:Fedora20 输入法:fcitx sublime text:version 3 安装fcitx输入法 这个看前面教程 编译sublime-imfix.
sublime text配置make工具 Linux下许多项目是用makefile来管理的,是用gcc+make等方式来编译和运行。 在只有tty的场合或年代,使用vim或emacs是不二选择;但在Linux桌面环境下开发时,能用GUI工具则会更加方便,鼠标的使用能提升效率。
Fedora20安装fcitx输入法 Fedora20默认安装的是ibus输入法,总有一些原因让我们选择fcitx输入法: ibus出词顺序有bug 在输入人名的时候,有些名字输入两三次后还是不会出现则备选词中,其中一部分重新切换到ibus后能出来。
Writing-a-Kernel-in-C++ Write a Kernel in C++ Tools Examples will show hot to use :- GJGPP - a complete 32-bit C/C++ development system for INtel 80386(and higher) PCs running DOS.
本文乃转载, 我在其基础上做了少量修改. 原作者的E-mail是zhanglei@sict.ac.cn. 完成于2005.11.5-2005.11.80. Contents1. 概论2. 基本概念3.
JDK自带了Robot类,此类用于为测试自动化、自运行演示程序和其他需要控制鼠标和键盘的应用程序生成本机系统输入事件。Robot 的主要目的是便于 Java 平台实现自动测试。 详情可查看jdk1.6中文手册Robot类 例子:打开win7的任务管理器,快捷键是ctrl+shift+esc import java.
看到Atom的官网(https://atom.io/)上说,Atom是A hackable text editor for the 21st Century,是一个基于V8引擎的editor,于是决定试试看。
学习web开发,环境搭建是必不可少的一个环节。你可以使用wamp一键安装包,或者使用sae、bae、gae这种PaaS平台来部署,或者安装*nix系统在本地部署。
在使用Linux的时候,最常见的终端解释器就是bash了。bash下有很多技巧,我知道这么几个: 0.关于按键模式bash默认的按键模式是emacs风格的。
我希望把Firefox的界面调整为chrome-like,一个关键的地方就是地址栏:地址栏和tab之间的距离太大了,地址栏和页面本身之间的距离也太大。 设定方法是在FF中安装stylish插件,然后加入如下css配置代码: #nav-bar toolbarbutton:not([id=...
转载自http://chriszz.sinaapp.com 一般从Eclipse官网eclipse.org下载的,都是打包好的版本,比如标准版、jee版、java版、c++版、php版、测试版等。有时候觉得下了一个版本后还想装些插件,或者觉得默认安装的插件有不需要的想删掉。
最简单的爬虫,不需要设定代理服务器,不需要设定cookie,不需要http连接池,使用httpget方法,只是为了获取html代码... 好吧,满足这个要求的爬虫应该是最基本的爬虫了。当然这也是做复杂的爬虫的基础。
JavaWeb--中文乱码小结 出处:http://chriszz.sinaapp.com0.纯粹html乱码: 换个editor吧(有时候notepad都比sublime_text好用),最好是在之间添加 1.
本文转载自http://chriszz.sinaapp.com/?p=257 输入一个正则表达式,输出一个NFA。 我的做法:输入一个字符串表示正则,输出则是把输出到一个.dot文件中并将dot文件编译成pdf,fedora需要sudo yum install dot,然后evince XXX.pdf就可以查看生成的NFA了。
Fedora19下使用myeclipse2013时,打开不到一分钟就异常关闭。 默认在home目录下生成一个log文件,里面显示的错误信息,说是libsoup.so文件导致出错。第一个想法是删除这个文件:sudo mv /usr/lib64/libsoup.
在Eclipse中导入新浪微博SDK 今天在看《Android开发应用实战》,全书都在讲一个android版的新浪微博客户端怎么做,于是按照书上步骤做。网上有人说这本书没有细节,我想对于小白来讲确实需要一些细节,因为我作为一个android小白,确实不知道如何正确地导入新浪微博SDK。
C语言中的注释,不嵌套,一律使用/* */的形式。不过双引号中的/* */则不能算是注释。 以下是正确的代码 /* * ================================================== * * Filename: 1-23.
红黑树:个人理解与Python实现 【基本事实1】 红黑树是一种平衡的二叉查找树,无论插入还是删除操作都可以在O(lg n)内实现,而一般的二叉查找树则在极端情况下会退化为线性结构。红黑树之所以是平衡的二叉查找树,是因为每个节点都有表示其颜色的域值:红或黑,在插入和删除操作的时候依据节点的颜色向平衡的方向调整。
堆是一种数据结构,因为Heapsort而被提出。除了堆排序,“堆”这种数据结构还可以用于优先队列的实现。 堆首先是一个完全二叉树:它除了最底层之外,树的每一层的都是满的,且最底层中的节点处于左边,相互之间没有“跳变”;其次,堆有次序属性:每个节点中的数据项都大于或者等于其子女的数据项(如果是记录,则这些记录中的某个关键域必须满足这一属性)。
二叉查找树,英文Binary Search Tree,也叫二叉排序树,是一种基本的数据结构,简称BST 它支持多种动态集合操作,包括查找(find),最小值(minimum),最大值(maximum),后继(successor),前驱(predecessor),插入(insert),删除(delete),以及中序遍历等。
基本排序算法,包括冒泡排序,插入排序,选择排序,堆排序,快速排序等。 【冒泡排序】 复杂度是n*n #coding:utf8 #author:HaxtraZ #description:冒泡排序 def bubblesort1(a): #每次找到一个最小元素,放到数...
MIT6.006是算法导论课,Lec03主要讲插入排序,归并排序,以及分析方法(递归树)等。 插入排序,可以分为线性插入排序、二分插入排序,区别在于当把数组中某元素插入到前面的有序列表中时,前者遍历,后者二分,后者更加稳定。
MIT6.006是算法导论,Lec02讲的是Document Distance(文档距离),比如比较两个文档相似度或者搜索引擎中都会用到。 计算步骤为: 1.将每个文档分离为单词 2.统计词频 3.计算点积(并做除法) 说明: 1.“单词”指的是字母和数字(alphanumeric) 2.每个文档统计完词频后得到的list,可看作一个向量 3.两个文档间的相似度,是相似的单词除以总的单词,类似于两个向量的夹角公式 MIT6.006下载的相关资源中,给出了8个逐渐改善的代码版本,但本质都是一样的。