计算机科学与技术硕士,专注计算机视觉(目标检测、深度学习),关注Linux环境下各算法配置。
修改图片格式 matlab代码 其实内部一些代码是用了rbg的fast-rcnn代码的。 \datasets\VOCdevkit2007\VOCcode\VOCinit.m里面,查找'jpg',改成'png' 以及,\imdb\imdb_from_voc.
有时候需要集中处理数字,比如处理图片,并将它们编号为000001~009963 而matlab用fprintf输出时这些数字编号时,需要指定格式: %.nd n表示n位长度。%d表示10进制数字 e.g. for i=1:9963 fprintf('%.6d\n', i); end
@tags "visual studio 2013" nuget vs2013中用nuget想必是一件很爽的事情,就像java里面用maven来安装各种包一样。有时候网络不好,nuget包下载和查找都出不来结果,那就配置代理吧。
@tags caffe 训练 是在windows平台上。 主要是使用/caffe.exe,配合动作参数train,以及指定solver文件。e.g.: cd %caffe_root% %caffe_build%\caffe.
@tags: caffe blob blob是caffe中的基本数据结构,简单理解就是一个“4维数组”。但是,这个4维数组有什么意义? BTW,TensorFlow这款google出的框架,带出了tensor(张量)的概念。
@tags caffe 概念 一个epoch表示“大层面上的一次迭代”,也就是指,(假定是训练阶段)处理完所有训练图片,叫一个epoch 但是每次训练图片可能特别多,内存/显存塞不下,那么每个epoch内,将图片分成一小堆一小堆的,每一小堆图片数量相等,每一小堆就是一个batch(批次)。
@tags caffe 照例还是转写为python脚本: import os caffe_root=os.environ['caffe_root'] caffe_build=os.environ['caffe_build'] cmd1=caffe_build+"\\caffe.
@tags caffe python windows下配置caffe后,create_cifar10.sh无法执行,因为是shell脚本。那就看懂脚本意思,用python重写一个: # create_cifar10.
@tags: caffe 文件类别 solver文件 是一堆超参数,比如迭代次数,是否用GPU,多少次迭代暂存一次训练所得参数,动量项,权重衰减(即正则化参数),基本的learning rate,多少次迭代打印一次loss,以及网络结构描述文件(即model文件)存储位置,等等 比如: lenet_solver.prototxt model文件 也有一些参数,指定了深度卷积网的结构,包括每一层各个参数,以及训练输入的数据存放位置等。
@tags caffe 前面根据train_lenet.sh改写了train_lenet.py后,在根目录下执行它,得到一系列输出,内容如下: I1013 10:05:16.721294 1684 caffe.
@tags: caffe python 在windows下配置caffe后,跑mnist手写数字识别的例子。发现train_lenet.sh不能运行。 那就写个python脚本替代吧。 step1 定义两个环境变量,请自行添加并替换成你的目录: caffe_build D:\lib\caffe-ma...
@tags caffe 网络结构 可视化 当拿到一份网络定义文件net.prototxt,可以用工具画出网络结构。最快速的方法是使用在线工具netscope,粘贴内容后shift+回车就可以看结果了。 caffe也自带了网络结构绘制工具,需要稍微配置下,并确保你用的caffe版本中实现了网络中涉及到的层。
@tags caffe 在windows下使用caffe时,如果先前没有啥经验,会考虑按照官方文档中的例子跑一跑。比如mnist手写数字识别。 然后就会遇到这个问题:windows下怎么执行/examples/mnist/create_mnist.sh呢? 当然,你需要先编译了convert_mnist_data子项目,以及下载了mnist数据集。
@tags: caffe 机器学习 在机器学习(暂时限定有监督学习)中,常见的算法大都可以划分为两个部分来理解它 一个是它的Hypothesis function,也就是你用一个函数f,来拟合任意一个输入x,让预测值t(t=f(x))来拟合真实值y 另一个是它的cost function,也就是你用一个函数E,来表示样本总体的误差。
@tag: caffe windows10上配置好caffe后(配置了matlab接口),运行caffe-master/matlab/demo/classification_demo.m报错,提示: 未定义函数或变量caffe_ 问题解决: I resolved the issue using ...
@tags: caffe 问题出现在,windows下编译caffe的过程中。按照github.com/microsoft/caffe的readme配置的。 问题原因是,用的matlab版本较新(2016a),mxGPUArray.h换位置了。
RPCL是在线kmeans的改进版,相当于半自动的选取出k个簇心:一开始设定N个簇心,N>k,然后聚类。每次迭代中把第二近的簇心甩开一段距离。 所谓在线kmeans是就是,每次仅仅用一个样本来更新簇心位置,而不是用全部数据(“批量”)。
latex是纯学术风格,写paper写书用 markdown是程序员风格,写笔记贴代码片段用 简单说,latex适合长篇、精致,比如数学公式、图片位置调整、表格样式调整。而markdown就是粗线条,简易编辑
以最常见的一个用法为例: [X,Y]=meshgrid(xgv, ygv) xgv是一个(一维的,行)向量,ygv也是。 产生的X和Y,规格相同,都是二维向量,高度为size(ygv,2),宽度为size(xgv,2)。
dede的cms通常是,dede作为后台,前台可以自己换一套模版(后台貌似也跟着换掉,或者不换) 安装时候会检查目录读写权限,以及数据库配置 安装后,还需要登录到后台: 配置网站根网址 清除缓存 数据恢复
引入 作为练手,不妨用matlab实现K-means 要解决的问题:n个D维数据进行聚类(无监督),找到合适的簇心。 这里仅考虑最简单的情况,数据维度D=2,预先知道簇心数目K(K=4) 理论步骤 关键步骤: (1)根据K个簇心(clusters,下标从1到K),确定每个样本数据Di(D为所有数据整体,Di为某个数据,i=1...n)所属簇,即欧氏距离最近的那个。
1. 某目录下临时开web服务器 cd some_dir python -m SimpleHTTPServer 9090 9090手动指定的端口,然后使用http://localhost:9090来访问。
转自http://www.cnblogs.com/xiongjiaji/archive/2011/06/22/2476490.html C++标准库的所有头文件都没有扩展名。C++标准库的内容总共在50个标准头文件中定义,其中18个提供了C库的功能。
转自http://blog.chinaunix.net/uid-27105712-id-3349522.html 在linux下,关于文件权限,大部分人接触比较多,也比较熟悉了解.但是对进程权限一般知之甚少。
初次了解JWT,很基础,高手勿喷。 基于Token的身份验证用来替代传统的cookie+session身份验证方法中的session。 JWT是啥? JWT就是一个字符串,经过加密处理与校验处理的字符串,形式为: A.B.C A由JWT头部信息header加密得到 B由JWT用到的身份验证信息json数据加密得到 C由A和B加密得到,是校验部分 怎样生成A? header格式为: { "typ": "JWT", "alg": "HS256" } 它就是一个json串,两个字段是必须的,不能多也不能少。
一个web项目 用了bootstrap chrome开f12报错提示glyphicon halflings regular ttf找不到 为什么找不到,肯定又是path出了问题 找到bootstrap.css 找到glyphicon的引用路径,是相对路径,改掉,KO
AngularJS的问题 为什么你不该用angularjs,https://medium.com/@mnemon1ck/why-you-should-not-use-angularjs-1df5ddf6fc99#.9yg505ar3 1.数据双向绑定问题 angular的方式:视图变化->模型变化->触发事件处理函数 合理的方式:视图变化->触发事件处理函数 问题所在: 1.事件监听不自然。
今天学RESTful API的编写,发现不知道怎么发送HTTP PUT/PATCH/DELETE请求,还是要学习一个。 使用curl_opt函数来发送各式各样的http请求动作,不仅限于get和post。
1.换源 http://mirrors.zju.edu.cnhttp://mirrors.aliyun.comhttp://mirrors.ustc.edu.cn ubuntu替换/etc/apt/sources.
首先去装Relteck的驱动,windows64位的下载地址是: http://12244.wpc.azureedge.net/8012244/drivers/rtdrivers/pc/audio/0006-64bit_Win7_Win8_Win81_Win10_R279.
用的是anaconda2,也就是python在windows下的最好的一键安装包,有numpy scipy matplotlib等常用包预装好了 最近搞caffe的python接口,需要装protobuf的python接口 pip install protobuf 结果卡死在100%。
上传vmall5源码到服务器后访问ebak目录,发现网页不显示。用xshell登录到服务器手动执行ebak/index.php查看输出,发现这样一个错误: PHP Parse Error: syntax error, unexpected $end ,blablabla... 这是因为php没有开启短标签。
用boosting构建简单的目标分类器 原文 boosting提供了一个简单的框架,用来构建鲁棒性的目标检测算法。这里提供了必要的函数来实现它:100% MATLAB实现,作为教学工具希望让它简单易得。
ubuntu15.04, matlab2016a 默认按键ctrl+s无法保存,ctrl+z无法撤销。因为用的是emacs的快捷键。emacs的快捷键不熟悉会觉得很复杂,果断改为windows风格的: 打开matlab --> file --> preferences --> Keyboard --> Shortcuts --> Keyboard Shortcuts Preferences --> Active settings: 默认的是Emacs Default set, 点击右边向下的箭头,选择 Windows Default Set 然后save as 点Ok,就可以了。
服务器centos,其他数据库都是utf8都正常能用 网页正常显示 这次导入一个utf8格式数据库文件 结果网页上乱码 在导出的sql文件中,注释部分有些语句也是被mysql考虑的。导出的sql文件,在服务器上导入后,文件本身是utf8但是还是乱码,此时检查sql文件首部是否有: /!40101 S...
PHOG特征 2016年7月13日 21:07:57 什么是PHOG PHOG是Pyramid HOG(pyramid histogram of oriented gradient)的简称,是在图像尺寸固定的情况下,计算不同尺度下的特征(这一点有点绕,是指要计算HOG特征的区块的划分尺度在变化),将这些特征进行拼接得到PHOG特征,在论文[1,2]中被提出和使用,用来做图像分类。
图像卷积、相关以及在MATLAB中的操作 2016年7月11日 20:34:35, By ChrisZZ 区分卷积和相关 图像处理中常常需要用一个滤波器做空间滤波操作。空间滤波操作有时候也被叫做卷积滤波,或者干脆叫卷积(离散的卷积,不是微积分里连续的卷积);滤波器也有很多名字:卷积模版、卷积核、掩模、窗口等。
%%matlab实现hog特征 %修改自http://www.cnblogs.com/tiandsp/archive/2013/05/24/3097503.html %input: img %output: final_descriptor clear all; close all; clc; %img=double(imread('lena.jpg')); %img=imread('man.png'); img=imread('e:/work/matlab/data/252.jpg'); img=rgb2gray(img); %简单起见,彩图转灰度图。
我一向是不屑于在windows下用latex的,看起来不伦不类,是geek就不要用windows,图方便就用word而不是latex。但是台式机上的fedora无法上网,那就委屈一下在windows10上装个CTex吧。
wget --no-clobber --convert-links --random-wait -r -p -E -e robots=off -U mozilla http://www.cv-foundation.org/openaccess/CVPR2016.py 作者:匿名用户 链接:https://www.zhihu.com/question/47385572/answer/108519485 来源:知乎 著作权归作者所有。
Matlab的实时编辑器(Live Script) 看到伟哥换用了matlab2016a,里面集成了acf行人检测算法,感觉挺好的,索性也从matlab2014a跨越到matlab2016a。 安装后打开某个脚本代码文件,提示说可以作为live script(实时脚本)运行。
dpm-release3.1在windows下的配置 dpm是做目标检测objecjt detection的经典方法。dpm系列代码默认是在linux和mac下运行测试过的,windows下默认是不能正常运行的。
这次热身是一个会员管理系统,包括会员注册、登录、资料修改功能,使用ajax技术 1.建表 use common_module; create table if not exists member( user_id int auto_increment primary key, email varch...
0.环境说明 win10 xampp phpstorm xampp带了apache和mysql以及phpmyadmin 1.配置mysql:修改默认编码 关mysql xampp/mysql/bin/my.
Android热身:通过网络获取资源并更新UI组件 目标 点击“发送请求”按钮,下载某网页的html源码,并显示在TextView控件上;点击“清空”,清除TextView控件上的内容 效果图: 要点 开启网络权限 网络请求独立为一个模块 按钮点击事件的监听器 新开线程进行网络请求调用 用handler更新UI组件 源码 //MainActivity.
在一个晚上, 我的母亲问我, 今天怎么不开心。 我说在我的想象中, 有一个程序员, 一晚上码字千行效率肯定棒, 整个github找遍所有的repo都没有 她说将来会找到的 时间会给我答案 星期天我再次寻找依然没有发现 一个月后我去了第二个网站 这里的人们称它为百度文库 时间过的很快网页还没打开 我想...
统计图片中细胞的数量,问题来自于matlab自带的example。 Blob Analysis是对图像中相同灰度值的前景像素进行识别的一种方法。Blob就是灰度值相同的前景像素构成的连通域。Blob分析可为机器视觉应用提供图像中的blobs的数量、位置、形状和方向等信息,还可以提供相关blobs间的几何拓扑结构。
这是matlab自带的一个例程。 问题描述:光纤横截面包括core和cladding两部分,也就是“中心圆”和“漆包线” 希望两者是同心圆,或者说,希望两者圆心差的不要太离谱原理:先将图像转换为二值图像,得到只有漆包线(圆环)是黑色、其他都是白色的图像 根据漆包线区域计算出图像重心 根据重心得到cladding边界上一个点,进而得到整个边界上的点集 由边界点击得到圆心。
转战matlab了。步骤说一下: 目标图obj 含目标的场景图scene 载入图像 分别检测SURF特征点 分别提取SURF描述子,即特征向量 用两个特征相互匹配 利用匹配结果计算两者之间的transform关系tform 根据obj位置与变换关系tform,在scene图上框出obj 代码,来...
ubuntu日常使用指南 安装软件包/编译常见软件包 有些包用apt去装就可以了,或许需要添加ppa源;有些包则版本太老,需要从源码编译安装。 查找包 aptitude search pkgName pkgName可以有多个(空格分隔) ffmpeg sudo add-apt-repository ...