- 博客(55)
- 收藏
- 关注
原创 Trecvid2014随感
1. 竞赛的Workshop还是很有意思,相比暑假参加的ICME这种盛会,小会议的内容会比较集中,大家都是做这个数据集的,不像盛会,一个session里面论文的话题变化太大。另外看到同领域大佬的机会也更大了,能有机会和他们说上一两句话也挺有意思的。同理,大家都觉得ICMR是很著名的会议,称是ACM打造的除MM外Multimedia的第二顶会。
2014-11-18 13:07:22
3332
1
原创 SIFT vs Dense-SIFT
有个博友问SIFT和Dense-SIFT在应用上的区别。这个问题可以放大到Sparse feature和Dense feature的使用场景上。之前自己也考虑过这个问题,今天不妨写出来。
2014-10-16 20:53:44
16533
2
转载 Managing Your Advisor -- Creativity and grad school survival advice from Professor Nick Feamster
With the new academic term almost upon us, several of my students started to put together a list of practical advice for incoming students—including various niceties such as how to gain access to the
2014-08-17 21:37:09
2265
原创 一般物体检测--Binarized Normed Gradients for Objectness Estimation at 300fps
前一段时间很多人在网上传程明明在CVPR14年上即将发表的Objectness文章,Project Page在这里,和这里。最近,正好想用一般物体检测做点事情,上周也在实验室做了一个这个方面的报告,今天打算在博客上总结一下。
2014-04-06 14:34:58
16599
18
转载 机器学习是什么
不久以前读的一篇好文,主要是讲机器学习到底是属于什么学科或者研究领域,同时也介绍到了ML与AI之间的关系。作者是南京大学的周志华老师。废话少说,直接上文章。------------------------------------------------------- 机器学习现在是一大热门,研究的人特多,越来越多的新人涌进来。 不少人其实并没
2014-01-22 10:48:02
4637
原创 BOW模型在ANN框架下的解释
Bag of words模型在图像分类和检索的相关问题中,能够将一系列数目不定的局部特征聚合为一个固定长度的特征矢量,从而使不同图像之间能够进行直接比较。然而,BOW往往作为一种编码方式被解释着(SIFT作为coding,BOW作为average pooling),在这里,我会从一个近似最近邻(approximate nearest neighbor)的角度解释一下BOW。
2013-12-25 00:05:44
8237
转载 图˙谱˙马尔可夫过程˙聚类结构----by林达华
这又是林达华的一篇好文,将四个概念在某个方面解释的很清楚,特别是特征值和特征向量的意义,让人豁然开朗。 原文已经找不到了,好像是因为林达华原来的live博客已经失效,能找到的只有网上转载的文章(本来还想把他的博客看个遍)。林本人的数学功底之强,有时候会让我们这些搞CV、ML的人趁还在学校,重头把一些数学学一遍。不过想想学校所开设的课程实在是屎(老师和学生们都是混),也就想想罢了
2013-10-08 10:03:13
8975
转载 如何评价吴军《浪潮之巅》?来自反面的声音
原文来自 http://shibeichen.com/post/20010616910还有来自知乎的各种声音:http://www.zhihu.com/question/20612417至少在我阅读这本书的时候,将书中大部分陈述当做事实来看待,对于作者在文中阐释的一些态度,确实很多不能认同(有的时候会认为自己才疏浅薄,不能正确理解,现在看到一些同样观点后发现大可不必这样)。另一方面,抛
2013-10-06 22:48:36
7006
2
转载 计算机视觉、机器学习相关领域论文和源代码大集合
原文转自:http://blog.csdn.net/zouxy09/article/details/8550952原作者是zouxy09,之前已经转载了他的好几篇文章了,比如LBP、HOG。这次转载是在寻找unsupervised image segmentation的方法及源代码的时候搜寻到了这里,找到了Efficient Graph-based Image Segmentation 的
2013-09-09 10:49:29
6531
原创 matlab的double和single类型
看到博客(这里)中说,在matlab中, 当数据比较大时,运算起来就困难了,有时候还会out of memory。原因是默认情况下matlab用double存储数据。而double数据类型占8个字节,single类型占4个字节。把数据类型从double类型转换成single类型可以节省一半的空间。(如果怀疑可以用whos指令查看)。本来很有道理的,但是看到有人说(比如这里):The forma
2013-09-04 17:31:23
111157
5
转载 Computer Vision的尴尬---by林达华
Computer Vision是AI的一个非常活跃的领域,每年大会小会不断,发表的文章数以千计(单是CVPR每年就录取300多,各种二流会议每年的文章更可谓不计其数),新模型新算法新应用层出不穷。可是,浮华背后,根基何在?对于Vision,虽无大成,但涉猎数年,也有管窥之见。Vision所探索的是一个非常复杂的世界,对于这样的世界如何建模,如何分析,却一直没有受普遍承认的理论体系。大部分的
2013-08-26 17:37:04
5714
转载 内核线程、轻量级进程、用户线程
转载:http://www.cnitblog.com/tarius.wu/articles/2277.html转载:http://www.fansoo.com/blog/2011/kernel-threads-lightweight-processes-threads-and-linuxthreads-library-users/内核线程内核线程只运行在内核态,不受用户态上下文的拖
2013-08-22 19:27:24
2836
原创 特征选择和特征学习中的过完备
ScSPM的论文中提到了码书的过完备(over-complete)。一开始没有太在意过完备有什么问题,今天想了想把这个概念弄明白了。
2013-08-14 19:39:47
8279
翻译 理解sparse coding
本文的内容主要来自余凯老师在CVPR2012上给的Tutorial。前面在总结ScSPM和LLC的时候,引用了很多Tutorial上的图片。其实这个Tutorial感觉写的挺好的,所以这次把它大致用自己的语言描述一下。不过稀疏编码是前两年比较火的东西,现在火的是deep learning了。1、What is sparse coding? 稀疏编码的提出,最早是用于解释人脑的视
2013-08-11 19:54:02
41237
4
原创 图像的稀疏表示——ScSPM和LLC的总结
上一篇提到了SPM。这篇博客打算把ScSPM和LLC一起总结了。ScSPM和LLC其实都是对SPM的改进。这些技术,都是对特征的描述。它们既没有创造出新的特征(都是提取SIFT,HOG, RGB-histogram et al),也没有用新的分类器(也都用SVM用于最后的image classification),重点都在于如何由SIFT、HOG形成图像的特征(见图1)。从BOW,到BOW+SPM
2013-08-09 09:52:05
30219
6
转载 Li Fei-fei写给她学生的一封信,如何做好研究以及写好PAPER
在微博上看到的,读完还是有些收获的,首先是端正做research的态度。我是从这里看到的:http://www.vjianke.com/ZM0BC.clip ---------------------------------------以下是原文--------------------------------------------- De-mystifying Good Re
2013-07-18 18:21:35
6372
1
原创 迁移学习的相关概念
之前谈到了迁移学习和自我学习(可以看这里),今天会系统整理一下与迁移学习相互关联的几个概念。 迁移学习的目标是将从一个环境中学到的知识用来帮助新环境中的学习任务。用一句不正式的语言来定义,则是说,当教会了d电脑学习区分大象和犀牛的能力后,电脑利用这一本领更快或更准确地来学习如何区分飞机和鸟。因为人具有知识迁移的能力(所谓温故而知新),当我们学会了一项本领后,再去学习另外一项相关的
2013-07-08 22:34:21
6871
1
原创 LSA,pLSI,LDA相关的资料整理
1、 《LSA and PLSA笔记》 将LSA和pLSI的优点和缺点进行了总结和比较,是目前看到的非常好的资料;2、 Zhou Li的博客,尤其是LSA和LDA的两篇note,不仅详细介绍了模型和求解过程、相关的背景知识,同时还有实验结果和代码;3、 《PLSA中的EM算法 》,仅仅是介绍pLSI,不过文档中又贴了其他reference,包括我看的一份Liangjie
2013-06-24 22:23:14
5265
转载 百度图像搜索探秘
本文转自:http://blog.sina.com.cn/s/blog_6ae183910101gily.html---------------------------------------------------------------昨天,百度上线了新的相似图(similar image search)搜索,试了风景、人物、文字等不同类型query的效果,感觉效果非常赞。尤其对于
2013-06-10 19:22:45
4879
翻译 如何评价一个好的推荐系统算法
Netflix 在网上举办了一个挑战赛,奖励100万美元向全世界选手提出一套电影的推荐系统,RMSE比当前系统小10%的最优秀的那支队伍将获得该奖项。 但是如何评价一个更好的推荐系统?What do we mean by better? 在Netflix Prize, 对系统的性能评价使用了用户对电影的实际评分与推荐系统对每部电影预测评分之间的RMSE。如果说我
2013-05-20 13:32:57
6923
原创 降维(二)----Laplacian Eigenmaps
降维系列:降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps--------------------- 前一篇文章中介绍了主成分分析。PCA的降维原则是最小化投影损失,或者是最大化保留投影后数据的方差。在谈到其缺点的时候,我们说这一目标并不一定有助于数据的分类,换句话说,原本在高维空间中属
2013-05-18 21:05:25
26974
1
原创 降维(一)----说说主成分分析(PCA)的源头
降维系列:降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps--------------------- 主成分分析(PCA) 在很多教程中做了介绍,但是为何通过协方差矩阵的特征值分解能够得到数据的主成分?协方差矩阵和特征值为何如此神奇,我却一直没弄清。今天终于把整个过程整理出来,方便自己学习,也和大家交流。
2013-05-16 19:21:00
24616
11
转载 Dirichlet Process 和 Hierarchical Dirichlet Process
最近在看Dirichlet分布以及Dirichlet过程,因为最近感觉Dirichlet过程在聚类以及一些贝叶斯模型上使用很多。参考了很多资料,其中这篇博客介绍HDP算是比较清楚的了,原文链接是 http://hi.baidu.com/zentopus/item/46a622f5ef13e4c5a835a28e另外关于Dirichlet Process还有以下文献可以参考:1. h
2013-05-12 15:41:52
6556
转载 局部特征(6)——局部特征描述汇总
局部特征系列:局部特征(1)——入门篇局部特征(2)——Harris角点 局部特征(3)——SURF特征总结 局部特征(4)——SIFT和SURF的比较 局部特征(5)——如何利用彩色信息 Color Descriptors 局部特征(6)——局部特征描述汇总 --------------------------------------
2013-05-10 10:54:48
12050
原创 迁移学习&自我学习
最近在看Ng的深度学习教程,看到self-taught learning的时候,对一些概念感到很陌生。作为还清技术债的一个环节,用半个下午的时间简单搜了下几个名词,以后如果会用到的话再深入去看。 监督学习在前一篇博客中讨论过了,这里主要介绍下迁移学习、自我学习。因为监督学习需要大量训练样本为前提,同时对训练样本的要求特别严格,要求训练样本与测试样本来自于同一分布。要是满足不了这要
2013-05-08 17:52:20
13044
转载 LBP特征
zouxy09@qq.com LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen, 和 D. Harwood 在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹理特征; 1、LBP特征的描述
2013-05-07 20:47:04
3735
1
转载 HOG特征
HOG特征zouxy09@qq.com1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+S
2013-04-26 20:58:06
13087
原创 机器学习的数学基础(1)--Dirichlet分布
这一系列(机器学习的数学基础)主要包括目前学习过程中回过头复习的基础数学知识的总结。基础知识:conjugate priors共轭先验 共轭先验是指这样一种概率密度:它使得后验概率的密度函数与先验概率的密度函数具有相同的函数形式。它极大地简化了贝叶斯分析。 如何解释这句话。由于 P(u|D) = p(D|u)p(u)/p(D) (1.0式) 其中D是
2013-04-23 21:52:26
40093
2
原创 Linux的IO系统常用系统调用及分析
Linux的IO从广义上来说包括很多类,从狭义上来说只是讲磁盘的IO。在本文中我也就只是主要介绍磁盘的IO。在这里我对Linux的磁盘IO的常用系统调用进行深入一些的分析,希望在大家在磁盘IO产生瓶颈的时候,能够帮助做优化,同时我也是对之前的一篇博文作总结。转载此文请标明出处:http://blog.csdn.net/jiang1st2010/article/details/8373063
2012-12-22 14:23:51
8978
原创 表驱动编程方法 table-driven programming
最近写了一段这样的代码。代码的功能是,通过函数function()返回的错误代码,生成一段说明该代码错误的log。 最开始我的代码是这样写的:enum error_t{ERROR0=0,ERROR1,ERROR2,ERROR3};error_t function(){ //......}int main(){ er
2012-12-19 17:54:01
4721
1
原创 利用swig实现python调用C/C++的方法
Python是一门语法简单而且清晰的脚本语言,不过执行效率比较低。简单的说就是开发相对C/C++容易,但是执行效率不如C/C++,甚至有人称之为执行效率最低的鱼眼。如果可以将最重要的而且变化一般不大的运算逻辑用 C/C++实现,其他用python书写,那就最好不过了。据说python底层就是用C实现的,因此这一想法也是可行的。目前来说,python调用C/C++有以下几种方法:1) 利用py
2012-12-12 17:00:23
8099
原创 数据库索引原理(2)------MemCached
Memcached是高性能的分布式内存缓存服务器。它的主要目的不是基于本地缓存的,而主要用在分布式系统中。Memcached中保存的数据都存储在Memcached内置的内存存储空间中。由于数据仅存在于内存中,因此重启Memcached、重启操作系统会导致全部数据消失。Memcached是记录级的缓存,之前调研报告里提到过与MySQL、Server等页级缓存会缓存无效数据的,记录级的缓存则使内存利用
2012-10-28 17:12:55
4187
1
原创 数据库索引原理(1)-----TokuDB中的COLA-Tree
目前无论是商业的SQL Server,还是开源的MySQL,都基本上还在用比较老的B+Tree(SQL Server用的是标准的B-Tree)的索引结构。从原理来说,B系列树在查询过程中应该是不会慢的,而主要问题就是出现在插入。B-Tree在插入的时候,如果是最后一个node,那么速度非常快,因为是顺序写。但如果数据插入比较无序的时候,比如先插入5然后10000然后3然后800这样跨度很大的数
2012-08-23 19:43:54
8609
原创 从fread和mmap谈C++读文件的性能
(关于Linux读文件的更深入理解,猛戳这里吧) 在进行大规模数据处理时,读文件很有可能成为速度瓶颈。不管你的CPU有4个核还是8个核,主频有2G还是3G,硬盘IO速度总是有个上限的。在本人最近的一次经历中,对一个11G的文本进行数据处理,一共耗时34.8秒,其中竟然有30.2秒用在访问IO上,占了所有时间的87%左右。 虽然说硬盘IO是有上限的,那么C++
2012-07-27 14:37:39
17323
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人