
模式识别
文章平均质量分 65
小林叔叔
这个作者很懒,什么都没留下…
展开
-
tesseract训练中文备忘录
最新用OCR识别身份证,用的tesseract引擎。但是google自带的中文库是在太慢了,尤其是对于性别、民族这样结果可以穷举的特征信息而言,完全可以自己训练字库。在训练过程中,常见的error有以下几种:1)index >= 0 && index<size_used_:Error:Assert failed in genericvector.h, line 512原因:原创 2015-08-19 23:03:29 · 1505 阅读 · 0 评论 -
在Mac下配置Caffe笔记
Step1:安装homebrew如果电脑上有,暂时不装。但是在step2(或者其他需要brew的情况)加完sudo之后如果仍然报错,就需要重新安装homebrew。在终端里输入如下命令:ruby -e “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/intall)” 即可安装。(参考网址:h原创 2015-09-17 09:29:25 · 2125 阅读 · 1 评论 -
opencv训练分类器(HAAR,LBP等特征)
Step1:准备训练样本训练样本的准备包括正样本和负样本。正样本就是你要检测的物体图片,比如身份证识别中的国徽。负样本原则上是国徽以外的任何物体都行,这是网上教程所说的,但是实际上,负样本是每一级级联分类器自身调参优化的依据。也就是说,单级分类器的目的是寻找一组参数,让所有的正样本都通过该级分类器,只让少数不可区分开的负样本通过,到下一级分类器的时候再增加特征数目以寻求把所有负样本都kil原创 2015-09-19 22:48:00 · 7839 阅读 · 0 评论 -
ROC曲线详解
ROC曲线指受试者工作特征曲线 / 接收器操作特性曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在ROC曲线上,最靠近转载 2016-08-01 10:00:16 · 30065 阅读 · 2 评论 -
AUC计算
1. 最直观的,根据AUC这个名称,我们知道,计算出ROC曲线下面的面积,就是AUC的值。事实上,这也是在早期 Machine Learning文献中常见的AUC计算方法。由于我们的测试样本是有限的。我们得到的AUC曲线必然是一个阶梯状的。因此,计算的AUC也就是这些阶梯 下面的面积之和。这样,我们先把score排序(假设score越大,此样本属于正类的概率越大),然后一边扫描就可以得到我们想要转载 2016-08-01 10:11:35 · 1235 阅读 · 0 评论 -
数据挖掘的一些评价标准
在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall) =转载 2016-08-05 15:33:32 · 2823 阅读 · 0 评论