
机器学习算法
文章平均质量分 82
coder_oyang
墓志铭
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
梯度下降法-gradient descent --实例解析
写作目的:发现很多机器学习算法中,多少涉及到迭代求解无约束函数的最值;然而,梯度下降法是求解无约束最优化问题的一种常用算法。其流程为:选初始值,求梯度,迭代原创 2015-06-18 11:46:40 · 18916 阅读 · 4 评论 -
数据分析领域中最为人称道的七种降维方法
七种降维方法原创 2017-01-19 16:44:06 · 1214 阅读 · 0 评论 -
自然语言理解的简单梳理
自然语言理解,口语理解简介原创 2017-08-17 18:03:16 · 640 阅读 · 0 评论 -
Ubuntu 安装 pylucene 踩坑还原记,并安装 SmartChineseAnalyzer
Ubuntu 安装 pylucene , SmartChineseAnalyze原创 2017-08-04 16:30:43 · 2389 阅读 · 1 评论 -
用于时序数列预测的 Elman神经网络
时序数列预测算法 ARIMA 以及 ELman Neural Network , tensorflow TFTS原创 2016-09-09 16:15:57 · 13769 阅读 · 3 评论 -
python+multiprocess+theano+pylucene--内存泄露解决方案
Python pylucene Theano 多线程问题原创 2017-12-12 15:34:36 · 2508 阅读 · 2 评论 -
Active Learning 原理
通过 Active Learning 方式挑选需标注样本原创 2017-11-24 11:22:21 · 2183 阅读 · 0 评论 -
格灵深瞳面试--我和Yoshua Bengio的距离
格灵深瞳面试--我和Yoshua Bengio有约原创 2015-08-25 20:03:36 · 6030 阅读 · 1 评论 -
Ubuntu16或者Ubuntu14 配置NVIDIA、CUDA以及CUDNN
Ubuntu下配置GPU深度学习环境-Ubuntu16以及Ubuntu14均有效原创 2017-02-17 11:40:21 · 1472 阅读 · 0 评论 -
一些概念总结
特征选择 基本思路是根据某个评价指标独立的对原始特征项(词项)进行评分排序,从中选择得分最高的一些特征项,过滤掉其余的特征项。常用的评价有文档频率、互信息、信息增益、χ²统计量等。手段包括:正则化(L1,L2)方法,回归模型(根据各属性权重)、决策树(根据距离跟结点距离)、随机森林(平均不纯度减少,平均精确度减少)分层抽样 机器学习模型训练过程中,通过分层抽样将样本集划分为训练集、测...原创 2018-01-22 15:29:04 · 361 阅读 · 0 评论 -
智能交互框架总结
深度学习固然热络,但在垂直领域,我还是推崇规则匹配,垂直领域的正常问答中,不会超过10000条语句,那么规则其实能很好cover,准确率甚至能高达90%,累积了大数据,深度学习在这个时候就能很好提升模型精度,下面是对智能交互的总结。 智能交互总体框架下面着重总结下自然语言理解(NLU)部分:1. NLU分原创 2018-02-03 16:06:47 · 1269 阅读 · 0 评论 -
白话Word2vec—Word2vec算法简介
勘误:第二幅图从根结点开始的第四层叶节点,从左往右的最后一个叶结点下的汉字应该为 刘德华原创 2018-03-13 15:36:25 · 1229 阅读 · 0 评论 -
概率图模型 -- 隐马尔可夫模型、条件随机场
本文从建模角度出发,通过概率图模型分析隐马尔可夫,条件随机场,文章重点在模型建立理论基础原创 2018-07-12 21:05:49 · 5045 阅读 · 0 评论 -
hadoop 简单入门与streaming常用配置参数说明
1. Hadoop包含两核心部分hdfs Hadoop distribute file system -- hadoop分布式文件系统,存储数据 Namenode、Datanode 常用命令形式:hadoop fs -ls / hadoop fs -mkdir MapReduce 分而治之;map:实现分治;reduce:实现合并 解决数据可分割的计算问题 编程接...原创 2018-10-11 17:33:51 · 1225 阅读 · 0 评论 -
NLP资料汇总
NLP好去处原创 2017-01-20 12:38:06 · 438 阅读 · 0 评论 -
应对非均衡数据集分类问题的八大策略
应对非均衡数据集分类问题的八大策略翻译 2015-08-26 20:34:14 · 9073 阅读 · 0 评论 -
拉格朗日对偶性的一些总结
拉格朗日对偶性写作目的拉格朗日乘子算法对偶问题写作目的前一篇文章总结的关于无约束优化的极值求解问题是: 梯度下降法-gradient descent –实例解析 。但类似于最大熵模型(Maximum Entropy Model),或者支持向量机(Support Vector Machines),这些有约束优化问题要求解怎么办呢?这就是本文的目的。拉格朗日乘子算法原始问题假设原创 2015-06-19 20:35:17 · 1370 阅读 · 0 评论 -
SVM的一些总结与认识-入门级
支持向量机的一些总结,一整套的推导,浅显易懂,适合入门原创 2015-07-17 20:31:45 · 2031 阅读 · 0 评论 -
SVM 多分类 -SVM分类opencv3.0源代码
SVM多分类的一些笔记,以及在OpenCV3.0上的SVM分类代码原创 2015-08-05 19:52:28 · 8057 阅读 · 6 评论 -
美团2016面试总结
面试总结原创 2015-09-27 14:49:28 · 1457 阅读 · 4 评论 -
PCA 浅显易懂的数学原理
PCA总结,适合入门参考原创 2015-09-16 10:51:32 · 872 阅读 · 0 评论 -
统计URL出现的频次
百度2015校园招聘机器学习笔试题中关于hashmap的使用情况原创 2015-09-17 13:25:06 · 2687 阅读 · 0 评论 -
关于乔姆斯基和统计学习的两种文化(编译)
转载原创 2015-11-18 15:44:14 · 501 阅读 · 0 评论 -
SVM - multi label
SVM multi label原创 2016-05-04 16:14:43 · 1550 阅读 · 0 评论 -
文本分类随笔
随笔原创 2016-04-07 14:56:27 · 604 阅读 · 0 评论 -
Bag of Tricks for Efficient Text Classification
Facebook NLP 大牛Tomas Mikolov的又一力作 Bag of Tricks for Efficient Text Classification ,号称提出了区别于Word2vec的一种简单而高效的文本分类和特征学习方法。原文链接自行Google之,下面是机器之心的翻译链接 Bag of Tricks for Efficient Text Classification 觉原创 2016-08-02 14:43:24 · 2970 阅读 · 0 评论 -
机器学习分类结果评判标准-混淆矩阵&ROC曲线
因为在实际中常常遇到失衡数据集的分类问题,在我的译文应对非均衡数据集分类问题的八大策略中,其中一种策略就是改变衡量模型性能的计算方式,那么怎么衡量模型分类性能呢?有ROC曲线,有混淆矩阵,有对应的实例ROC曲线,横轴假阳性(样本为负,预测为正),纵轴真阳性(样本为正,预测为正),在每个可能的分类阈值下统计假阳性、真阳性,阈值越大曲线接近(0,0)点,阈值越小曲线趋近(1,1)点;通过AUC...原创 2016-09-27 17:25:46 · 3171 阅读 · 0 评论 -
win7-64bit下安装Scipy
搭建Scipy+Python3.4+PyCharm 的时候,出现问题 -- no lapack/blas resources found 的解决方案原创 2016-04-20 14:01:25 · 1291 阅读 · 0 评论 -
从神经网络的角度理解线性回归与逻辑斯谛回归(from Linear regression to logistic regression)
自己的一些关于线性回归与逻辑斯谛回归的想法原创 2015-08-06 11:39:39 · 2298 阅读 · 0 评论 -
paper list
Chris Dyer Neural architectures for named entity recognition原创 2019-05-09 17:15:22 · 193 阅读 · 0 评论