这两天翻了一下这本书,做个笔记,方便下次细看。
本书主要讲解统计学习中用到的监督学习。介绍了一些模型机器算法。当参考书不错,不怎么适合死磕。
第一章:主要介绍机器学习,统计学习的基本步骤,以及常用的表示方法。写的比较系统,对于这个比较不熟悉的,可以好好看看。因为常用的模型就是这样表示的,懂了这个看公式会容易点。
第二章:介绍感知机。如果分错类就惩罚,需要选择一定的步长。很多算法的基本思想。较基础。感知机对偶例子不错。p33
第三章; 介绍K近邻。讲得形式化,瞎绕的感觉。kd树没有细看。有时间研究下。
第四章:朴素贝叶斯。之前看过相关的,略过了。貌似讲得不怎么样
第五章::决策树。前面的关于信息增益等章节细看了。后面ID3,C4,5算法没细看
第六章:逻辑回归,最大熵。没什么特殊的。
第七章:支持向量机:这是比较重点看的一个章节。
对偶问题:极大极小=>极小极大。
利用拉格朗日方法。附录三关于这点拉格朗日对偶将得很明白。
核函数的说明可以参考free mind 博客。http://blog.pluskid.org/?p=685 和http://blog.pluskid.org/?p=696 讲得很是深入浅出。
至于正定核,SMO算法的具体内容,还要再细看。。
第八章:boost方法。下次看,感觉讲得不好。
第九章:EM。E过程,M过程。公式巨多。改天看Andrew视频吧。
第十章:隐马尔科夫。之前了解过,大致看了。
第十一章:条件随机场。未看。