捡起博客,继续学习,争取聘上算法工程师。
1. [Algorithm & NLP] 文本深度表示模型——word2vec&doc2vec词向量模型 http://www.cnblogs.com/maybe2030/p/5427148.html
没看太懂。看了一些词,说了一些方法,对完整过程的理解还是懵逼
2http://www.cnblogs.com/maybe2030/p/5678387.html logistic函数和softmax函数
解释了这两个函数类型、作用与区别
3http://www.cnblogs.com/maybe2030/p/4953039.html 局部敏感哈希算法(Locality Sensitive Hashing)
顺手看了下LSH局部敏感hash还挺有意思的
4.http://www.cnblogs.com/maybe2030/p/5203186.html 使用SimHash进行海量文本去重
提到了海明距离,不过通过分片的方式进行的枚举检索的。其实是一种加速的方式。