目前使用深度网络进行文本任务模型训练时,第一步应该是将文本转为词向量进行处理。但一般词向量的效果跟语料的大小有关,而处理任务的语料不足支持我们的实验,这时就需要使用网上公开的大规模语料训练词向量。
1、下载
网上公开的词向量下载地址:https://github.com/xgli/word2vec-api
glove的文件说明如何使用预训练词向量,文件格式如下:每行为一个单词和其对应的词向量,以空格分隔。
glove对应的词向量,非二进制文件
word2vec对应的词向量,非二进制文件
2、装载
glove词向量的装载
filename =