使用gensim的word2vec训练了一个词向量。

语料是1G多的维基百科,感觉词向量的质量还不错,共享出来,希望对大家有用。

下载地址是: http://pan.baidu.com/s/1boPm2x5

包含训练代码、使用词向量代码、词向量文件(3个文件)

开源共享一个训练好的中文词向量(语料是维基百科的内容,大概1G多一点)-LMLPHP

开源共享一个训练好的中文词向量(语料是维基百科的内容,大概1G多一点)-LMLPHP

因为机器内存足够,也没有分批训练。所以代码非常简单。也在共享文件里面,就不贴在这里了。

05-08 15:20