word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包。它简单、高效。因此引起了非常多人的关注。 因为 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上添加了这个工具包的神奇感。一些按捺不住的人于是选择了通过解剖源码的方式来一窥到底,出于好奇,我也成为了他们中的一员。读完代码后,认为收获颇多。整理成文,给有须要的朋友參考。
相关链接
(一)文件夹和前言
(二)预备知识
(三)背景知识
(四)基于 Hierarchical Softmax 的模型
(六)若干源代码细节
作者: peghoty
出处: http://blog.csdn.net/itplus/article/details/37969519
欢迎转载/分享, 但请务必声明文章出处.