今天了解了一下word2vec这个工具,之前用过但是没怎么细究,今天回顾整理一下。

关于word2vec的介绍,我觉得这篇文章《理解Word2Vec之Skip-Gram模型》讲的不错,主要介绍了word2vec的大概思想,以及实现的tricks。这篇文章后面附有代码,本人是先看代码,没看懂的才看文章,感觉豁然开朗。

此外,网上还有一篇《word2vec中的数学》,从理论角度阐述了word2vec背后的数学原理。这篇文章的作者的博客在这里

简单地说,word2vec就是给定一个语料库,通过特定的神经网络模型+滑动窗口的思想去学习得到代表每个单词的向量

word2vec是Tomáš Mikolov和其同事一起做的工作,涉及两篇论文。

参考