一、word2vec

是什么

word2vec是继NNLM模型之后,为了专门训练词向量而产生的神经网络语言模型。

为什么

NNLM模型主要使预测词的概率最大,由此产生的参数矩阵是附带产生,而word2vec主要训练参数矩阵(即词向量),并不要求预测词的概率最大,前者主要目的是预测词,后者目的是参数矩阵。

怎么做

gensim的word2vec模型
code:


image.png
image.png

优点

词向量大小降低,可以自定义
可以表示词之间的关联度

缺点

一词不多义

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容