我想分析向量以查找模式和内容,并在它们上使用SVM完成A类和B类之间的分类任务,该任务应受到监督。 (我知道这听起来可能很奇怪,但这是我们的作业。)因此,我真的需要知道:
1-如何使用经过训练的模型提取文档的编码矢量?
2-如何解释它们以及word2vec如何编码它们?
我正在使用gensim的word2vec。
最佳答案
如果您已经训练了word2vec模型,则可以通过__getitem__
方法获得单词向量model = gensim.models.Word2Vec(sentences)print(model["some_word_from_dictionary"])
不幸的是,来自word2vec / doc2vec的嵌入没有被人解释(与LdaModel的主题向量相反)
P / S如果您在任务中的对象处有文本,则应使用Doc2Vec模型
关于python - 如何从gensim的word2vec中提取词汇向量?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43904029/