我找到了GoogleNews-vectors-negative300.bin库,但仅适用于ENG单词,word2vec中类似单词是否有波兰语实现?
我已经尝试使用cc.pl.300.bin和NKJP-PodkorpusMilionowy库...
public Word2Vec getWord2Vec() {
File gModel = new File("C:/Users/user/Desktop/GoogleNews-vectors-negative300.bin.gz");
return WordVectorSerializer.readWord2VecModel(gModel);
}
最佳答案
文件...
https://dl.fbaipublicfiles.com/fasttext/vectors-wiki/wiki.pl.vec
从...链接
https://fasttext.cc/docs/en/pretrained-vectors.html
如果您的图书馆加载了用于交换单词向量的简单“文本”格式,则可能对您有用。 (与您的cc.pl.300.bin
文件不同,它不是Facebook FastText特定的二进制格式。)