我找到了GoogleNews-vectors-negative300.bin库,但仅适用于ENG单词,word2vec中类似单词是否有波兰语实现?

我已经尝试使用cc.pl.300.bin和NKJP-PodkorpusMilionowy库...

    public  Word2Vec getWord2Vec() {
        File gModel = new File("C:/Users/user/Desktop/GoogleNews-vectors-negative300.bin.gz");
        return WordVectorSerializer.readWord2VecModel(gModel);
    }

最佳答案

文件...

https://dl.fbaipublicfiles.com/fasttext/vectors-wiki/wiki.pl.vec

从...链接

https://fasttext.cc/docs/en/pretrained-vectors.html

如果您的图书馆加载了用于交换单词向量的简单“文本”格式,则可能对您有用。 (与您的cc.pl.300.bin文件不同,它不是Facebook FastText特定的二进制格式。)

07-24 15:27