问题描述
我正在使用 GloVe 作为我研究的一部分.我已经从这里下载了模型.我一直在使用 GloVe 进行句子分类.我正在分类的句子特定于特定领域,比如一些 STEM 主题.但是,由于现有的 GloVe 模型是在通用语料库上训练的,因此对于我的特定任务,它们可能不会产生最佳结果.
I am using GloVe as part of my research. I've downloaded the models from here. I've been using GloVe for sentence classification. The sentences I'm classifying are specific to a particular domain, say some STEM subject. However, since the existing GloVe models are trained on a general corpus, they may not yield the best results for my particular task.
所以我的问题是,我将如何加载重新训练的模型并在我自己的语料库上对其进行更多的重新训练以学习我的语料库的语义?如果可能的话,这样做是有好处的.
So my question is, how would I go about loading the retrained model and just retraining it a little more on my own corpus to learn the semantics of my corpus as well? There would be merit in doing this were it possible.
推荐答案
经过一番挖掘,我找到了 这个问题 在 git repo 上.有人提出以下建议:
After a little digging, I found this issue on the git repo. Someone suggested the following:
是的,由于优化设置,这不会很好地工作.但是您可以做的是在您自己的语料库上训练 GloVe 向量,然后将这些向量与预训练的 GloVe 向量连接起来以用于您的最终应用程序.
这就是答案.
这篇关于改进现有的基本手套模型的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!