我需要一个正词和负词的列表,并根据单词的强度和星期为它们分配权重。我有 :

1.)WordNet-每个单词给出+或-分数。

2.)SentiWordNet-提供[0,1]范围内的正值和负值。

我用几句话检查了一下,

爱-wordNet为名词和动词都给出0.0,我不知道为什么我认为它至少在某些方面应该是正的。

压制-WordNet给-9.93
-SentiWordNet给出-pos和neg均为0.0。 (应该为负)

休息-WordNet-2.488
-SentiWordNet-{pos-0.125,neg-0.5}(应为正数)

我需要一些帮助来决定使用哪个。

谢谢。

最佳答案

程度和/或极性通常取决于领域和/或上下文,因此仅靠单词本身还不足以做出决定。

如果您有一些带注释的数据,我建议使用这两种资源提供的分数作为特征,对分类器进行训练。如果不这样做,一种选择是使用与所讨论的域匹配的可用的带有情感注释的语料库之一。我认为,例如,尽管没有任何数据,但整个任务有些棘手,尽管在无监督的情感分类方法上有大量工作要做。 Unsupervised Sentiment Analysis

09-26 14:14