我从不同的博客文章中删除了有关特定主题的文本。我阅读的有关sendimenet分析的大多数主题都是基于训练分类器,以便确定此答案是否为正负,如本thread所示。
我的问题是我在哪里可以找到单词词典,以及那里的情感。
例如:Nice: Positive , bad: negative
。
最佳答案
您正在寻找的是情感词典。情感词典是一个单词词典,其中每个单词都有一个相应的情感评分(从非常否定到非常肯定),或者如您提到的好或坏之类的标签(但后一种情况并不常见)。您可以使用几种情感词典,例如sentiwordnet,senistrength和AFINN等。在所有这三个词典中,您都会获得与每个情感词相对应的情感分数,当然,您可以简单地设置一个条件,即如果一个单词具有相应的负分数,则其不好,而如果其得分为正,则为好。
其中最容易使用的是AFINN,我建议您首先使用。稍后,您可以根据您的应用程序升级到更合适的应用程序。
您可以找到有关AFINN here的信息,并从here下载。
让我知道您是否还有其他问题。
关于python - nltk NaiveBayesClassifier培训,用于博客情感分析,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27074568/