Closed. This question is off-topic。它当前不接受答案。
                            
                        
                    
                
                            
                                
                
                        
                            
                        
                    
                        
                            想改善这个问题吗? Update the question,所以它是on-topic,用于堆栈溢出。
                        
                        5年前关闭。
                                                                                            
                
        
寻找有关决定是否鸣叫(实际上是字符串)是否传达出危险情绪的主题的API,方法,研究等。

例如:


危险:“这条街对面的房子着火了!!
没有危险:“这个女孩着火了!喜欢这首歌”

最佳答案

很少有关于检测危险的特定问题的研究,但是有一些研究论文描述了检测自然灾害的方法。您的示例使人想起其中之一的标题:Finding Fires with Twitter。您可能会发现有用的另一项研究是Emergency Situation Awareness: Twitter Case Studies

但是,总的来说,解决此类问题的最佳方法是通过监督分类,这与情感分析的方式非常相似(或者之所以如此,是因为如今采用了诸如Deep Learning之类的更复杂的机器学习范例)。

本质是将文档(在您的情况下为推文)标记为“危险”和“非危险”。该标签由人类专家完成。理想情况下,他们应该精通语言和领域。因此,使用会说Twitter口语的英语为母语的人将是完成此任务的完美注释者。

标记了足够数量的文档后,通常可以通过创建n元语法词向量作为特征向量并运行SVM来实现基线(即基本方法)。如果您不了解机器学习的详细信息,请在进行阅读之前仔细阅读它们。

关于machine-learning - 检测推文中的危险,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26951415/

10-09 08:51