machine-learning - 检测推文中的危险

Closed. This question is off-topic。它当前不接受答案。












                            想改善这个问题吗？ Update the question，所以它是on-topic，用于堆栈溢出。

                        5年前关闭。



寻找有关决定是否鸣叫（实际上是字符串）是否传达出危险情绪的主题的API，方法，研究等。

例如：

危险：“这条街对面的房子着火了！！
没有危险：“这个女孩着火了！喜欢这首歌”

最佳答案

很少有关于检测危险的特定问题的研究，但是有一些研究论文描述了检测自然灾害的方法。您的示例使人想起其中之一的标题：Finding Fires with Twitter。您可能会发现有用的另一项研究是Emergency Situation Awareness: Twitter Case Studies。

但是，总的来说，解决此类问题的最佳方法是通过监督分类，这与情感分析的方式非常相似（或者之所以如此，是因为如今采用了诸如Deep Learning之类的更复杂的机器学习范例）。

本质是将文档（在您的情况下为推文）标记为“危险”和“非危险”。该标签由人类专家完成。理想情况下，他们应该精通语言和领域。因此，使用会说Twitter口语的英语为母语的人将是完成此任务的完美注释者。

标记了足够数量的文档后，通常可以通过创建n元语法词向量作为特征向量并运行SVM来实现基线（即基本方法）。如果您不了解机器学习的详细信息，请在进行阅读之前仔细阅读它们。

关于machine-learning - 检测推文中的危险，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/26951415/