当您从多个来源看到新闻时,多个来源(网站)可能会谈论相同的内容。

是否有Python / C++ / C#/ Java库可以比较来自不同来源的多个句子并确定它们之间的相关性,以便将结果用于新闻分组?

最佳答案

看看ntlk。它们具有用于各种类型分类的分类模块。

10-05 18:30