例如,如果我有一组博客文章,并且我想根据某些标准过滤掉那些关于我自己或无关的文章,那么专业领域是什么?我知道我可以有一个单词列表来查找(其中很多是关于我自己或其他任何东西/一个-组合不会结束),来进行筛选,但这不是一个可伸缩的策略。levenschtein算法也会派上用场,但我认为这是一个完整的研究领域?
谢谢

最佳答案

这可能有用:
The Anatomy Of A Search Engine

10-04 14:11