目前正在设计要在我的网站上使用的CMS。我想知道是否有任何免费的库可用于根据内容创建标签。

示例



将产生标签树和叶子。

该库应为PHP或JS。

编辑1:

我已经找到了完成一半任务的简单库-http://www.cafewebmaster.com/get-top-100-words-keywords-text-php

我已经编辑了库的规范(由于@NullUserException的指导)-

  • 计算所有单词(忽略大小写和变形),扔掉停用词并选择频率最高的单词
  • 编辑文本以使特定于该类型的单词(可能具有较低的频率)的值更高。例如,在示例中-“多色”应变为更高的值,因为它对主题更具体。但是,它应该包括一个前缀,表明它与主题有关(它会变成多色叶子)。

  • 编辑2:

    算法应删除少于3个字符的单词,除非以大写字母或其他格式格式化

    最佳答案

    CMS上的标签是否已定义?如果是,则可以在内存中为文本建立索引,并针对该文本使用所有已知标签进行搜索。选择得分最高的标签并呈现给用户。

    可以使用http://lucene.apache.org/solr/进行索引和搜索

    编辑:请注意,我确实建议您从管理面板(例如在wordpress中)定义和管理您的标签/关键字。否则,您最终将获得从您的文章中生成的数千个关键字,这些关键字永远不会对最终用户有所帮助。

    关于php - 什么是建议内容关键字的有效库?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7375985/

    10-11 22:56
    查看更多