Closed. This question needs to be more focused。它当前不接受答案。
想改善这个问题吗?更新问题,使其仅通过editing this post专注于一个问题。
6年前关闭。
我们正在构建一个文本搜索解决方案,并且希望有一种方法可以在每次添加新文档类型时测量系统的精度和召回率。通过阅读这里的一些帖子,听起来像是一种基于机器学习的解决方案。专家可以对此发表评论吗?然后,我们希望将机器学习人员加入我们的团队。
想改善这个问题吗?更新问题,使其仅通过editing this post专注于一个问题。
6年前关闭。
我们正在构建一个文本搜索解决方案,并且希望有一种方法可以在每次添加新文档类型时测量系统的精度和召回率。通过阅读这里的一些帖子,听起来像是一种基于机器学习的解决方案。专家可以对此发表评论吗?然后,我们希望将机器学习人员加入我们的团队。
最佳答案
获取F1-score的唯一方法是需要有关正确类的知识,通过评估查询获得的所有样本的等级,并且还需要那些评估查询。
任何机器学习都将需要大量的手工工作来提供这些样本和/或查询。如此之大,它不会节省您任何时间。
评估的另一个不利方面是学习相关的内在错误。它会随着搜索引擎索引大小的增加和所需示例的数量而增加。您永远不会获得良好的评价。
忘记评估搜索引擎的机器学习。
手动构建您的测试查询和示例,直到它变得庞大而可靠为止。
如果您确实希望在系统中进行机器学习,则应查看查询预处理。通常,以另一种方式获取有关查询的元信息(您说SVN,为什么不这样做?)通常对性能有好处,虽然它不会改变结果,但是您可以使用相同的示例进行端到端评估。
我几年前所做的,但是在自然语言分析上使用了朴素的Baye分类器。
关于search - 测量精度和召回率,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/17532660/
10-12 21:14