我正在为推荐系统处理movielens 100K电影数据。
我将数据分为测试和训练,然后计算精度和召回率。在测试中,随机选择了超过1万名用户。
我能够找到精确度并针对单个用户进行召回。

我想知道:
汇总精度和召回率是否有实际意义?

最佳答案

您会在学术论文中看到“精确度/召回率”结果是总计报告,而不是10,000个不同的P / R结果。在这方面,它使读者对RS性能具有非常一般的认识。通常,您会看到Precision / Recall表示为曲线(如此处所示:http://www.cs.washington.edu/ai/mln/images/image001.png)。您倾向于看到在Recall = 1时,精度较低,而在Precision = 1时,召回率较低。您可以从10,000个结果中轻松地在Excel或Google表格中创建这些曲线之一。

如评论中所述,F度量是一种组合P / R来生成平均值的方法,尽管在“吹嘘”它之前您需要了解F度量的局限性。根据您的应用领域为精度或召回率权衡某种加权的情况并不罕见,因此请注意基本的F度量是平衡的(精度和召回率都被视为同等重要)。

接收器操作员特征(https://en.wikipedia.org/wiki/Receiver_operating_characteristic)也通常沿侧面P / R曲线使用,并且在推荐系统评估中使用f度量。如果您正在寻找额外的信誉,那么我建议您使用多种方法来评估RS性能,例如P / R曲线,F量度,AUC和ROC。

关于machine-learning - 汇总精度和召回率的实际重要性是什么?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30890028/

10-12 22:00