我一直在阅读关于成对排名的论文,这是我没有得到的:
点对和成对排名的训练/测试数据有何区别?
这是我一直在阅读的论文:
http://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf
在那里,它说成对排序中的数据点是两个链接之间的不平等:
[line]。=。 [作为目标的两个链接之间的不平等] qid:[qid] [[链接1和2的特征]:[值1和2]]#[info]
但是,RankLib确实支持成对的排名,例如RankNet和RankBoost,但是它使用的数据点格式是逐点的
[line]。=。 [绝对排名,即目标] qid:[qid] [feature1]:[value1] [feature2]:[value2] ...#[info]
我有什么想念的吗?
最佳答案
按点排序类似于回归。每个点都有一个关联的等级分数,您想预测该等级分数。因此,给定查询后,您标记的数据集将具有特征向量和相关的排名得分
IE:{d1,r1} {d2,r2} {d3,r3} {d4,r4}
其中r1> r2> r3> r4
成对排名类似于分类。每个数据点都与另一个数据点相关联,目标是学习一个分类器,该分类器将预测两者中的哪个与给定查询“更多”相关。
IE:{d1> d2} {d2> d3} {d3> d4}