我使用机器学习做了一个有关板球预测的小应用程序。
我记录了10年(2001年至2011年)的ODI比赛记录,并准备了一套训练手册。

现在,为了预测特定团队的成败,我考虑了各种因素。

例如,这是印度与澳大利亚在印度Wankhede体育场进行的比赛。


印度过去10年的记录。
印度过去两年的记录。 (最近的表格)
印度过去10年在印度的纪录。
印度过去2年在印度的纪录。 (最近的表格)
印度过去10年在Wankhede的唱片。
印度过去2年在Wankhede的记录。 (最近的表格)
澳大利亚过去10年的记录。
澳大利亚过去两年的记录。
澳大利亚过去10年对印度的战绩。
澳大利亚过去两年对印度的战绩。
澳大利亚过去10年在印度对印度的战绩。
澳大利亚过去两年在印度对印度的战绩。


所以我们考虑了所有概率
例如,印度在10年内进行了322场比赛并赢得了140场比赛,因此对于其他所有因素,获胜的概率为140/322,依此类推。
现在,我们最后将所有概率相加,得出两国的赢率百分比。
我想知道它是什么样的定理。
它最初是天真的贝叶斯,但在天真的贝叶斯中,我们乘以概率,与这里不同。
您可以在此处检查实施情况,
http://www.manzarict.org/cricket
我们使用基本的PHP,以便可以使用SQL查询更快地找到概率。
现在,这样做可能是错误的方法,欢迎使用其他方法。

最佳答案

这是一个简单的线性模型,您甚至不适合模型的权重,而是使用常量值。线性模型使用

cl(x) = sgn(<w,x>+b) = sgn( SUM w_i x_i + b )


其中x是您的数据点(x_i是第i个特征)。就您而言,所有w_i = 1(仅添加所有功能,仅此而已)。称这个“定理”太多了,它只是先验假设的(因为您没有训练它)是微不足道的(因为它由常数值组成,没有专家知识)线性模型(因为它使用特征的加权总和)。

10-06 09:12