machine-learning - 机器学习算法的困惑

我使用机器学习做了一个有关板球预测的小应用程序。
我记录了10年（2001年至2011年）的ODI比赛记录，并准备了一套训练手册。

现在，为了预测特定团队的成败，我考虑了各种因素。

例如，这是印度与澳大利亚在印度Wankhede体育场进行的比赛。

印度过去10年的记录。
印度过去两年的记录。（最近的表格）
印度过去10年在印度的纪录。
印度过去2年在印度的纪录。（最近的表格）
印度过去10年在Wankhede的唱片。
印度过去2年在Wankhede的记录。（最近的表格）
澳大利亚过去10年的记录。
澳大利亚过去两年的记录。
澳大利亚过去10年对印度的战绩。
澳大利亚过去两年对印度的战绩。
澳大利亚过去10年在印度对印度的战绩。
澳大利亚过去两年在印度对印度的战绩。

所以我们考虑了所有概率
例如，印度在10年内进行了322场比赛并赢得了140场比赛，因此对于其他所有因素，获胜的概率为140/322，依此类推。
现在，我们最后将所有概率相加，得出两国的赢率百分比。
我想知道它是什么样的定理。
它最初是天真的贝叶斯，但在天真的贝叶斯中，我们乘以概率，与这里不同。
您可以在此处检查实施情况，
http://www.manzarict.org/cricket
我们使用基本的PHP，以便可以使用SQL查询更快地找到概率。
现在，这样做可能是错误的方法，欢迎使用其他方法。

最佳答案

这是一个简单的线性模型，您甚至不适合模型的权重，而是使用常量值。线性模型使用

cl(x) = sgn(<w,x>+b) = sgn( SUM w_i x_i + b )

其中x是您的数据点（x_i是第i个特征）。就您而言，所有w_i = 1（仅添加所有功能，仅此而已）。称这个“定理”太多了，它只是先验假设的（因为您没有训练它）是微不足道的（因为它由常数值组成，没有专家知识）线性模型（因为它使用特征的加权总和）。