我的Weka OneR模型都返回了看起来过拟合的集合,并以问号结束,从而得出了如下所示的某些结果:

FollowersMeanCoords_Col:
    < 0.33340000000000003   -> False
    >= 0.33340000000000003  -> True
    ?   -> False
(114357/163347 instances correct)


这个OneR只是在说“我什么也找不到,所以我们假设其余的都是假的”吗?但是,为什么日期有明确的含义(低于0.33则为False,高于或等于TRUE为True)?有办法防止这种情况吗?

提前致谢!

最佳答案

?表示缺少值-在某些情况下,您的训练数据必须缺少某些FollowersMeanCoords_Col值。

您问题中的模型说,如果实例(数据点)的FollowersMeanCoords_Col小于0.3334 ...,或者丢失,它将将该实例分类为False,否则将其分类为True

OneR是一种非常简单的分类算法,其工作原理是从训练数据中找到一个属性,该属性在用于制定分类规则时给出的误差最小。为了使OneR过拟合,需要有一个属性可以很好地对训练数据进行分类,但不能将其推广到将来的测试数据。 OneR更有可能为您提供健壮但不准确的模型。

关于machine-learning - Weka OneR给吗?作为分类器模型,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/45772807/

10-12 18:11