我的Weka OneR模型都返回了看起来过拟合的集合,并以问号结束,从而得出了如下所示的某些结果:
FollowersMeanCoords_Col:
< 0.33340000000000003 -> False
>= 0.33340000000000003 -> True
? -> False
(114357/163347 instances correct)
这个OneR只是在说“我什么也找不到,所以我们假设其余的都是假的”吗?但是,为什么日期有明确的含义(低于0.33则为False,高于或等于TRUE为True)?有办法防止这种情况吗?
提前致谢!
最佳答案
?
表示缺少值-在某些情况下,您的训练数据必须缺少某些FollowersMeanCoords_Col
值。
您问题中的模型说,如果实例(数据点)的FollowersMeanCoords_Col
小于0.3334 ...,或者丢失,它将将该实例分类为False
,否则将其分类为True
。
OneR是一种非常简单的分类算法,其工作原理是从训练数据中找到一个属性,该属性在用于制定分类规则时给出的误差最小。为了使OneR过拟合,需要有一个属性可以很好地对训练数据进行分类,但不能将其推广到将来的测试数据。 OneR更有可能为您提供健壮但不准确的模型。
关于machine-learning - Weka OneR给吗?作为分类器模型,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/45772807/