我想知道交叉验证是否是一种分层。

最佳答案

尽管分层和交叉验证都是将一个大群体分成几个较小的群体,但他们的目标和原因却不同(甚至彼此反对)。因此,交叉验证不是分层的一种。

通过分层,我们希望创建专门的子组,每个子组由相对相似的元素组成,而这些元素可以用更加定制的方法进行处理。

交叉验证是一种重新采样过程,用于评估有限数据样本上的机器学习模型。

因此,分层的目的是创建组,使每个组的内部方差尽可能小(以使每个组专用),并通过交叉验证来获得具有相似分布的组(每个组中的元素通常是随机选择的组)。

例如,在有两种类型的数据要划分为两组的情况下,分层的最佳划分为:

machine-learning - 交叉验证是分层的一种吗?-LMLPHP

交叉验证的最佳除法将是:

machine-learning - 交叉验证是分层的一种吗?-LMLPHP

关于machine-learning - 交叉验证是分层的一种吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54169680/

10-12 19:35