我有一个包含20行60列的序列,即20个带有60个参数的示例。

kfold = StratifiedKFold(y = encoded_Y,n_folds = 10,shuffle = True,random_state = seed)
The output consists of two columns

我想知道第二列是什么意思,它在什么基础上选择两个索引。为什么不采用三个索引?

Furthur,我想知道交叉验证功能如何将此系列作为“ cv”参数的输入。 “ cv”通常是整数。

结果= cross_val_score(估计量,X,编码的Y,cv = kfold)

最佳答案

sklearn.cross_validation中的所有交叉验证器一样,这是对索引对的迭代器。在每对中,第一项是火车索引列表,第二项是测试索引列表。

the example you bring中,第一项包含一对,其中除1、17之外的所有内容都是火车索引,而1,17是测试索引。

关于python - 分层KFold输出处理,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38539780/

10-12 16:37