我有一个包含20行60列的序列,即20个带有60个参数的示例。
kfold = StratifiedKFold(y = encoded_Y,n_folds = 10,shuffle = True,random_state = seed)
The output consists of two columns
我想知道第二列是什么意思,它在什么基础上选择两个索引。为什么不采用三个索引?
Furthur,我想知道交叉验证功能如何将此系列作为“ cv”参数的输入。 “ cv”通常是整数。
结果= cross_val_score(估计量,X,编码的Y,cv = kfold)
最佳答案
与sklearn.cross_validation
中的所有交叉验证器一样,这是对索引对的迭代器。在每对中,第一项是火车索引列表,第二项是测试索引列表。
在the example you bring中,第一项包含一对,其中除1、17之外的所有内容都是火车索引,而1,17是测试索引。
关于python - 分层KFold输出处理,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38539780/