我正在尝试加载sklearn.dataset,并根据键(target_names,target和DESCR)缺少列。我尝试了各种方法来包括最后一列,但有错误。

 import numpy as np
 import pandas as pd
 from sklearn.datasets import load_breast_cancer

 cancer = load_breast_cancer()
 print cancer.keys()


 data = pd.DataFrame(cancer.data, columns=[cancer.feature_names])
 print data.describe()

使用上面的代码,当我需要31列时,它仅返回30列。将scikit学习数据集加载到pandas DataFrame中的最佳方法是什么。

最佳答案

创建包含特征和目标变量的数据框的另一种方法(但只有一种方法)是:

import pandas as pd
import numpy as np
from sklearn.datasets import load_breast_cancer

cancer = load_breast_cancer()
df = pd.DataFrame(np.c_[cancer['data'], cancer['target']],
                  columns= np.append(cancer['feature_names'], ['target']))

关于python - 将SKLearn癌症数据集加载到Pandas DataFrame中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44340445/

10-12 17:40