我正在尝试加载sklearn.dataset,并根据键(target_names,target和DESCR)缺少列。我尝试了各种方法来包括最后一列,但有错误。
import numpy as np
import pandas as pd
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
print cancer.keys()
data = pd.DataFrame(cancer.data, columns=[cancer.feature_names])
print data.describe()
使用上面的代码,当我需要31列时,它仅返回30列。将scikit学习数据集加载到pandas DataFrame中的最佳方法是什么。
最佳答案
创建包含特征和目标变量的数据框的另一种方法(但只有一种方法)是:
import pandas as pd
import numpy as np
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
df = pd.DataFrame(np.c_[cancer['data'], cancer['target']],
columns= np.append(cancer['feature_names'], ['target']))
关于python - 将SKLearn癌症数据集加载到Pandas DataFrame中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44340445/