我正在做一些“机器学习”的初级阶段。
我正在尝试创建一个新的数据帧,其中一列似乎无法识别。。?
我加载了一个包含两列的Excel文件(删除了索引)。一切都好。
代码:
df = pd.read_excel('scores.xlsx',index=False)
df=df.rename(columns=dict(zip(df.columns,['Date','Amount'])))
df.index=df['Date']
df=df[['Amount']]
#creating dataframe
data = df.sort_index(ascending=True, axis=0)
new_data = pd.DataFrame(index=range(0,len(df)),columns=['Date','Amount'])
for i in range(0,len(data)):
new_data['Date'][i] = data['Date'][i]
new_data['Amount'][i] = data['Amount'][i]
错误:
KeyError: 'Date'
不太清楚这里有什么问题。
非常感谢任何帮助
最佳答案
要添加到@Grzegorz Skibinski的答案中,问题是在第4行之后,不再有'Date'
列。日期列被分配给索引并被删除,虽然索引的名称为“Date”,但不能使用'Date'
作为获取索引的键-必须使用data.index[i]
而不是data['Date'][i]
。