我想将下表作为熊猫数据框阅读
说数据框是df,目的是查询
df ['acct_id'] ['A'] ['0-3_mon]应该给我10
我已经完成了面板数据的准备工作,其中所有内容都是一列,然后您为横截面和时间序列创建了一个多级索引。
但是在这里,源数据本身具有两个以上级别的列。如何将此csv读为多级索引?我被困在这里,任何想法。
如果您想看一些类似的作品-
https://lectures.quantecon.org/py/pandas_panel.html
非常感谢。
最佳答案
用DataFrame
创建MultiIndex
,因为deprecate panel
:
df = pd.read_csv(file, header=[0,1], index_col=[0])
然后按slicers选择:
idx = pd.IndexSlice
print (df.loc[1, idx['A', '0-3_mon']])
样本:无Multindex名称:
import pandas as pd
temp=u"""A;A;B;B
0-3_mon;3-6_mon;0-3_mon;3-6_mon
1;10;12;14;18
2;11;15;17;19
3;13;16;21;20"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), sep=";", header=[0,1])
print (df)
A B
0-3_mon 3-6_mon 0-3_mon 3-6_mon
1 10 12 14 18
2 11 15 17 19
3 13 16 21 20
print (df.columns)
MultiIndex(levels=[['A', 'B'], ['0-3_mon', '3-6_mon']],
labels=[[0, 0, 1, 1], [0, 1, 0, 1]])
idx = pd.IndexSlice
print (df.loc[1, idx['A', '0-3_mon']])
10
指定名称为MultiIndex的样本:
import pandas as pd
temp=u"""acct_id;A;A;B;B
level;0-3_mon;3-6_mon;0-3_mon;3-6_mon
1;10;12;14;18
2;11;15;17;19
3;13;16;21;20"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), sep=";", index_col=[0], header=[0,1])
print (df)
acct_id A B
level 0-3_mon 3-6_mon 0-3_mon 3-6_mon
1 10 12 14 18
2 11 15 17 19
3 13 16 21 20
print (df.columns)
MultiIndex(levels=[['A', 'B'], ['0-3_mon', '3-6_mon']],
labels=[[0, 0, 1, 1], [0, 1, 0, 1]],
names=['acct_id', 'level'])
idx = pd.IndexSlice
print (df.loc[1, idx['A', '0-3_mon']])
10
关于python - 使用pandas read_csv方法进行Python多级索引,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52077487/