我有以下dataframe

import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.random((4,4)))

df
Out[5]:
          0         1         2         3
0  0.136122  0.948477  0.173869  0.929373
1  0.194699  0.759875  0.723993  0.497966
2  0.323100  0.443267  0.210721  0.681426
3  0.590853  0.710664  0.202502  0.950658


我也有一个列映射器:

mapping = {0: ('1', 'A'), 1: ('1', 'B'), 2: ('2', 'A'), 3: ('2', 'B')}


是否可以使用mappingdf中的列重命名为以下内​​容?即直接通过映射将列更改为多索引。

          1                   2
          A         B         A         B
0  0.136122  0.948477  0.173869  0.929373
1  0.194699  0.759875  0.723993  0.497966
2  0.323100  0.443267  0.210721  0.681426
3  0.590853  0.710664  0.202502  0.950658


ps,我知道我可以做到以下几点,

df.columns = pd.MultiIndex.from_product([['1','2'],['A','B']])

最佳答案

使用Index.map,如果可以使用熊猫0.23+,则可以省略.get

df.columns = df.columns.map(mapping.get)
print (df)
          1                   2
          A         B         A         B
0  0.696469  0.286139  0.226851  0.551315
1  0.719469  0.423106  0.980764  0.684830
2  0.480932  0.392118  0.343178  0.729050
3  0.438572  0.059678  0.398044  0.737995


rename的另一种解决方案,但有必要在下一步中转换为MultiIndex

关于python - python pandas dataframe将列重命名为multiindex列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/59262242/

10-15 07:10