我有一个数据框,其中一列包含类别变量,而另一列包含连续变量,如下所示:

    gender  contVar
    Male     22379
    Female   24523
    Female   23421
    Male     23831
    Male     29234

我想要一张像这样的 table :
    Male   Female
    22379   24523
    23831   23421
    23831
    29234

Pandas 有可能吗?当我做:
    df.pivot(index = df.index.tolist(), columns='gender', values='contVar')

我知道索引超出范围(显然,因为有索引,所以没有行,但我也认为是因为每列的行数不相等)。任何想法表示赞赏。

最佳答案

你可以做:

pd.concat([pd.DataFrame({g:d.contVar.tolist()}) for g,d in df.groupby('gender')], axis=1)

Out[416]:
   Female   Male
0   24523  22379
1   23421  23831
2     NaN  29234

关于python - Pandas 枢轴数据框具有不相等的列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36864699/

10-10 20:13