我有看起来像这样的数据框

Index P1W1 P1W2 P1W3 P1W4 P2W1 P2W2 P2W3 P2W4 P3W1 P3W2 P3W3 P3W4
  0    A          B   C          A    D    D    A
  1    B          A              C    C    B         A
  2               C   D


我想将其转换为

Index    P1         P2         P3
  0      A(P1W1)    A(P2W2)    A(P3W1)
  1      A(P1W3)    B(P2W4)    A(P3W2)
  2      B(P1W1)    C(P2W2)
  3      B(P1W3)    C(P2W3)
  4      C(P1W3)    D(P2W3)
  5      C(P1W4)    D(P2W4)
  6      D(P1W4)


基本上,我想从第一个数据框中获取具有单元格值的列名,然后将其聚合到P1 P2级别。

如果需要任何澄清,请询问

我完全不知道如何使用此功能,将不胜感激

最佳答案

设定

txt = """\
Index P1W1 P1W2 P1W3 P1W4 P2W1 P2W2 P2W3 P2W4 P3W1 P3W2 P3W3 P3W4
  0    A          B   C          A    D    D    A
  1    B          A              C    C    B         A
  2               C   D            """

df = pd.read_fwf(pd.io.common.StringIO(txt), index_col=0).fillna('')
df

      P1W1 P1W2 P1W3 P1W4 P2W1 P2W2 P2W3 P2W4 P3W1 P3W2 P3W3 P3W4
Index
0        A         B    C         A    D    D    A
1        B         A              C    C    B         A
2                  C    D






d = df + df.columns.map(lambda c: f'({c})')
pd.concat({
    g: d.stack().reset_index(drop=True)
    for g, d in d.where(df.astype(bool)).groupby(
        lambda col: col[:2], 1
    )
}, axis=1).fillna('')

        P1       P2       P3
0  A(P1W1)  A(P2W2)  A(P3W1)
1  B(P1W3)  D(P2W3)  A(P3W2)
2  C(P1W4)  D(P2W4)
3  B(P1W1)  C(P2W2)
4  A(P1W3)  C(P2W3)
5  C(P1W3)  B(P2W4)
6  D(P1W4)




细节

添加用括号括起来的列

df + df.columns.map(lambda c: f'({c})')

          P1W1    P1W2     P1W3     P1W4    P2W1     P2W2     P2W3     P2W4     P3W1     P3W2    P3W3    P3W4
Index
0      A(P1W1)  (P1W2)  B(P1W3)  C(P1W4)  (P2W1)  A(P2W2)  D(P2W3)  D(P2W4)  A(P3W1)   (P3W2)  (P3W3)  (P3W4)
1      B(P1W1)  (P1W2)  A(P1W3)   (P1W4)  (P2W1)  C(P2W2)  C(P2W3)  B(P2W4)   (P3W1)  A(P3W2)  (P3W3)  (P3W4)
2       (P1W1)  (P1W2)  C(P1W3)  D(P1W4)  (P2W1)   (P2W2)   (P2W3)   (P2W4)   (P3W1)   (P3W2)  (P3W3)  (P3W4)


使用遮罩在适当的位置制作NaN。这将使我们能够在理解范围内进行堆叠,并为了方便起见将NaN删除。

d = df + df.columns.map(lambda c: f'({c})')
d.where(df.astype(bool))

          P1W1 P1W2     P1W3     P1W4 P2W1     P2W2     P2W3     P2W4     P3W1     P3W2 P3W3 P3W4
Index
0      A(P1W1)  NaN  B(P1W3)  C(P1W4)  NaN  A(P2W2)  D(P2W3)  D(P2W4)  A(P3W1)      NaN  NaN  NaN
1      B(P1W1)  NaN  A(P1W3)      NaN  NaN  C(P2W2)  C(P2W3)  B(P2W4)      NaN  A(P3W2)  NaN  NaN
2          NaN  NaN  C(P1W3)  D(P1W4)  NaN      NaN      NaN      NaN      NaN      NaN  NaN  NaN


lambda分组,该axis=1将应用于我们选择的索引对象。我们将选择定位列。

关于python - 将 Pandas 中的列值复制到非零单元格并在其后聚合列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48809166/

10-16 01:07