我有看起来像这样的数据框
Index P1W1 P1W2 P1W3 P1W4 P2W1 P2W2 P2W3 P2W4 P3W1 P3W2 P3W3 P3W4
0 A B C A D D A
1 B A C C B A
2 C D
我想将其转换为
Index P1 P2 P3
0 A(P1W1) A(P2W2) A(P3W1)
1 A(P1W3) B(P2W4) A(P3W2)
2 B(P1W1) C(P2W2)
3 B(P1W3) C(P2W3)
4 C(P1W3) D(P2W3)
5 C(P1W4) D(P2W4)
6 D(P1W4)
基本上,我想从第一个数据框中获取具有单元格值的列名,然后将其聚合到P1 P2级别。
如果需要任何澄清,请询问
我完全不知道如何使用此功能,将不胜感激
最佳答案
设定
txt = """\
Index P1W1 P1W2 P1W3 P1W4 P2W1 P2W2 P2W3 P2W4 P3W1 P3W2 P3W3 P3W4
0 A B C A D D A
1 B A C C B A
2 C D """
df = pd.read_fwf(pd.io.common.StringIO(txt), index_col=0).fillna('')
df
P1W1 P1W2 P1W3 P1W4 P2W1 P2W2 P2W3 P2W4 P3W1 P3W2 P3W3 P3W4
Index
0 A B C A D D A
1 B A C C B A
2 C D
解
d = df + df.columns.map(lambda c: f'({c})')
pd.concat({
g: d.stack().reset_index(drop=True)
for g, d in d.where(df.astype(bool)).groupby(
lambda col: col[:2], 1
)
}, axis=1).fillna('')
P1 P2 P3
0 A(P1W1) A(P2W2) A(P3W1)
1 B(P1W3) D(P2W3) A(P3W2)
2 C(P1W4) D(P2W4)
3 B(P1W1) C(P2W2)
4 A(P1W3) C(P2W3)
5 C(P1W3) B(P2W4)
6 D(P1W4)
细节
添加用括号括起来的列
df + df.columns.map(lambda c: f'({c})')
P1W1 P1W2 P1W3 P1W4 P2W1 P2W2 P2W3 P2W4 P3W1 P3W2 P3W3 P3W4
Index
0 A(P1W1) (P1W2) B(P1W3) C(P1W4) (P2W1) A(P2W2) D(P2W3) D(P2W4) A(P3W1) (P3W2) (P3W3) (P3W4)
1 B(P1W1) (P1W2) A(P1W3) (P1W4) (P2W1) C(P2W2) C(P2W3) B(P2W4) (P3W1) A(P3W2) (P3W3) (P3W4)
2 (P1W1) (P1W2) C(P1W3) D(P1W4) (P2W1) (P2W2) (P2W3) (P2W4) (P3W1) (P3W2) (P3W3) (P3W4)
使用遮罩在适当的位置制作
NaN
。这将使我们能够在理解范围内进行堆叠,并为了方便起见将NaN
删除。d = df + df.columns.map(lambda c: f'({c})')
d.where(df.astype(bool))
P1W1 P1W2 P1W3 P1W4 P2W1 P2W2 P2W3 P2W4 P3W1 P3W2 P3W3 P3W4
Index
0 A(P1W1) NaN B(P1W3) C(P1W4) NaN A(P2W2) D(P2W3) D(P2W4) A(P3W1) NaN NaN NaN
1 B(P1W1) NaN A(P1W3) NaN NaN C(P2W2) C(P2W3) B(P2W4) NaN A(P3W2) NaN NaN
2 NaN NaN C(P1W3) D(P1W4) NaN NaN NaN NaN NaN NaN NaN NaN
按
lambda
分组,该axis=1
将应用于我们选择的索引对象。我们将选择定位列。关于python - 将 Pandas 中的列值复制到非零单元格并在其后聚合列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48809166/