请帮忙。我有数据框:

   trade_type
0  -
1  Buy
2  -
3  -
4  Sell
5  Buy
6  -
7  Sell
8  -
9  Sell
10 -


我需要滚动计算所有的!=“-”直到下一次更改,并将其存储在新列“ trade_ID”的每一行中,因此看起来像这样:

 trade_type trade_ID
0  -        0
1  Buy      1
2  -        1
3  -        1
4  Sell     2
5  Buy      3
6  -        3
7  Sell     4
8  -        4
9  Sell     5
10  -       5


我尝试使用:

df['trade_ID'] = (df.trade_type.shift(1) != df.trade_type).astype(int).cumsum()


但它会将“-”视为新更改,因此无法正常工作。

最佳答案

-替换为np.nan(在import numpy as np之后)并过滤series.notna()并应用series.cumsum()

df['trade_ID']=df.trade_type.replace("-",np.nan).notna().cumsum()
print(df)

   trade_type  trade_ID
0           -         0
1         Buy         1
2           -         1
3           -         1
4        Sell         2
5         Buy         3
6           -         3
7        Sell         4
8           -         4
9        Sell         5
10          -         5

关于python - Pandas :有条件滚动计数v.2,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54989734/

10-12 20:13