我有一个以DateTime为索引的熊猫时间序列数据帧。我试图用长期每月平均值代替每日价值。例如:
如果我的2年时间序列数据帧是这样的:
df = pd.DataFrame({'data':np.random.rand(731)},index=pd.date_range('2000',periods=731))
月平均值:
mon_mean = df.groupby(df.index.month).mean()
长期平均水平如下:
1 0.497286
2 0.536500
3 0.468002
4 0.477769
5 0.543201
6 0.520326
7 0.460261
8 0.524335
9 0.521869
10 0.516423
11 0.458476
12 0.494853
所以我想要用一月的长期平均值替换一月的所有每日值,即0.497286,依此类推。但是我无法做到这一点。任何帮助/建议都将受到高度赞赏。
最佳答案
使用GroupBy.transform
设置由聚合值填充的新列:
np.random.seed(2019)
df = pd.DataFrame({'data':np.random.rand(731)},index=pd.date_range('2000',periods=731))
df['mon'] = df.groupby(df.index.month)['data'].transform('mean')
print (df)
data mon
2000-01-01 0.903482 0.482155
2000-01-02 0.393081 0.482155
2000-01-03 0.623970 0.482155
2000-01-04 0.637877 0.482155
2000-01-05 0.880499 0.482155
... ...
2001-12-27 0.755412 0.519518
2001-12-28 0.858582 0.519518
2001-12-29 0.884738 0.519518
2001-12-30 0.265324 0.519518
2001-12-31 0.948137 0.519518
[731 rows x 2 columns]
关于python - 如何相对于月份替换 Pandas 数据框行值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57588006/