我有一个以DateTime为索引的熊猫时间序列数据帧。我试图用长期每月平均值代替每日价值。例如:

如果我的2年时间序列数据帧是这样的:

df = pd.DataFrame({'data':np.random.rand(731)},index=pd.date_range('2000',periods=731))


月平均值:

mon_mean = df.groupby(df.index.month).mean()


长期平均水平如下:

1   0.497286
2   0.536500
3   0.468002
4   0.477769
5   0.543201
6   0.520326
7   0.460261
8   0.524335
9   0.521869
10  0.516423
11  0.458476
12  0.494853


所以我想要用一月的长期平均值替换一月的所有每日值,即0.497286,依此类推。但是我无法做到这一点。任何帮助/建议都将受到高度赞赏。

最佳答案

使用GroupBy.transform设置由聚合值填充的新列:

np.random.seed(2019)

df = pd.DataFrame({'data':np.random.rand(731)},index=pd.date_range('2000',periods=731))

df['mon'] = df.groupby(df.index.month)['data'].transform('mean')
print (df)

                data       mon
2000-01-01  0.903482  0.482155
2000-01-02  0.393081  0.482155
2000-01-03  0.623970  0.482155
2000-01-04  0.637877  0.482155
2000-01-05  0.880499  0.482155
             ...       ...
2001-12-27  0.755412  0.519518
2001-12-28  0.858582  0.519518
2001-12-29  0.884738  0.519518
2001-12-30  0.265324  0.519518
2001-12-31  0.948137  0.519518

[731 rows x 2 columns]

关于python - 如何相对于月份替换 Pandas 数据框行值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57588006/

10-10 13:16
查看更多