region  year      val
1.0     2015.0    6.775457e+05
1.0     2016.0    6.819761e+05
1.0     2017.0    6.864065e+05
2.0     2015.0    6.175457e+05
2.0     2016.0    6.419761e+05
3.0     2017.0    6.564065e+05

在上面的DATAFRAMID中,我想计算连续行之间的百分比差值,但只计算相同的区域值。我试过了,但不确定是否有效。实现这一目标的最佳途径是什么?
df.groupby(['region', 'year'])['val'].pct_change()

最佳答案

您可以将DataFrameGroupBy.pct_change与groupby column一起使用:

df['new'] = df.groupby('region')['val'].pct_change()
print (df)
   region    year       val       new
0     1.0  2015.0  677545.7       NaN
1     1.0  2016.0  681976.1  0.006539
2     1.0  2017.0  686406.5  0.006496
3     2.0  2015.0  617545.7       NaN
4     2.0  2016.0  641976.1  0.039560
5     3.0  2017.0  656406.5       NaN

10-07 19:00
查看更多