我想计算足球队的动量指标,在这种情况下,某支球队在最近3场比赛中得到的分数。我的数据如下:

    HomeTeam    AwayTeam    H_Pts   A_Pts
    Barcelona   Getafe      3       0
    Levante     Barcelona   1       1
    Barcelona   Las Palmas  3       0
    Las Palmas  Barcelona   3       0
    Barcelona   Madrid      1       1


这只是一些巴塞罗那比赛的示例。所以基本上我想要结束的是另外两列(例如Home_Momentum,Away_Momentum),这些列加起来了这支特定球队在最近3场比赛中得到的积分(不包括当前的积分)。所以它应该看起来像这样:

    HomeTeam    AwayTeam    H_Pts   A_Pts    Home_Momentum    Away_Momentum
    Barcelona   Getafe      3       0        NaN              NaN
    Levante     Barcelona   1       1        NaN              NaN
    Barcelona   Las Palmas  3       0        NaN              NaN
    Las Palmas  Barcelona   3       0        x                7
    Barcelona   Madrid      1       1        4                y


其中x(y)是拉斯帕尔马斯(马德里)在最近3场比赛中收集的积分之和。

到目前为止,我想出的是:

data["Home_Momentum"] = data.groupby("HomeTeam")["H_Pts"].apply(lambda x: x.rolling(3).sum().shift())


但是,这样做的问题是它没有考虑球队的客场比赛。

您有任何解决方法的想法吗?

最佳答案

重命名列为多索引。堆栈并滚动

df.columns = [
    ['Team', 'Team', 'Points', 'Points'],
    ['Home', 'Away', 'Home', 'Away']
]

d1 = df.stack()

mom = d1.groupby('Team').Points.apply(lambda x: x.shift().rolling(3).sum())

d1.assign(Momentum=mom).unstack()

  Points             Team             Momentum
    Away Home        Away        Home     Away Home
0      0    3      Getafe   Barcelona      NaN  NaN
1      1    1   Barcelona     Levante      NaN  NaN
2      0    3  Las Palmas   Barcelona      NaN  NaN
3      0    3   Barcelona  Las Palmas      7.0  NaN
4      1    1      Madrid   Barcelona      NaN  4.0




我们也可以包括少于3个游戏的总和。

df.columns = [
    ['Team', 'Team', 'Points', 'Points'],
    ['Home', 'Away', 'Home', 'Away']
]

d1 = df.stack()

mom = d1.groupby('Team').Points.apply(lambda x: x.shift().rolling(3, 1).sum())

d1.assign(Momentum=mom).unstack()

  Points             Team             Momentum
    Away Home        Away        Home     Away Home
0      0    3      Getafe   Barcelona      NaN  NaN
1      1    1   Barcelona     Levante      3.0  NaN
2      0    3  Las Palmas   Barcelona      NaN  4.0
3      0    3   Barcelona  Las Palmas      7.0  0.0
4      1    1      Madrid   Barcelona      NaN  4.0

09-06 07:49
查看更多