我有两个数据框,其中一个球员,带有他们的俱乐部ID和回合,另一个带有比赛,带有得分和回合。

玩家| club_id |回合
一个| 16 | 1个
b | 13 | 1个
c | 12 | 1个
一个| 16 | 2
...

-------

home_club_id | away_club_id | home_club_score | away_club_score |回合
16 | 13 | 1 | 2 | 1
15 | 1 | 4 | 0 | 1
12 | 2 | 1 | 1 | 1
12 | 16 | 2 | 2 | 2
...

我想合并两个数据框,以查看玩家是否在家中比赛以及比赛的得分。
最终的数据帧可能是这样的:

球员| club_id |回合|主场|得分|对手得分
| 16 | 1 |是| 1 | 2
b | 13 | 1 |否| 2 | 1个
| 16 | 2 |否| 2 | 2
...


我试图将home_club_id更改为club_id并与on =[round, club_id]合并,但是我没有找到同时合并住所和外地的方法

最佳答案

为了获得所需的最终帧,您可以重新排列数据。

首先,假设您的帧称为player_frameround_frame

from io import StringIO

import pandas as pd

player_data = StringIO('''Player club_id  round
a          16     1
b          13     1
c          12     1
a          16     2''')
player_frame = pd.read_csv(player_data, sep='\s+')

round_data = StringIO('''home_club_id away_club_id home_club_score away_club_score round
16               13          1           2               1
15               1           4           0               1
12               2           1           1               1
12               16          2           2               2''')
round_frame = pd.read_csv(round_data, sep='\s+')


然后,我们可以拉出列以分别引用本垒打和离开的数据,重命名它们以使其匹配,并标记该行是否为本垒打。

home_values = round_frame[['home_club_id', 'home_club_score', 'away_club_score', 'round']]\
                         .rename({'home_club_id': 'club_id',
                                  'home_club_score': 'score',
                                  'away_club_score': 'opponent_score'},
                                 axis=1)\
                         .assign(home='yes')

away_values = round_frame[['away_club_id', 'away_club_score', 'home_club_score', 'round']]\
                         .rename({'away_club_id': 'club_id',
                                  'home_club_score': 'opponent_score',
                                  'away_club_score': 'score'},
                                 axis=1)\
                         .assign(home='no')


然后,我们可以concat这两个并合并为player_frame

final_values = pd.concat([home_values, away_values], ignore_index=True).merge(player_frame)


这给了我们:

   club_id  score  opponent_score  round home Player
0       16      1               2      1  yes      a
1       12      1               1      1  yes      c
2       13      2               1      1   no      b
3       16      2               2      2   no      a

关于python - 合并在列内迭代的两个数据框,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56131746/

10-11 07:00
查看更多