我有一个叫matches.csv
的IPL Data Set,我要从Kaggle那里获取,我试图从中找出最大比赛数的位置。
下面的代码为我提供了比赛次数的正确值,但是我想检查最大比赛次数的体育场名称。
matches['venue'].value_counts().max()
这给了我66
预期输出如下:
M Chinnaswamy Stadium 66
另外,如果可能的话,我想获得该球场上一场比赛的所有细节。
以下是数据框的标题:
id season city date team1 team2 toss_winner toss_decision result dl_applied winner win_by_runs win_by_wickets player_of_match venue umpire1 umpire2 umpire3
0 1 2017 Hyderabad 2017-04-05 Sunrisers Hyderabad Royal Challengers Bangalore Royal Challengers Bangalore field normal 0 Sunrisers Hyderabad 35 0 Yuvraj Singh Rajiv Gandhi International Stadium, Uppal AY Dandekar NJ Llong NaN
1 2 2017 Pune 2017-04-06 Mumbai Indians Rising Pune Supergiant Rising Pune Supergiant field normal 0 Rising Pune Supergiant 0 7 SPD Smith Maharashtra Cricket Association Stadium A Nand Kishore S Ravi NaN
2 3 2017 Rajkot 2017-04-07 Gujarat Lions Kolkata Knight Riders Kolkata Knight Riders field normal 0 Kolkata Knight Riders 0 10 CA Lynn Saurashtra Cricket Association Stadium Nitin Menon CK Nandan NaN
最佳答案
找出最多可进行比赛的地方
>>matches['venue'].value_counts().head(1)
M Chinnaswamy Stadium 66
请注意,
value_counts
已经按降序对数据进行排序,因此第一条记录始终是最大值。获取该体育场上一场比赛的所有详细信息。
>>matches[matches['venue']=='M Chinnaswamy Stadium'].sort_values('date',ascending=False).head(1)
id season city date team1 team2 toss_winner toss_decision result dl_applied winner win_by_runs win_by_wickets player_of_match venue umpire1 umpire2 umpire3
57 58 2017 Bangalore 2017-05-19 Kolkata Knight Riders Mumbai Indians Mumbai Indians field normal 0 Mumbai Indians 0 6 KV Sharma M Chinnaswamy Stadium NJ Llong Nitin Menon NaN
在这里,您可以查询场所名称,然后在日期列中输入
sort_values
并获取第一个结果,从而获得最新的匹配详细信息,然后在日期列中将ascending=False
切成数据框的一部分。注意我使用了最新的kaggle数据集。值可能已更改,但是解决方案保持不变。
希望这可以帮助。