我正在处理一个包含三列的数据集; roadType(字符串)、汽车和公共(public)汽车(整数值)。

data = [["A", 5, 6], ["B", 7, 3], ["C", 9, 6], ["B", 2, 8], ["A", 4, 8], ["C", 8, 1], ["B", 1, 0]]

现在我想根据第一列中的类型对行数据进行分组,然后从这些组中,我想从两列中找到最高值。
即预期的输出值类似于
output = [["A", 5, 8], ["B", 7, 8], ["C", 9, 6]]

如何使用 python 数据分析库 pandas 或任何其他库?

最佳答案

试试这个:

In [31]: d = pd.DataFrame(data, columns=['roadType','cars','buses'])

In [32]: d
Out[32]:
  roadType  cars  buses
0        A     5      6
1        B     7      3
2        C     9      6
3        B     2      8
4        A     4      8
5        C     8      1
6        B     1      0

In [33]: d.groupby('roadType').max().reset_index()
Out[33]:
  roadType  cars  buses
0        A     5      8
1        B     7      8
2        C     9      6

关于python - 如何通过使用python对行值进行分组来查找多列中的最高值?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40637729/

10-13 06:32