我有一个时序数据集,如下所示,其中第一列是年份,第二个月,第三日期,随后的列是时序数据集:

1995   1    1     0.0   1.929  23.015   1.429   0.806   0.177   0.027
1995   1    2   0.000   1.097  12.954   0.000   0.196   0.361   0.233
1995   1    3   0.000  11.391   0.228   0.004   2.134  11.190   0.028
1995   1    4   0.504   0.373   0.197   0.333   5.894   0.003   0.098
1995   1    5   0.027  20.957   0.115   0.208   0.000   0.000   0.104
1995   1    6   0.043   9.952   0.042   2.499   1.406   0.000   0.748
....   .    .   .....   .....   .....   .....   .....   .....   .....
2000   12   31  50.98   23.23   98.78   34.23   34.54   45.54   34.21


我已经读过使用:

pd.read_csv('D:/test.csv')


我想读取数据列并从中查找年度最大值。关于如何对数据进行分组或拆分以查找每个变量的年度最大值的任何建议都将有所帮助。

最佳答案

IIUC,在给出示例数据框df的情况下,您可以通过以下方式读取它:

df = pd.read_csv('D:/test.csv', header=None)


然后按第0列(年)分组并获得每个值的最大值:

g = df.groupby(0).max()


返回:

      1  2      3       4       5      6      7      8      9
0
1995  1  6  0.504  20.957  23.015  2.499  5.894  11.19  0.748

关于python - 拆分时间序列以从Pandas数据框中查找年度最大值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33409217/

10-12 03:51
查看更多