我有一个时序数据集,如下所示,其中第一列是年份,第二个月,第三日期,随后的列是时序数据集:
1995 1 1 0.0 1.929 23.015 1.429 0.806 0.177 0.027
1995 1 2 0.000 1.097 12.954 0.000 0.196 0.361 0.233
1995 1 3 0.000 11.391 0.228 0.004 2.134 11.190 0.028
1995 1 4 0.504 0.373 0.197 0.333 5.894 0.003 0.098
1995 1 5 0.027 20.957 0.115 0.208 0.000 0.000 0.104
1995 1 6 0.043 9.952 0.042 2.499 1.406 0.000 0.748
.... . . ..... ..... ..... ..... ..... ..... .....
2000 12 31 50.98 23.23 98.78 34.23 34.54 45.54 34.21
我已经读过使用:
pd.read_csv('D:/test.csv')
我想读取数据列并从中查找年度最大值。关于如何对数据进行分组或拆分以查找每个变量的年度最大值的任何建议都将有所帮助。
最佳答案
IIUC,在给出示例数据框df
的情况下,您可以通过以下方式读取它:
df = pd.read_csv('D:/test.csv', header=None)
然后按第0列(年)分组并获得每个值的最大值:
g = df.groupby(0).max()
返回:
1 2 3 4 5 6 7 8 9
0
1995 1 6 0.504 20.957 23.015 2.499 5.894 11.19 0.748
关于python - 拆分时间序列以从Pandas数据框中查找年度最大值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33409217/