假设我有一个 timestamp
的数组(例如以 datetime
或 numpy.datetime64
给出)。此外,每个条目代表一个事件。我想以每小时为单位对事件进行存储;即计算每小时发生的事件数。有没有直接的方法来做到这一点?一些 Numpy/Pandas 魔法?或者是唯一的方法是将 timestamp
转换为秒并将秒存储起来,如建议的 here
最佳答案
如果您使用的是 Pandas,并且您有一个具有 DateTime 索引的时间序列,则可以使用 resample
方法和 how='count'
。例如,下面的 rng
是时间戳的范围,ts
是使用 rng
作为索引的一系列值。 (对于您的计算,时间序列中的值无关紧要。)在此示例中,每小时有 360 个“事件”,因此预期结果为每小时 360,除了最后一个。
创建一些示例数据:
In [71]: import pandas as pd
In [72]: rng = pd.date_range('1/1/2011', periods=10000, freq='10S')
In [73]: ts = pd.Series(np.random.randint(0, 5, len(rng)), index=rng)
In [74]: ts
Out[74]:
2011-01-01 00:00:00 2
2011-01-01 00:00:10 0
2011-01-01 00:00:20 1
2011-01-01 00:00:30 4
2011-01-01 00:00:40 1
2011-01-01 00:00:50 1
2011-01-01 00:01:00 2
2011-01-01 00:01:10 0
2011-01-01 00:01:20 3
2011-01-01 00:01:30 4
2011-01-01 00:01:40 2
2011-01-01 00:01:50 4
2011-01-01 00:02:00 1
2011-01-01 00:02:10 0
2011-01-01 00:02:20 4
...
2011-01-02 03:44:10 2
2011-01-02 03:44:20 0
2011-01-02 03:44:30 3
2011-01-02 03:44:40 0
2011-01-02 03:44:50 0
2011-01-02 03:45:00 4
2011-01-02 03:45:10 3
2011-01-02 03:45:20 2
2011-01-02 03:45:30 0
2011-01-02 03:45:40 1
2011-01-02 03:45:50 0
2011-01-02 03:46:00 2
2011-01-02 03:46:10 0
2011-01-02 03:46:20 2
2011-01-02 03:46:30 2
Freq: 10S, Length: 10000
使用
resample
方法计算每小时的事件数。第一个参数 'H'
表示我们正在重新采样为每小时费率。In [75]: ts.resample('H', how='count')
Out[75]:
2011-01-01 00:00:00 360
2011-01-01 01:00:00 360
2011-01-01 02:00:00 360
2011-01-01 03:00:00 360
2011-01-01 04:00:00 360
2011-01-01 05:00:00 360
2011-01-01 06:00:00 360
2011-01-01 07:00:00 360
2011-01-01 08:00:00 360
2011-01-01 09:00:00 360
2011-01-01 10:00:00 360
2011-01-01 11:00:00 360
2011-01-01 12:00:00 360
2011-01-01 13:00:00 360
2011-01-01 14:00:00 360
2011-01-01 15:00:00 360
2011-01-01 16:00:00 360
2011-01-01 17:00:00 360
2011-01-01 18:00:00 360
2011-01-01 19:00:00 360
2011-01-01 20:00:00 360
2011-01-01 21:00:00 360
2011-01-01 22:00:00 360
2011-01-01 23:00:00 360
2011-01-02 00:00:00 360
2011-01-02 01:00:00 360
2011-01-02 02:00:00 360
2011-01-02 03:00:00 280
Freq: H, dtype: int64
关于python - 计算 datetime/numpy 中给出的每小时事件数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/28564254/