假设s = pd.Series(range(50))
0 0
1 1
2 2
3 3
...
48 48
49 49
如何获得由每n行之和组成的新系列?
当n = 5时,预期结果如下所示;
0 10
1 35
2 60
3 85
...
8 210
9 235
如果使用loc或iloc并通过python循环,当然可以完成,但是我相信可以简单地以Pandas的方式完成。
另外,这是一个非常简化的示例,我不希望对序列进行解释:)。我正在尝试的实际数据系列具有时间索引和每秒发生的事件数作为值。
最佳答案
GroupBy.sum
N = 5
s.groupby(s.index // N).sum()
0 10
1 35
2 60
3 85
4 110
5 135
6 160
7 185
8 210
9 235
dtype: int64
将索引分为5组,并相应地分组。numpy.reshape
+ sum
如果大小是N的倍数(或5),则可以调整形状并添加:s.values.reshape(-1, N).sum(1)
# array([ 10, 35, 60, 85, 110, 135, 160, 185, 210, 235])
numpy.add.at
b = np.zeros(len(s) // N)
np.add.at(b, s.index // N, s.values)
b
# array([ 10., 35., 60., 85., 110., 135., 160., 185., 210., 235.])