我正在处理一个熊猫系列,我想对该数据重新采样以获取10秒间隔。我正在处理的系列:
volSeries.head(20)
Time
2018-10-14 12:00:00 6.0
2018-10-14 12:00:02 5.0
2018-10-14 12:02:32 6.0
2018-10-14 12:02:57 5.0
2018-10-14 12:03:22 6.0
2018-10-14 12:03:27 5.0
2018-10-14 12:17:42 6.0
2018-10-14 12:17:47 5.0
2018-10-14 12:17:57 5.0
2018-10-14 12:18:07 6.0
2018-10-14 12:18:12 5.0
2018-10-14 12:18:17 6.0
2018-10-14 12:18:32 5.0
2018-10-14 12:18:47 6.0
2018-10-14 12:18:57 5.0
2018-10-14 12:19:27 6.0
2018-10-14 12:19:37 5.0
2018-10-14 12:20:37 6.0
2018-10-14 12:20:57 5.0
2018-10-14 12:21:07 6.0
Name: Value, dtype: float64
当我尝试重新采样时,输出呈线性增加,与数据不匹配:
volumeResampler = volSeries.resample('10S')
resampledVolumeData = volumeResampler.interpolate('linear')
resampledVolumeData.head(20)
Time
2018-10-14 12:00:00 6.000000
2018-10-14 12:00:10 6.198148
2018-10-14 12:00:20 6.396296
2018-10-14 12:00:30 6.594444
2018-10-14 12:00:40 6.792593
2018-10-14 12:00:50 6.990741
2018-10-14 12:01:00 7.188889
2018-10-14 12:01:10 7.387037
2018-10-14 12:01:20 7.585185
2018-10-14 12:01:30 7.783333
2018-10-14 12:01:40 7.981481
2018-10-14 12:01:50 8.179630
2018-10-14 12:02:00 8.377778
2018-10-14 12:02:10 8.575926
2018-10-14 12:02:20 8.774074
2018-10-14 12:02:30 8.972222
2018-10-14 12:02:40 9.170370
2018-10-14 12:02:50 9.368519
2018-10-14 12:03:00 9.566667
2018-10-14 12:03:10 9.764815
Freq: 10S, Name: Value, dtype: float64
您可以看到,在重采样前后比较图形时,显然插值不正确。
重采样之前:
重采样后:
最佳答案
错误似乎与我插值的频率有关。我要插值的值之间的最小间距为2秒,相邻点之间的最大值为37080。
如果我在
关于python - Pandas 重新采样器插值未正确插值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/60289008/