我正在使用pandas DataFrame
,该熊猫的索引会跳过一个或多个时间步长(在我的情况下为一个或多个小时)。我想知道是否有找到这些时间步跳过并可能插入这些缺少的时间步的方法。
我所拥有的例子:
[In]: df
[Out]:
point_value
Timestamp
2016-01-01 00:00:00 2550.63
2016-01-01 01:00:00 2535.97
2016-01-01 02:00:00 2538.25
2016-01-01 04:00:00 2548.63
2016-01-01 05:00:00 2555.16
我要寻找的示例:
[In]: df
[Out]:
point_value
Timestamp
2016-01-01 02:00:00 2538.25
2016-01-01 04:00:00 2548.63
理想情况下,找到这些时间步长差距后,我想用这样的时间步长来填补它们:
[In]: df
[Out]:
point_value
Timestamp
2016-01-01 00:00:00 2550.63
2016-01-01 01:00:00 2535.97
2016-01-01 02:00:00 2538.25
2016-01-01 03:00:00 NaN
2016-01-01 04:00:00 2548.63
2016-01-01 05:00:00 2555.16
我搜索了堆栈溢出,似乎找不到与索引本身有关的内容。如果这是一个重复的问题,那么我很乐意将其记下来并查找结果。我在这里先向您的帮助表示感谢。
最佳答案
DataFrame.reindex
应该可以满足您的需求。只需定义一个新索引并将其应用于您的数据框即可:
new_index = pd.date_range(start='1/1/2016 0:0:0', end='1/1/2016 5:0:0', periods=6)
df.reindex(index=new_index)
关于python - 查找跳过的索引时间步长并将值填充到Pandas DataFrame中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57913103/