我得到以下DataFrame(样本):

               date  Value1 Value2
2007-05-25 11:50:00   1       15
2007-05-25 12:00:00   2       30
2007-05-25 12:10:00   3       25
2007-05-25 12:50:00   2       34
2007-05-25 13:00:00   9       35
2007-05-25 13:10:00   6       10


您可以看到从2007-05-25 12:20:002007-05-25 12:40:00的数据丢失。我想做的是一个像这样的数据框:

               date  Value1 Value2
2007-05-25 11:50:00   1       15
2007-05-25 12:00:00   2       30
2007-05-25 12:10:00   3       25
2007-05-25 12:20:00   NaN     NaN
2007-05-25 12:30:00   NaN     NaN
2007-05-25 12:40:00   NaN     NaN
2007-05-25 12:50:00   2       34
2007-05-25 13:00:00   9       35
2007-05-25 13:10:00   6       10


通常,我想看看我什么时候没有数据。我在想这样的事情:

DataRange = pd.date_range(data.index[0],data.index[-1])
data = data.reindex(DataRange, fill_value=nan)


但是据我了解,通过测试date_range可以理解该函数的名称,即它的日期范围。所以我想知道分钟是否与分钟类似(在我的情况下为10分钟),或者是否有另一种方式来实现。

最佳答案

调用resample并将规则传递为“ 10Min”:

In [309]:

df.resample('10Min')
Out[309]:
                     Value1  Value2
date
2007-05-25 11:50:00       1      15
2007-05-25 12:00:00       2      30
2007-05-25 12:10:00       3      25
2007-05-25 12:20:00     NaN     NaN
2007-05-25 12:30:00     NaN     NaN
2007-05-25 12:40:00     NaN     NaN
2007-05-25 12:50:00       2      34
2007-05-25 13:00:00       9      35
2007-05-25 13:10:00       6      10


可以找到一些示例here

10-08 08:09
查看更多