我每周有一些设备的日志数据。对于某些设备,它从星期一开始,对于某些设备,它在星期三开始,等等。有时此数据中有〜month的间隔,但是我希望DataFrame索引仍然包含每周具有NaN值的行。

我正在尝试在Python中使用asfreq('W'),但无法获得期望的结果。

例:

我有的:

Date            Some_Value
====            ==========
2019-04-10      2
2019-04-17      1
2019-04-24      3
2019-05-01      1
2019-05-08      3
2019-05-15      2
2019-06-06      3
2019-06-13      2


我期望/想要的(请注意带有NaN的2个新行):

Date            Some_Value
====            ==========
2019-04-10      2
2019-04-17      1
2019-04-24      3
2019-05-01      1
2019-05-08      3
2019-05-15      2
2019-05-22      NaN
2019-05-30      NaN
2019-06-06      3
2019-06-13      2


我从asfreq('W')得到什么:

Date            Some_Value
====            ==========
2019-03-31      NaN
2019-04-07      NaN
2019-04-14      NaN
...................


因此,我获得了所有NaN值以及每个星期日的日期。但是我不需要每个星期天的日期。我需要获取DataFrame的第一个日期(在很多时间序列的情况下,是熊猫groupby组中第一行的日期),并每周重新采样第一行的数据。

用pandas asfreq直接可以实现吗?用其他的熊猫方法吗?还是应该使用一些更复杂的自定义函数?

谢谢。

最佳答案

问题在于您的数据是星期三的第一个值,星期四的最后两个,所以asfreq返回NaN,因为尝试将其更改为星期日工作日频率-docs


  W-SUN每周频率(星期日)。与“ W”相同


一种可能的解决方案,但DatetimeIndex更改为星期日:

print (df.resample('W').first())
            Some_Value
Date
2019-04-14         2.0
2019-04-21         1.0
2019-04-28         3.0
2019-05-05         1.0
2019-05-12         3.0
2019-05-19         2.0
2019-05-26         NaN
2019-06-02         NaN
2019-06-09         3.0
2019-06-16         2.0


如果在asfreq中更改频率:

print (df.asfreq('W-Wed'))
            Some_Value
Date
2019-04-10         2.0
2019-04-17         1.0
2019-04-24         3.0
2019-05-01         1.0
2019-05-08         3.0
2019-05-15         2.0
2019-05-22         NaN
2019-05-29         NaN
2019-06-05         NaN
2019-06-12         NaN

print (df.asfreq('W-Thu'))
            Some_Value
Date
2019-04-11         NaN
2019-04-18         NaN
2019-04-25         NaN
2019-05-02         NaN
2019-05-09         NaN
2019-05-16         NaN
2019-05-23         NaN
2019-05-30         NaN
2019-06-06         3.0
2019-06-13         2.0

关于python - 每周更新一次的 Pandas ,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57490946/

10-11 16:13