我每周有一些设备的日志数据。对于某些设备,它从星期一开始,对于某些设备,它在星期三开始,等等。有时此数据中有〜month的间隔,但是我希望DataFrame索引仍然包含每周具有NaN值的行。
我正在尝试在Python中使用asfreq('W')
,但无法获得期望的结果。
例:
我有的:
Date Some_Value
==== ==========
2019-04-10 2
2019-04-17 1
2019-04-24 3
2019-05-01 1
2019-05-08 3
2019-05-15 2
2019-06-06 3
2019-06-13 2
我期望/想要的(请注意带有NaN的2个新行):
Date Some_Value
==== ==========
2019-04-10 2
2019-04-17 1
2019-04-24 3
2019-05-01 1
2019-05-08 3
2019-05-15 2
2019-05-22 NaN
2019-05-30 NaN
2019-06-06 3
2019-06-13 2
我从
asfreq('W')
得到什么:Date Some_Value
==== ==========
2019-03-31 NaN
2019-04-07 NaN
2019-04-14 NaN
...................
因此,我获得了所有
NaN
值以及每个星期日的日期。但是我不需要每个星期天的日期。我需要获取DataFrame的第一个日期(在很多时间序列的情况下,是熊猫groupby
组中第一行的日期),并每周重新采样第一行的数据。用pandas
asfreq
直接可以实现吗?用其他的熊猫方法吗?还是应该使用一些更复杂的自定义函数?谢谢。
最佳答案
问题在于您的数据是星期三的第一个值,星期四的最后两个,所以asfreq返回NaN
,因为尝试将其更改为星期日工作日频率-docs:
W-SUN每周频率(星期日)。与“ W”相同
一种可能的解决方案,但DatetimeIndex
更改为星期日:
print (df.resample('W').first())
Some_Value
Date
2019-04-14 2.0
2019-04-21 1.0
2019-04-28 3.0
2019-05-05 1.0
2019-05-12 3.0
2019-05-19 2.0
2019-05-26 NaN
2019-06-02 NaN
2019-06-09 3.0
2019-06-16 2.0
如果在
asfreq
中更改频率:print (df.asfreq('W-Wed'))
Some_Value
Date
2019-04-10 2.0
2019-04-17 1.0
2019-04-24 3.0
2019-05-01 1.0
2019-05-08 3.0
2019-05-15 2.0
2019-05-22 NaN
2019-05-29 NaN
2019-06-05 NaN
2019-06-12 NaN
print (df.asfreq('W-Thu'))
Some_Value
Date
2019-04-11 NaN
2019-04-18 NaN
2019-04-25 NaN
2019-05-02 NaN
2019-05-09 NaN
2019-05-16 NaN
2019-05-23 NaN
2019-05-30 NaN
2019-06-06 3.0
2019-06-13 2.0
关于python - 每周更新一次的 Pandas ,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57490946/