我已经将数据文件加载到Python pandas数据框中。我有一个格式为2015-07-18 13:53:33.280
的datetime列。
我需要做的是创建一个新列,将其四舍五入到最接近的四分之一小时。因此,以上日期将四舍五入为2015-07-18 13:45:00.000
。
如何在 Pandas 中做到这一点?我尝试使用here的解决方案,但收到'Series' object has no attribute 'year'
错误。
最佳答案
假设您的系列由datetime
对象组成,则需要使用Series.apply
。例子 -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))
上面的示例始终四舍五入到前一个四分之一小时(行为类似于发言权功能)。
编辑
四舍五入到正确的四分之一小时(例如,如果它比上一个四分之一晚7分30秒,则显示下一个四分之一)。我们可以使用以下示例-
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))
上面只考虑了最近的秒,如果要考虑毫秒/微秒,则可以将其添加到上面的等式中,作为-
(float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)
关于python - 如何将日期时间列四舍五入到最近的四分之一小时,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/32344533/