我已经将数据文件加载到Python pandas数据框中。我有一个格式为2015-07-18 13:53:33.280的datetime列。

我需要做的是创建一个新列,将其四舍五入到最接近的四分之一小时。因此,以上日期将四舍五入为2015-07-18 13:45:00.000

如何在 Pandas 中做到这一点?我尝试使用here的解决方案,但收到'Series' object has no attribute 'year'错误。

最佳答案

假设您的系列由datetime对象组成,则需要使用Series.apply。例子 -

import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))

上面的示例始终四舍五入到前一个四分之一小时(行为类似于发言权功能)。

编辑

四舍五入到正确的四分之一小时(例如,如果它比上一个四分之一晚7分30秒,则显示下一个四分之一)。我们可以使用以下示例-
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))

上面只考虑了最近的秒,如果要考虑毫秒/微秒,则可以将其添加到上面的等式中,作为-(float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)

关于python - 如何将日期时间列四舍五入到最近的四分之一小时,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/32344533/

10-11 22:51