我有一堆需要与Pandas重新映射的天气数据。
我正在努力将第一列“时间”转换为日期时间索引。
我一直在扫描论坛,但无法解决问题。
这是数据示例:
Time TemperatureF DewpointF
1/1/2015 0:01 31.7 27.1
1/1/2015 0:06 31.7 27.4
1/1/2015 0:11 31.6 27.3
1/1/2015 0:16 31.6 27.3
1/1/2015 0:21 31.5 26.9
1/1/2015 0:26 31.5 26.9
1/1/2015 0:31 31.5 26.9
这是我用来重新索引的代码的最新版本。
任何帮助将不胜感激!
df = df.set_index('Time')
df.index = df.index.to_datetime()
最佳答案
我认为您可以尝试to_datetime
和set_index
:
print df
Time TemperatureF DewpointF
0 1/1/2015 0:01 31.7 27.1
1 1/1/2015 0:06 31.7 27.4
2 1/1/2015 0:11 31.6 27.3
3 1/1/2015 0:16 31.6 27.3
4 1/1/2015 0:21 31.5 26.9
5 1/1/2015 0:26 31.5 26.9
6 1/1/2015 0:31 31.5 26.9
#check column names
print df.columns
Index([u'Time', u'TemperatureF', u'DewpointF'], dtype='object')
#first number is month
df['Time'] = pd.to_datetime(df['Time'], format='%m/%d/%Y %H:%M') #no double []
df.set_index('Time', inplace=True)
print df
TemperatureF DewpointF
Time
2015-01-01 00:01:00 31.7 27.1
2015-01-01 00:06:00 31.7 27.4
2015-01-01 00:11:00 31.6 27.3
2015-01-01 00:16:00 31.6 27.3
2015-01-01 00:21:00 31.5 26.9
2015-01-01 00:26:00 31.5 26.9
2015-01-01 00:31:00 31.5 26.9
print df.index
DatetimeIndex(['2015-01-01 00:01:00', '2015-01-01 00:06:00',
'2015-01-01 00:11:00', '2015-01-01 00:16:00',
'2015-01-01 00:21:00', '2015-01-01 00:26:00',
'2015-01-01 00:31:00'],
dtype='datetime64[ns]', name=u'Time', freq=None)
如果仍然为
ValueError
,请尝试添加参数errors='coerce'
,以将不匹配格式的字符串转换为NaT
:df['Time'] = pd.to_datetime(df['Time'], format='%d/%m/%Y %H:%M', errors='coerce')