我的目标是将EURUSDdata(每日)读入一个时间序列对象,在该对象中,我可以根据不规则的ish时间帧轻松地对信息进行切片、骰子、聚合和重采样这很可能是一个简单的答案我正在使用Python进行数据分析,但似乎无法弥合这一差距。
下载并解压缩data后,我运行以下代码:
>>> import pandas as pd
>>> df = pd.read_csv('EURUSD_day.csv', parse_dates = {'Timestamp' : ['<DATE>', '<TIME>']}, index_col = 'Timestamp')
到现在为止,一直都还不错。我现在有一个很好的数据帧,时间戳作为索引。
然而,这本书暗示(第295页),我应该能够将数据子集如下,以查看2001年的所有数据。
>>> df['2001']
但是,那不管用。
读到这个question and answer告诉我可以导入时间戳:
>>> from pandas.lib import Timestamp
>>> s = df['<CLOSE>']
似乎在某一天起作用:
>>> s[Timestamp('2001-01-04)]
0.9506999999
然而,下面的代码为我所期望的2001年的所有数据范围产生了一个值。
>>> s[Timestamp('2001')]
0.8959
我知道我错过了一些简单的,基本的东西。有人能帮忙吗?
谢谢您,
布瑞恩
最佳答案
PG 295上的示例是在Stand对象上执行的,这就是为什么索引与年一起工作的原因。对于数据帧,您希望df.ix['2001']
获得相同的结果。