我已经阅读了有关此主题的其他问题,但它们似乎不适用于我的数据集:
Timestamp Bid.price Ask.price Bid.volume Ask.volume
20070313 07:01:04:762 11.14122 11.14478 4.539397 1.891416
20070313 07:01:07:608 11.13930 11.14670 1.277812 3.066750
20070313 07:01:08:701 11.14095 11.14505 0.050396 0.050396
20070313 07:01:11:275 11.14098 11.14502 0.226505 0.543613
20070313 07:01:13:884 11.13930 11.14670 0.322856 0.774855
20070313 07:01:16:588 11.13930 11.14670 0.405654 0.973569
我努力了:
as.POSIXct(fx[,1], format="%y%m%d %H:%M:%S:%OS3")
as.POSIXct(paste(fx[,1]), format="%y%m%d %H:%M:%S:%OS3")
as.POSIXct(paste(fx[,1]), format="%y%m%d %H:%M:%S")
但是我得到的只是
NA
...我该如何解决?
这是数据集:
fx <- structure(list(Timestamp = c("20070313 07:01:04:762", "20070313 07:01:07:608",
"20070313 07:01:08:701", "20070313 07:01:11:275", "20070313 07:01:13:884",
"20070313 07:01:16:588"), Bid.price = c(11.14122, 11.1393, 11.14095,
11.14098, 11.1393, 11.1393), Ask.price = c(11.14478, 11.1467,
11.14505, 11.14502, 11.1467, 11.1467), Bid.volume = c(4.5393967628479,
1.27781200408936, 0.0503959991037846, 0.226504996418953, 0.3228560090065,
0.405654013156891), Ask.volume = c(1.89141595363617, 3.06675004959106,
0.0503959991037846, 0.543613016605377, 0.774855017662048, 0.973568975925446
)), .Names = c("Timestamp", "Bid.price", "Ask.price", "Bid.volume",
"Ask.volume"), row.names = c(NA, 6L), class = "data.frame")
最佳答案
因为Timestamp
在整秒和小数秒之间有一个:
,并且没有时间解析字符串(“转换规范”,例如%Y
),但没有整秒,所以您需要更改最后一个:
转换为.
,因此您可以使用%OS
对其进行解析。 sub
可以照顾它,寻找
冒号:
后跟3位数字\\d{3}
,已捕获(...)
然后是$
行的结尾,
并替换为
期间.
其次是被俘虏的团体。
此外,如果要查看解析的秒数,则需要设置digits.secs
选项:
options(digits.secs = 3)
strptime(sub(':(\\d{3})$', '.\\1', fx$Timestamp), '%Y%m%d %H:%M:%OS')
# [1] "2007-03-13 07:01:04.762 EDT" "2007-03-13 07:01:07.608 EDT" "2007-03-13 07:01:08.700 EDT"
# [4] "2007-03-13 07:01:11.275 EDT" "2007-03-13 07:01:13.884 EDT" "2007-03-13 07:01:16.588 EDT"
请注意,
strptime
会插入本地时区(目前对我来说是EDT
),但是您可以使用其tz
参数将其设置为任意值(或对数据来说应该是该值)。