我在这里关注了许多问题,询问如何将字符 vector 转换为日期时间类。我经常看到2种方法,即strptime和as.POSIXct / as.POSIXlt方法。我看了两个功能,但不清楚有什么区别。
strptime
function (x, format, tz = "")
{
y <- .Internal(strptime(as.character(x), format, tz))
names(y$year) <- names(x)
y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>
as.POSIXct
function (x, tz = "", ...)
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>
as.POSIXlt
function (x, tz = "", ...)
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>
进行微基准测试,看看是否存在性能差异:
library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)
Unit: milliseconds
expr min lq median uq max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2 strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422
strptime似乎更快。那有什么呢?为什么会有2个相似的功能,或者我错过了它们之间的差异?
最佳答案
好的,这些功能可以做不同的事情。
首先,有两种内部的日期/时间实现:POSIXct
和POSIXlt
(存储自UNIX纪元以来的秒数)以及其他存储日期,时间,月份,小时,分钟,秒等的列表。strptime
是将字符 vector (多种格式)直接转换为POSIXlt
格式的功能。as.POSIXlt
将各种数据类型转换为POSIXlt
。它试图变得聪明并且做明智的事情-在字符的情况下,它充当strptime
的包装器。as.POSIXct
将各种数据类型转换为POSIXct
。它还尝试变得聪明并且做明智的事情-对于字符,它首先运行strptime
,然后执行从POSIXlt
到POSIXct
的转换。strptime
更快是有道理的,因为strptime
仅处理字符输入,而其他尝试从输入类型中确定使用哪种方法。这也应该更安全一些,因为处理意外数据只会产生错误,而不是尝试做您可能不想要的聪明事情。
关于r - 用于将字符向量转换为POSIXct/POSIXlt的as.POSIXct/as.POSIXlt和strptime之间的区别,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10699511/