我正在使用 sqldf 库来返回一个具有不同值的数据框,并且只有日期列的最大值。数据框看起来像这样

+------+----------+--------+-----------------+
| NAME |   val1   |  val2  |      DATE       |
+------+----------+--------+-----------------+
| A    |  23.7228 | 0.5829 | 11/19/2014 8:17 |
| A    |  23.7228 | 0.5829 | 11/12/2014 8:16 |
+------+----------+--------+-----------------+

当我尝试运行以下代码以获取具有最大日期的不同值时
df <-  sqldf("SELECT DISTINCT NAME, val1, val2, MAX(DATE) FROM Table")

我得到这个作为输出。
+------+----------+--------+-----------------+
| NAME |   val1   |  val2  | MAX(DATE)       |
+------+----------+--------+-----------------+
| A    |  23.7228 | 0.5829 | 1416406625      |
+------+----------+--------+-----------------+

请让我知道如何转换最后一列,这是一个整数以恢复我的日期时间格式。

最佳答案

下次请以可重现的形式提供您的意见。这次我已经在下面为你做了。此外,问题中的 SQL 代码有一个 SQLite 语法错误,我已在下面修复。

最简单的方法是对输出列使用名称 DATE,在这种情况下,sqldf 会认为它与 DATE 输入列的类型相同。 SQLite 没有日期和时间类型,因此在将 sqldf 与 SQLite 一起使用时,sqldf 无法知道返回的是日期时间。 sqldf 使用一些启发式方法来猜测,例如刚才讨论的那个。

library(sqldf)

Lines <- "NAME,val1,val2,DATE
A,23.7228,0.5829,11/19/2014 8:17
A,23.7228,0.5829,11/12/2014 8:16"

Table <- read.csv(text = Lines, as.is = TRUE)
Table$DATE <- as.POSIXct(Table$DATE, format = "%m/%d/%Y %H:%M")

sqldf("SELECT DISTINCT NAME, val1, val2, MAX(DATE) DATE FROM 'Table'")

给予:
   NAME    val1   val2                DATE
1     A 23.7228 0.5829 2014-11-19 08:17:00

如果我们将 H2 与 sqldf 一起使用,那么我们就不会遇到这些问题,因为 H2 确实支持日期和时间类型,因此 sqldf 不必猜测。此外,您的 SQL 查询的语法与 H2 中的一样。使用上面显示的 Table data.frame:
library(RH2)
library(sqldf)

sqldf("SELECT DISTINCT NAME, val1, val2, MAX(DATE) DATE FROM Table")

给出:
   NAME    val1   val2           MAX(DATE)
1     A 23.7228 0.5829 2014-11-19 08:17:00

关于r - 将整数值转换为 sqldf 中的日期时间,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29288539/

10-11 17:50