我正在使用 sqldf 库来返回一个具有不同值的数据框,并且只有日期列的最大值。数据框看起来像这样
+------+----------+--------+-----------------+
| NAME | val1 | val2 | DATE |
+------+----------+--------+-----------------+
| A | 23.7228 | 0.5829 | 11/19/2014 8:17 |
| A | 23.7228 | 0.5829 | 11/12/2014 8:16 |
+------+----------+--------+-----------------+
当我尝试运行以下代码以获取具有最大日期的不同值时
df <- sqldf("SELECT DISTINCT NAME, val1, val2, MAX(DATE) FROM Table")
我得到这个作为输出。
+------+----------+--------+-----------------+
| NAME | val1 | val2 | MAX(DATE) |
+------+----------+--------+-----------------+
| A | 23.7228 | 0.5829 | 1416406625 |
+------+----------+--------+-----------------+
请让我知道如何转换最后一列,这是一个整数以恢复我的日期时间格式。
最佳答案
下次请以可重现的形式提供您的意见。这次我已经在下面为你做了。此外,问题中的 SQL 代码有一个 SQLite 语法错误,我已在下面修复。
最简单的方法是对输出列使用名称 DATE
,在这种情况下,sqldf 会认为它与 DATE
输入列的类型相同。 SQLite 没有日期和时间类型,因此在将 sqldf 与 SQLite 一起使用时,sqldf 无法知道返回的是日期时间。 sqldf 使用一些启发式方法来猜测,例如刚才讨论的那个。
library(sqldf)
Lines <- "NAME,val1,val2,DATE
A,23.7228,0.5829,11/19/2014 8:17
A,23.7228,0.5829,11/12/2014 8:16"
Table <- read.csv(text = Lines, as.is = TRUE)
Table$DATE <- as.POSIXct(Table$DATE, format = "%m/%d/%Y %H:%M")
sqldf("SELECT DISTINCT NAME, val1, val2, MAX(DATE) DATE FROM 'Table'")
给予:
NAME val1 val2 DATE
1 A 23.7228 0.5829 2014-11-19 08:17:00
如果我们将 H2 与 sqldf 一起使用,那么我们就不会遇到这些问题,因为 H2 确实支持日期和时间类型,因此 sqldf 不必猜测。此外,您的 SQL 查询的语法与 H2 中的一样。使用上面显示的
Table
data.frame:library(RH2)
library(sqldf)
sqldf("SELECT DISTINCT NAME, val1, val2, MAX(DATE) DATE FROM Table")
给出:
NAME val1 val2 MAX(DATE)
1 A 23.7228 0.5829 2014-11-19 08:17:00
关于r - 将整数值转换为 sqldf 中的日期时间,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29288539/