我有一个包含YEARDOY(一年中的一天)列的数据库。我想添加一个额外的列DATE,例如

mutate(data, DATE = date(julianday(YEAR || '-01-01'), '+'||(DOY-1)||' day'))

但这不起作用,可能是因为SQL字符串串联为“||”转换为“OR”。你会怎么做?

在另一种情况下,我必须在SQL日期对象中转换字符串。在R中,我将使用lubridateymd在dplyr(SQL)中是否有类似的简单方法来处理mutate

克里斯托夫

最佳答案

dplyr中的mutate修改了结果,但没有修改我想要的数据库中的表。

这个问题没有说明正在使用哪个数据库,这很重要,但是下面没有使用该SQLite。

1)这是使用RSQLite包使用DF列更新数据库中表DATE的代码。根据(DOY-1)的来源(0或1),可能需要DOY代替DOY。您可能也需要将DOY强制转换为整数,但是在我的运行中,无需这样做就可以。

library(RSQLite)

# create test database with a table DF
con <- dbConnect(SQLite())
DF <- data.frame(YEAR = 2014, DOY = 15)
dbWriteTable(con, "DF", DF)

# add DATE column to table DF and update its value
dbGetQuery(con, "alter table DF add column DATE")
dbGetQuery(con, "update DF
                 set DATE = date(cast(YEAR as integer) || '-01-01', DOY || ' days')")

给予:
dbGetQuery(con, "select * from DF")
##   YEAR DOY       DATE
## 1 2014  15 2014-01-16

2)如果您只想修改结果而不是数据库本身,则使用SQLite再次尝试:
library(dplyr)
library(RSQLite)

# create database and add table DF to it
db <- src_sqlite(path = tempfile(), create = TRUE) # test database
DF <- data.frame(YEAR = 2014, DOY = 15) # test data
dbWriteTable(db$con, "DF", DF)

db_DF <- tbl(db, "DF")
db_DF %>%
      mutate(DATE = sql("date(cast(YEAR as integer) || '-01-01', DOY || ' days')"))

更新(1)使用RSQLite并修改数据库。 (2)使用dplyr而不使用。

10-06 13:43