我有一个包含YEAR
和DOY
(一年中的一天)列的数据库。我想添加一个额外的列DATE
,例如
mutate(data, DATE = date(julianday(YEAR || '-01-01'), '+'||(DOY-1)||' day'))
但这不起作用,可能是因为SQL字符串串联为“||”转换为“OR”。你会怎么做?
在另一种情况下,我必须在SQL日期对象中转换字符串。在R中,我将使用
lubridate
和ymd
在dplyr(SQL)中是否有类似的简单方法来处理mutate
?克里斯托夫
最佳答案
dplyr中的mutate
修改了结果,但没有修改我想要的数据库中的表。
这个问题没有说明正在使用哪个数据库,这很重要,但是下面没有使用该SQLite。
1)这是使用RSQLite包使用DF
列更新数据库中表DATE
的代码。根据(DOY-1)
的来源(0或1),可能需要DOY
代替DOY
。您可能也需要将DOY
强制转换为整数,但是在我的运行中,无需这样做就可以。
library(RSQLite)
# create test database with a table DF
con <- dbConnect(SQLite())
DF <- data.frame(YEAR = 2014, DOY = 15)
dbWriteTable(con, "DF", DF)
# add DATE column to table DF and update its value
dbGetQuery(con, "alter table DF add column DATE")
dbGetQuery(con, "update DF
set DATE = date(cast(YEAR as integer) || '-01-01', DOY || ' days')")
给予:
dbGetQuery(con, "select * from DF")
## YEAR DOY DATE
## 1 2014 15 2014-01-16
2)如果您只想修改结果而不是数据库本身,则使用SQLite再次尝试:
library(dplyr)
library(RSQLite)
# create database and add table DF to it
db <- src_sqlite(path = tempfile(), create = TRUE) # test database
DF <- data.frame(YEAR = 2014, DOY = 15) # test data
dbWriteTable(db$con, "DF", DF)
db_DF <- tbl(db, "DF")
db_DF %>%
mutate(DATE = sql("date(cast(YEAR as integer) || '-01-01', DOY || ' days')"))
更新(1)使用RSQLite并修改数据库。 (2)使用dplyr而不使用。