我正在尝试将R base中的两个data.tables连接到多个setkeys中,这些键具有重复的条目。举个例子

>DT1
ID  state Month Day Year
1   IL    Jan   3   2013
1   IL    Jan   3   2014
1   IL    Jan   3   2014
1   IL    Jan   10  2014
1   IL    Jan   11  2013
1   IL    Jan   30  2013
1   IL    Jan   30  2013
1   IL    Feb   2   2013
1   IL    Feb   2   2014
1   IL    Feb   3   2013
1   IL    Feb   3   2014

>DT2
state Month   Day   Year  Tavg
  IL    Jan    1    2013    13
  IL    Jan    2    2013    19
  IL    Jan    3    2013    22
  IL    Jan    4    2013    23
  IL    Jan    5    2013    26
  IL    Jan    6    2013    24
  IL    Jan    7    2013    27
  IL    Jan    8    2013    32
  IL    Jan    9    2013    36
  ...   ...    ..   ...      ...
  ...   ...    ..   ...      ...
  IL    Dec 31  2013    33

我想将DT2的“Tavg”值添加到DT1中的相应日期。例如,DT1中2013年1月3日的所有条目都需要在附加列中添加Tavg 13。

我尝试了以下setkey(DT1, state, Month, Day, Year),与DT2相同,然后执行Join操作DT1[DT2, nomatch=0, allow.cartesian=TRUE但这没用

最佳答案

只是帮助了一个 friend (他找不到一个很好的Stack Overflow答案),所以我认为这个问题需要一个更完整的“玩具”答案。

这是几个带有一个不匹配键的简单数据表:

dt1 <- data.table(a = LETTERS[1:5],b=letters[1:5],c=1:5)
dt2 <- data.table(c = LETTERS[c(1:4,6)],b=letters[1:5],a=6:10)

这是几个多重键合并选项:
merge(dt1,dt2,by.x=c("a","b"),by.y=c("c","b")) #Inner Join
merge(dt1,dt2,by.x=c("a","b"),by.y=c("c","b"),all=T) #Outer Join

setkey(dt1,a,b)
setkey(dt2,c,b)

dt2[dt1] #Left Join (if dt1 is the "left" table)
dt1[dt2] #Right Join (if dt1 is the "left" table)

关于r - 基于多个键和重复项在R中联接两个data.tables,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29082406/

10-12 15:29