我正在尝试创建数据框的子集,当我这样做时,R切换日期列的格式。知道为什么或如何解决这个问题吗?
> head(spyPr2)
Date Open High Low Close Volume Adj.Close
1 12/30/2011 126.02 126.33 125.50 125.50 95599000 125.50
2 12/29/2011 125.24 126.25 124.86 126.12 123507200 126.12
3 12/28/2011 126.51 126.53 124.73 124.83 119107100 124.83
4 12/27/2011 126.17 126.82 126.06 126.49 86075700 126.49
5 12/23/2011 125.67 126.43 125.41 126.39 92187200 126.39
6 12/22/2011 124.63 125.40 124.23 125.27 119465400 125.27
> spyPr2$Date <- as.Date(spyPr2$Date, format = "%m/%d/%Y")
> head(spyPr2)
Date Open High Low Close Volume Adj.Close
1 2011-12-30 126.02 126.33 125.50 125.50 95599000 125.50
2 2011-12-29 125.24 126.25 124.86 126.12 123507200 126.12
3 2011-12-28 126.51 126.53 124.73 124.83 119107100 124.83
4 2011-12-27 126.17 126.82 126.06 126.49 86075700 126.49
5 2011-12-23 125.67 126.43 125.41 126.39 92187200 126.39
6 2011-12-22 124.63 125.40 124.23 125.27 119465400 125.27
> spyPr2 <- data.frame(cbind(spyPr2$Date, spyPr2$Close, spyPr2$Adj.Close))
> str(spyPr2)
'data.frame': 1638 obs. of 3 variables:
$ X1: num 15338 15337 15336 15335 15331 ...
$ X2: num 126 126 125 126 126 ...
$ X3: num 126 126 125 126 126 ...
> head(spyPr2)
X1 X2 X3
1 15338 125.50 125.50
2 15337 126.12 126.12
3 15336 124.83 124.83
4 15335 126.49 126.49
5 15331 126.39 126.39
6 15330 125.27 125.27
更新:
> spyPr2 <- data.frame(cbind(spyPr2["Date"], spyPr2$Close, spyPr2$Adj.Close))
Error in `[.data.frame`(spyPr2, "Date") : undefined columns selected
> spyPr2 <- data.frame(cbind(spyPr2[,"Date"], spyPr2$Close, spyPr2$Adj.Close))
Error in `[.data.frame`(spyPr2, , "Date") : undefined columns selected
更新2:
structure(list(Date = structure(c(15338, 15337, 15336, 15335,
15331, 15330), class = "Date"), Open = c(126.02, 125.24, 126.51,
126.17, 125.67, 124.63), High = c(126.33, 126.25, 126.53, 126.82,
126.43, 125.4), Low = c(125.5, 124.86, 124.73, 126.06, 125.41,
124.23), Close = c(125.5, 126.12, 124.83, 126.49, 126.39, 125.27
), Volume = c(95599000L, 123507200L, 119107100L, 86075700L, 92187200L,
119465400L), Adj.Close = c(125.5, 126.12, 124.83, 126.49, 126.39,
125.27)), .Names = c("Date", "Open", "High", "Low", "Close",
"Volume", "Adj.Close"), row.names = c(NA, -6L), class = "data.frame")
最佳答案
显而易见的答案是不要像那样做子集!使用适当的工具。出什么问题了
spyPr2.new <- spyPr2[, c("Date", "Close", "Adj.Close")]
?
要解释您所看到的行为,您需要了解
$
返回什么以及cbind()
的工作方式。 cbind()
是R中的奇数之一,其中方法分配不是通过常规方法完成,而是通过掩埋在R内部的特殊代码来处理。这就是cbind()
后面的所有R代码:> cbind
function (..., deparse.level = 1)
.Internal(cbind(deparse.level, ...))
<bytecode: 0x24fa0c0>
<environment: namespace:base>
没有太多帮助,是吗?但是,有一些用于数据帧和
"ts"
对象的方法:> methods(cbind)
[1] cbind.data.frame cbind.ts*
Non-visible functions are asterisked
在进行揭密之前,还请注意
$
返回的内容(dat2
是将Date
转换为"Date"
对象后的6行数据):> str(dat2$Date)
Date[1:6], format: "2011-12-30" "2011-12-29" "2011-12-28" "2011-12-27" ...
这是一个
"Date"
对象,它实际上是一个特殊的 vector 。> class(dat2$Date)
[1] "Date"
关键是它是而不是一个数据帧。因此,当您使用
cbind()
时,内部代码会看到三个 vector ,而内部代码会创建一个矩阵。> (c1 <- cbind(dat2$Date, dat2$Close, dat2$Adj.Close))
[,1] [,2] [,3]
[1,] 15338 125.50 125.50
[2,] 15337 126.12 126.12
[3,] 15336 124.83 124.83
[4,] 15335 126.49 126.49
[5,] 15331 126.39 126.39
[6,] 15330 125.27 125.27
> class(c1)
[1] "matrix"
R中只能有数字或字符矩阵,因此
Date
对象将转换为数字 vector :> as.numeric(dat2$Date)
[1] 15338 15337 15336 15335 15331 15330
允许
cbind()
产生数字矩阵。您可以通过显式调用来强制使用数据框方法,并且该方法确实知道如何处理
"Date"
对象,因此不进行任何转换:> cbind.data.frame(dat2$Date, dat2$Close, dat2$Adj.Close)
dat2$Date dat2$Close dat2$Adj.Close
1 2011-12-30 125.50 125.50
2 2011-12-29 126.12 126.12
3 2011-12-28 124.83 124.83
4 2011-12-27 126.49 126.49
5 2011-12-23 126.39 126.39
6 2011-12-22 125.27 125.27
但是,除了所有解释之外,您正在尝试以非常复杂的方式进行子设置。
[
作为子函数可以正常工作:> dat2[, c("Date", "Close", "Adj.Close")]
Date Close Adj.Close
1 2011-12-30 125.50 125.50
2 2011-12-29 126.12 126.12
3 2011-12-28 124.83 124.83
4 2011-12-27 126.49 126.49
5 2011-12-23 126.39 126.39
6 2011-12-22 125.27 125.27
subset()
也是一个选项,但此处不需要:> subset(dat2, select = c("Date", "Close", "Adj.Close"))
Date Close Adj.Close
1 2011-12-30 125.50 125.50
2 2011-12-29 126.12 126.12
3 2011-12-28 124.83 124.83
4 2011-12-27 126.49 126.49
5 2011-12-23 126.39 126.39
6 2011-12-22 125.27 125.27
关于r - cbind()正在更改日期格式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/8944525/