我有一个代码正在做类似的事情

d <- load a data.frame, possible an empty one...
d <- na.omit(d)
if (NROW(d)>0) {
 do something...
}

这似乎是错误的,因为将 na.omit 应用于空数据框会向其中添加一行:
data.frame()
data frame with 0 columns and 0 rows

na.omit(data.frame())
data frame with 0 columns and 1 rows

为什么 na.omit 对我这样做?

最佳答案

这是因为 na.omit 有一个逻辑向量 omit(在它的代码中),它被设置为 FALSE 以保留这些行,将这些行设置为 TRUE 以删除这些行。

但是,在检查您的输入 data.frame 之前,omit 最初设置为 FALSE,以了解要删除哪些行并更新 omit 的值。由于您的输入是一个空的 data.frame,因此没有更新的值,omit 保留先前设置的 FALSE。然后,na.omit 调用:

object[!omit, , drop=FALSE]

在你的情况下是:
data.frame()[TRUE, , drop=FALSE]

这使:
# data frame with 0 columns and 1 rows

这是 na.omit.data.frame 的代码(可以通过执行 getS3method("na.omit", "data.frame") 获得)。没有为空 data.frame 运行的部分被注释掉。
n <- length(object)
omit <- FALSE
vars <- seq_len(n) # equals integer(0) in your case
for (j in vars) { # the loop is not run at all
#     x <- object[[j]]
#     if (!is.atomic(x))
#         next
#     x <- is.na(x)
#     d <- dim(x)
#     if (is.null(d) || length(d) != 2L)
#         omit <- omit | x
#     else for (ii in 1L:d[2L]) omit <- omit | x[, ii]
# }
xx <- object[!omit, , drop = FALSE]
# if (any(omit > 0L)) { # this is also not run
#     temp <- setNames(seq(omit)[omit], attr(object, "row.names")[omit])
#     attr(temp, "class") <- "omit"
#     attr(xx, "na.action") <- temp
# }
xx

解决方案:

你可以使用 complete.cases 代替。
DF <- data.frame()
DF[complete.cases(DF), ]
# data frame with 0 columns and 0 rows

DF <- data.frame(x=1:2, y=c(2,NA))
DF[complete.cases(DF), ]
#   x y
# 1 1 2

关于r - 为什么 na.omit 向空数据帧添加一行?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/16539751/

10-12 17:47