我正在尝试使用duplicated在数据框中查找仅基于两列重复的行。

当我将任何内容传递给incomparables参数时,我得到了错误

dups = duplicated(data, incomparables="Age")
...
argument 'incomparables != FALSE' is not used (yet)

我不知道这个。

This question似乎有类似的问题,但没有响应。

毫无疑问,有另一种方式可以做相同的事情,因为我是R的初学者,所以也很高兴知道这一点。

最佳答案

首先,通过阅读?duplicated的文档,您将认识到incomparables参数接受一个不应该比较的值向量,而是一个列名,我引用:

不可比较的值的向量。

而且更详细

无与伦比的值将永远不会被标记为重复。这是
旨在用于较小的一组值,并且不会
对于很大的集合,效率很高。

无论哪种方式,the source code都意味着即使您正在阅读文档,也无法使用它,因为此功能在看来尚未实现,但在

if(!identical(incomparables, FALSE))
   .NotYetUsed("incomparables != FALSE")

不过,回到您的问题,为了对两列运行duplicated,您可以显式命名它们,例如
duplicated(data[c("col1", "col2")]) ## (if the desired columns called col1 and col2)

10-06 01:55