我现在正在R中学习dplyr包,但是在理解computecollectcollapse这三个函数的作用方面遇到了麻烦。

我知道dplyr在内部没有使用data.frame类型;而是将其数据存储到自己的tbltbl_df类型中。

然后,为了将自定义类型转换回R的默认data.frame以利用data.frame上的一组默认函数,您必须使用collect,例如:

batting <- tbl(lahman_sqlite(), "Batting")
dim(collect(batting))

自2016年起返回[1] 99846 22,而dim(batting)返回[1] NA 22

但是,我不确定其他两个函数computecollapse会做什么。如果您通过?collect checkout ,文档将说明以下内容:



这是什么意思,特别是强制执行惰性Tlb的计算?

更新

我想知道这些功能的作用,并想弄清一个功能的作用和其他功能的作用。

最佳答案

dplyr vignettes之一:



如果那没有帮助,那么最好的选择就是研究每个函数的源代码。您可以在此处查看有关操作方法的说明:How do I see the help for the `dplyr::collect` method?

关于r - 在dplyr中如何进行计算,收集和崩溃?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41405595/

10-13 00:31