考虑R.中的虹膜数据集(可通过RDatasets包在Julia中获得)。假设我想获得物种“ setosa”的“ Sepal.Length”和“ Petal.Width”的观测值。在R中,我可以通过以下方式实现:


子集(iris,Species ==“ setosa”,select = c(Sepal.Length,Petal.Width))


Julia在同一工作中是否有任何类似的功能?

最佳答案

using RDatasets
iris = dataset("datasets","iris") # typeof(iris) => DataFrames.DataFrame
subset=iris[iris[:Species].=="setosa",[:PetalLength,:PetalWidth]]


注意事项(1)引用RDatasets.jl


为了加载RDatasets中包含的数据集之一
软件包,则需要安装DataFrames软件包。
该软件包会自动安装为
RDatasets软件包(如果您按以下方式安装RDatasets):


Pkg.add("RDatasets")


注意(2):由于datasets包中的RDatasetsDataFrame类型,因此可以使用dataframesjl中的语法创建Subsets

编辑:

正如@jverzani所评论的,using DataFramesMeta公开了一组具有SQL语义的宏,这些宏指导用户以更熟悉的样式编写查询语句。例如上面的命令是@ix(iris, :Species.=="setosa", [:PetalLength,:PetalWidth])

08-19 22:07