考虑R.中的虹膜数据集(可通过RDatasets包在Julia中获得)。假设我想获得物种“ setosa”的“ Sepal.Length”和“ Petal.Width”的观测值。在R中,我可以通过以下方式实现:
子集(iris,Species ==“ setosa”,select = c(Sepal.Length,Petal.Width))
Julia在同一工作中是否有任何类似的功能?
最佳答案
using RDatasets
iris = dataset("datasets","iris") # typeof(iris) => DataFrames.DataFrame
subset=iris[iris[:Species].=="setosa",[:PetalLength,:PetalWidth]]
注意事项(1)引用RDatasets.jl:
为了加载
RDatasets
中包含的数据集之一软件包,则需要安装
DataFrames
软件包。该软件包会自动安装为
RDatasets
软件包(如果您按以下方式安装RDatasets
):Pkg.add("RDatasets")
注意(2):由于
datasets
包中的RDatasets
是DataFrame
类型,因此可以使用dataframesjl中的语法创建Subsets
编辑:
正如@jverzani所评论的,
using DataFramesMeta
公开了一组具有SQL
语义的宏,这些宏指导用户以更熟悉的样式编写查询语句。例如上面的命令是@ix(iris, :Species.=="setosa", [:PetalLength,:PetalWidth])