tidyverse 简介

众多的功能包是使 R语言 在分析数据中表现出色的重要组成部分。

功能包提供了很有用的代码组合、可重复使用的 R 函数、说明文档 和示例数据集。 对于许多数据分析师来说,排在众多有用功能包列表顶部的是 tidyversetidyverse 实际上是 R语言 中的功能包组(由多个功能包组合而成),集成具有用于数据操作、数据探索和数据可视化的全部功能。

tidyverse 的社区支持也很强大。 这也是为什么 tidyverse 被认为是大多数 R语言 用户编程的关键功能包的原因之一。 在网上也可以搜索到许多与 tidyverse 相关的教程和示例。

功能包(package)的安装

在R语言中,安装功能包(package),可以使用 install.packages()函数,记得需要链接网络,然后在括号中输入需要安装的功能包名字,程序就会自动搜索匹配功能包的名字,找到后就会自动下载安装,如果输入的名字不正确,就会报错提示你说找不到这个名字的功能包。

tidyverse 的安装

那么首先就让我们来安装 tidyverse。打开 RStudio
我们首先输入 install.packages()。 然后,在括号中输入tidyverse, 可以加引号也可以不加不是是必需的,但最好是加上引号来确保我们的准确性。 运行代码然后等待 RStudio 安装 tidyverse

 install.packages("tidyverse")

等待 RStudio 安装 tidyverse 包(请耐心等待,这可能需要一点时间,根据网络的好坏)。 完成后会收到一条消息,说明安装已完成。
Class 07 - 功能包的安装和 tidyverse 介绍-LMLPHP

功能包(package)的加载

在R语言中,使用功能包(package)的时候,需要先让程序加载这个功能包(package),需要用到library()函数,然后在括号中输入需要使用的功能包名字,程序就会加载这个包,这样在后续的代码中就能使用这个包的函数了。

tidyverse 的加载

安装 tidyverse 包后,需要让程序加载它们才能使用。 使用 library() 命令加载tidyverse。 核心 tidyverse 包含几个主要包,它们能够协同工作,使你的数据分析高效便捷。

要加载 tidyverse,需要输入 library(tidyverse) ,然后运行程序。

 library(tidyverse) 

Class 07 - 功能包的安装和 tidyverse 介绍-LMLPHP

  • 控制台中的输出表示已经加载了核心 tidyverse功能包。 每个核心功能包旁边都有一个绿色对勾。

  • 同时,输出还列出了冲突问题。 冲突报告哪些函数在两个个或多个功能包中具有相同的名称。

  • 由于我们最近加载了 tidyverse 包,因此它们将成为当前会话的默认包。

功能包(package)的更新

时代在发展,科技在进步,哈哈哈
R语言的社区很活跃,很多功能包都有人在维护和更新升级,使得R语言使用起来更方便功能更强大。我们也需要定期或不定期的去更新功能包。这时候可以使用update.packages()函数,可以用来更新全部已经安装的功能包。

只需在程序中输入update.packages(),然后运行代码就OK了,坐等程序下载安装。

update.packages()

tidyverse 核心功能

前面我们已经完成了 tidyverse 功能包的安装,加载还有更新等功能。下面我们来介绍下 tidyverse 中我们会经常用到的核心功能。

在我们加载 tidyverse 时,控制台中已经用对号表示了9个核心的功能包。如下:

  • dplyr
  • readr
  • forcats
  • stringr
  • ggplot2
  • tibble
  • lubridate
  • tidyr
  • purrr

其中有四个包是数据分析师的工作流程中需要经常使用到的包。

  • ggplot2
  • dplyr
  • tidyr
  • readr

这四个包的作用如下:

ggplot2 : 用于数据可视化,特别是绘图。 使用 ggplot2,可以通过将不同的视觉属性应用于数据变量来创建各种各样的图表,并且效果十分美观。 这是 ggplot2 的一个例子。之后我们也会讲到将如何使用 ggplot2 绘图。
Class 07 - 功能包的安装和 tidyverse 介绍-LMLPHP

dplyr : 提供了一组一致的函数来帮助你完成一些常见的数据操作任务。 例如,select 函数根据名称选择变量,filter 函数查找满足特定条件的情况。

tidyr : 是一个用于数据清洗的包,可以让数据变得整洁。可以使用 tidyr处理宽数据和长数据。

readr :它用于导入数据。 readr 中最常见的函数是 read_csv。 这会将 CSV 文件导入 R。CSV 加粗样式文件包含以表格格式以逗号分隔的数据。 要使用 readr 准确读取数据集,需要将该函数与列规范结合使用。

所以这就是 tidyverse 中的四个非常有用的工具包, 它们都会使你在 R 中的编程更加直接和高效。

browseVignettes 函数

browseVignettes 函数可以帮助你了解某个功能包(package)在解决的问题以及所包含的功能的详细信息(会直接打开对应的网页)。

例如,如果用 ggplot2 来执行 browseVignettes() 函数。
只需要输入browseVignettes('ggplot2')

browseVignettes('ggplot2')

程序会打开一个网页,显示以下结果:
Class 07 - 功能包的安装和 tidyverse 介绍-LMLPHP

如果你想要更深层的了解不同包的功能 ,那么这个函数可以帮到你。

05-20 21:56