R语言 概述
- R语言是用于统计分析,图形表示和报告的编程语言和软件环境。 R语言由Ross Ihaka和Robert Gentleman在新西兰奥克兰大学创建,目前由R语言开发核心团队开发。
- R语言的核心是解释计算机语言,其允许分支和循环以及使用函数的模块化编程。 R语言允许与以C,C ++,.Net,Python或FORTRAN语言编写的过程集成以提高效率。
- R语言在GNU通用公共许可证下免费提供,并为各种操作系统(如Linux,Windows和Mac)提供预编译的二进制版本。
- R是一个在GNU风格的副本左侧的自由软件,GNU项目的官方部分叫做GNU S.
R的演变
R语言最初是由新西兰奥克兰奥克兰大学统计系的Ross Ihaka和Robert Gentleman写的。 R语言于1993年首次亮相
- 一大群人通过发送代码和错误报告对R做出了贡献
- 自1997年年中以来,已经有一个核心组(“R核心团队”)可以修改R源代码归档
R的特点
如前所述,R语言是用于统计分析,图形表示和报告的编程语言和软件环境。 以下是R语言的重要特点:
- R语言是一种开发良好,简单有效的编程语言,包括条件,循环,用户定义的递归函数以及输入和输出设施
- R语言具有有效的数据处理和存储设施
- R语言提供了一套用于数组,列表,向量和矩阵计算的运算符
- R语言为数据分析提供了大型,一致和集成的工具集合
- R语言提供直接在计算机上或在纸张上打印的图形设施用于数据分析和显示
作为结论,R语言是世界上最广泛使用的统计编程语言。 它是数据科学家的第一选择,并由一个充满活力和有才华的贡献者社区支持
R的环境
R环境配置
包
是R函数、数据、预编译代码以一种定义完善的格式组成的集合
# 安装包 install.packages(‘包名’) # 更新包 update.packages(‘包名’) # 查看包的描述 installed.packages()
库
库(library):存储包的目录
# 显示库所在位置 .libPaths() # 显示库中的包 library() # 载入包 library(‘包名’) # 查询包的使用 help(package=’包名’)
help
# 打开帮助文档 help.start() # 安装vcd包 --> 数据可视化 install.packages('vcd') # 列出包所用函数及相应数据集 help.packages('vcd') # 载入包并读取数据集 library(vcd) # 列出数据集内容 help(Arthritis) print(Arthritis) example(Arthritis)
创建数据集
数据集:由数据构成的一个矩形数组
- 行 --> 观测、记录
- 列 --> 变量、字段
# 查看R中所有内置的数据集 data(package = .packages(all.available = TRUE)) # 查看指定包中的数据集 data(package = ‘包名’) # 查看某个数据集的信息 help(数据集) ?数据集