一、将输出作为输入——结果的重用

  R有个特点,分析的结果可以保存下来,并可以作为进一步分析的输入使用。下面我们通过R中的预先安装好的数据集作为实例(这里只讲述原理,涉及到的统计知识,以后在另外的统计专栏中描述):

  1、利用汽车数据mtcars执行一次简单的线性回归,通过车身重量(wt)预测每加仑行驶的英里数(mpg),语句如下:

  lm(mpg~wt,data= mtcars)

  运行结果(结果只是展示在屏幕上,并没有保存下来):

  再窥R(包括一个R示例)-LMLPHP

  2、再次执行回归。这次将其结果保存起来,语句如下:

   myfit <- lm(mpg~wt,data=mtcars)

  再窥R(包括一个R示例)-LMLPHP

  上述语句创建了一个名为myfit的列表对象,其包含了预测值、残差、回归系数等信息。虽然我们在屏幕上没有看到任何信息,但分析结果已经被保存下来,我们就可以在接下来的分析中使用这些分析信息。

  3、执行summary(myfit) ,显示分析结果的统计概要。效果如下:

  再窥R(包括一个R示例)-LMLPHP

  执行plot(myfit) ,生成回归诊断图。 根据提示,按下enter键,最后效果如下:

  再窥R(包括一个R示例)-LMLPHP

  运行语句:

  cook <-cooks.distance(myfit)

  plot(cook)

  第一句首先计算影响度量统计量,第二句是对结果绘图。效果如下:

  再窥R(包括一个R示例)-LMLPHP

  执行语句:predict(myfit,mydata)

  可以根据你给定的新的车身重量对每加仑行驶的英里数进行预测。

  注:可以根据前文提到的help(对象名)或者 ?对象名 方法来查阅对象的帮助文档。其中,value部分对应着函数的返回值。

二、R实践示例

  任务描述:

  ①打开帮助文档首页,查阅其中的“Introduction to R”;

  ②安装vcd包(一个用于可视化类别数据的包)

  ③列出次包中可用的函数和数据集

  ④载入这个包,并阅读数据集Arthritis的描述

  ⑤显示数据集Arthritis的内容;

  ⑥运行数据集Arthritis自带的示例。(基本显示接收治疗的关节炎患者较接受安慰剂的患者在病情上有了更多改善)

  最后退出。

  代码清单和演示效果如果:

  help.start()

  install.packages("vcd")

  help(package = "vcd")

  library(grid)

  library(vcd)

  help(Arthritis)

  效果:

  再窥R(包括一个R示例)-LMLPHP

再窥R(包括一个R示例)-LMLPHP

再窥R(包括一个R示例)-LMLPHP

再窥R(包括一个R示例)-LMLPHP

再窥R(包括一个R示例)-LMLPHP

再窥R(包括一个R示例)-LMLPHP

小结

  加上上篇介绍,我们从R的安装开始,讨论了如果通过下载附加包来增强R功能;探索了R的基本界面,以交互和批处理的两种方式运行R程序;并尝试绘制一些图形;学习了如何将工作保存到文本和图形文件中;并花了一些时间来了解如何访问大量现成的帮助文档。

  接下来的环节,我们将学习R处理的各种数据类型,以及如何从文本文件、其他程序和数据库系统中导入数据。

05-22 21:47