介绍

茎叶图(Stem-and-Leaf display)又称“枝叶图”,由统计学家约翰托奇( Arthur Bowley)设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。

三列数

茎叶图有三列数:左边的一列数统计数,它是上(或下)向中心累积的值,中心的数(带括号)表示最多数组的个数;中间的一列表示茎,也就是变化不大的位数;右边的是数组中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,像一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。

特殊工具

茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。

特征

1、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。

2、茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。

举例

下面有一堆数据共30个

89 79 57 46 1 24 71 5 6 9 10 15 16 19 22 31 40 41 52 55 60 61 65 69 70 75 85 91 92 94

画出的茎叶图如下:

茎|叶

0 |1 5 6 9

1 |0 5 6 9

2 | 2 4

3 | 1

4 | 0 1 6

5 | 2 5 7

6 | 0 1 5 9

7 | 0159

8 | 5 9

9 | 1 2 4

比如第二行的数字如下:

1 | 0 5 6 9

则代表数据集中有10,15,16,19四个数字

可以这样理解茎+叶=实际的数值,如 1|0569 中茎值为1,页值为 0,5,6,9 共四个页值.

其真实数值计算方式:茎值连接叶值 .茎值:1叶值0连接起来就是10.

一个茎可以有很多叶也可以不出现叶.

茎叶图(stem)-LMLPHP

茎叶图(stem)-LMLPHP

R语言举例

> x = c(12.00, 0.40, 5.00, 2.00, 50.00, 8.00, 3.00, 1.00, 4.00, 0.25)

> stem(x)
04-25 20:08