介绍
茎叶图(Stem-and-Leaf display)又称“枝叶图”,由统计学家约翰托奇( Arthur Bowley)设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
三列数
茎叶图有三列数:左边的一列数统计数,它是上(或下)向中心累积的值,中心的数(带括号)表示最多数组的个数;中间的一列表示茎,也就是变化不大的位数;右边的是数组中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,像一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。
特殊工具
茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。
特征
1、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
2、茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。
举例
下面有一堆数据共30个
89 79 57 46 1 24 71 5 6 9 10 15 16 19 22 31 40 41 52 55 60 61 65 69 70 75 85 91 92 94
画出的茎叶图如下:
茎|叶
0 |1 5 6 9
1 |0 5 6 9
2 | 2 4
3 | 1
4 | 0 1 6
5 | 2 5 7
6 | 0 1 5 9
7 | 0159
8 | 5 9
9 | 1 2 4
比如第二行的数字如下:
1 | 0 5 6 9
则代表数据集中有10,15,16,19四个数字
可以这样理解茎+叶=实际的数值,如 1|0569 中茎值为1,页值为 0,5,6,9 共四个页值.
其真实数值计算方式:茎值连接叶值 .茎值:1叶值0连接起来就是10.
一个茎可以有很多叶也可以不出现叶.
R语言举例 > x = c(12.00, 0.40, 5.00, 2.00, 50.00, 8.00, 3.00, 1.00, 4.00, 0.25) > stem(x)