总体、样本与统计量
总体及其分布
在数理统计中,称所研究的对象的全体为总体,总体中的元素称为个体。若总体中的个体数目为有限,则称之为有限总体;否则就称之为无限总体。
数理统计所关心的并非每个个体的所有属性,而是它的某一项或若干项数量指标 X X X 和该数量指标 X X X 在总体中的分布情况。一方面,说到总体必对应某数量指标 X X X 可能取值的集合;另一方面,研究任意数量指标 X X X,其可能取值的全体即构成一个总体。因此,把二者等同起来,所谓总体的分布就是指数量指标 X X X 的分布。
数量指标 X X X 是一个随机变量,于是总体的分布也就是随机变量 X X X 的概率分布。
样本及其分布
从总体中取得一部分个体,这一部分个体称为样本。样本中的每个个体称为样品。样品中的个体数目称为样本容量。
取得样本的过程称为抽样,抽样中采用的方法称为抽样法。在数理统计中,一般采用随机抽样法,即从总体中随意地抽取若干个个体。
设由样本 X 1 , . . . , X n X_1,...,X_n X1,...,Xn,若 X 1 , . . . , X n X_1,...,X_n X1,...,Xn 是独立同分布的且 X 1 X_1 X1 的分布与总体 X X X 的分布相同,则称它为简单随机样本。
说样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 是 n n n 维随机向量,这是针对进行一次抽样前而言,实施了一次抽样后,得到的是一个实向量 ( x 1 , . . . x n ) T (x_1,...x_n)^T (x1,...xn)T,它是样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 的一个观察值,称为样本值。
统计量
统计量概念
样本是推断总体特性的依据,但在获得样本之后,并不能由样本直接进行统计推断,需要先对样本进行加工和提炼,把样本中所含的总体的相关信息集中起来,即,针对不同的问题构造出样本的适当函数。这种样本的函数就称为统计量。
粗略来说,统计量就是用作统计的量,因而它不能含未知参数。
样本矩
由大数定律可以证明,当 n n n 很大时,可用一次抽样后所得的样本均值 x ˉ \bar{x} xˉ 和样本方差 s 2 s^2 s2 分别作为总体 X X X 的均值 μ \mu μ 和方差 σ 2 \sigma^2 σ2 的近似值。
顺序统计量及其分布
样本中位数与样本极差
设 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 为总体 X X X 的一个样本,其顺序统计量为 ( X ( 1 ) , . . . , X ( n ) ) T (X_{(1)},...,X_{(n)})^T (X(1),...,X(n))T,由 ( X ( 1 ) , . . . , X ( n ) ) T (X_{(1)},...,X_{(n)})^T (X(1),...,X(n))T 可定义在应用上有重要意义的样本中位数与样本极差。
称统计量
M e = { X ( ( n + 1 ) / 2 ) , n 为奇数 1 2 ( X ( n / 2 ) + X ( ( n + 1 ) / 2 ) ) , n 为偶数 Me=\begin{cases} X_{((n+1)/2)}, &n 为奇数 \\ \frac{1}{2}(X_{(n/2)}+X_{((n+1)/2)}), &n 为偶数 \end{cases} Me={X((n+1)/2),21(X(n/2)+X((n+1)/2)),n为奇数n为偶数
为样本中位数。样本中位数具有计算方便且不受样本值中的异常值 (outlier) 影响的特点,因而有时比样本均值更具有代表性。
称统计量
R = X ( n ) − X ( 1 ) R=X_{(n)}-X_{(1)} R=X(n)−X(1)
为样本极差。样本极差是反映样本值分散程度的量。
经验分布函数
经验分布函数的性质:
- F n ( x ) F_n(x) Fn(x) 是 x x x 的单调非降函数;
- F n ( x ) F_n(x) Fn(x) 是 x x x 的右连续函数;
- F n ( − ∞ ) = 0 , F n ( + ∞ ) = 1 F_n(-\infty)=0,F_n(+\infty)=1 Fn(−∞)=0,Fn(+∞)=1
参考文献
[1] 《应用数理统计》,施雨,西安交通大学出版社。