生物统计学
总体和抽样
抽样方法:
=========================================================
简单随机抽样SRS:随机误差,系统误差
标准误,有效性,评价随机误差。
如果是样本容量是无穷个:则f趋近于0:,下方公式做变换,由
变为:
Eg:1000个就可以用变换后的式子
如果是样本容量是有限个,则使用:
============================================
Stratified sampling分层抽样
优势是分组好度量,treatment和error,但事先需要更多信息
=============================
系统抽样,等间距抽样
优势是简单eg:以固定步长
劣势是如果数据是有周期的,eg则存在有只取峰值现象,所以不适合
Eg:人口普查,系统抽样是隔一个人选一个人调查,分层抽样是分成男人女人各抽一个。
===================
Cluster sampling
分区域,每个区域先各自求一次平均值,在做所有区域平均值的平均值作为总体平均值。
最好的CA效果,组内差别小,组间差别大。
但是最好CS效果,组内差别大,组间差别小。
====================================
多重抽样multistage sampling
先随机选样方,再随机选个体。
=====================================
各种分布:
一维情况如红框内:均匀分布:
随机分布和cluster同理:
样本数越多越集中。方差小则选择样线可以少一点,如果方差大则选择样线要多一点。