sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频教程)
效应量可以表示两组样本平均数的差异
效应量可以用d表示,其公式
观察实验组和对照组,效应量越大,两组平均数越远,差异越大
效应量不受样本容量的影响。当样本容量大得到显著时,有必要报告效应量大小。
效应量太小,意味着处理即使达到了显著水平,也缺乏实用价值。
在一般统计分析中,一般我们只报告统计量F或t值,与p-value;实际上这些统计量对数据的描述只是描述了一小部分;传统的描述还应包括样本量,样本均数与标准差;但这些传统的描述量基本只是对单变量分布的描述,而对两组变量或处理效应的描述,则用effectsize更加直观。它在平均数检验中表示的是两组样本分布的总体的非重叠程度;ES越大,重叠程度越小,效应明显;ES越小则相反。可以这样理解,不管你取哪种样本,ES是作为为一种标准的均数差异的估计,它与当前样本无关。显然,传统的推断统计量F及p-value只是说明均数差异,但这种差异脱离样本推广到不同的抽样群体,差异究竟有多大,需要用ES来描述。(可以这样来形容F值与ES值:F值表示的是样本1与样本2之间的显著性;而ES值是表示在样本1的总体与样本2的总体中随便抽取两个样本,这种差异显著性出现的可能性)。
不同检测中,效应量量化程度不同