《六西格玛管理统计指南》第五章 假设检验 -2

本文是六西格玛蓝皮书第五章“假设检验”的第二部分,介绍方差检验和ANOVA,并总结目前的比较方法。 汇总了主要内容,并补充了我的思考和工作中的例子,有些细节需要翻书,不追求面面俱到。

第一部分读书笔记见:《六西格玛管理统计指南》第五章假设检验-1 – Zero | 吴玉昆的个人主页

关键词:方差检验,ANOVA,比较方法的总结!

关键问题:

  • 均值检验和方差检验的关系,区别,各自的适用条件
  • 为什么要进行方差检验?
  • 单样本、双样本、多样本(ANOVA的前提)的等方差检验,及举例
  • 单因子ANOVA的基本原理,多重比较方法及其对应的整体误差率
  • 单因子ANOVA的三个前提条件!
  • 等价检验 ——“点”变成“范围”,相当于进行两次假设检验
  • 抽样量的确定原则——第二类错误,如何确定合适的抽样量,怎么才算“合适”?

在实际工作中,如果为了讨论有关平均值的问题,样本量应该超过15;如果是为了讨论有关方差问题,样本量应该超过30.

思考:均值检验中最常见的错误?
问题:两个样本,用excel计算均值和标准差,然后根据均值加减一个标准差作图,对比数据范围是否重叠,如果没有重叠就代表具有显著性差异,这样分析对吗? (假设两个样本的总体方差未知但是相等)
分析: 这是双样本均值检验,判断两个样本均值是否相等! 教科书的方法是,先计算“合并标准差”和“均值的差值”,然后判断零是否在正态分布(均值的差,合并标准差)的拒绝域范围,如果在拒绝域,说明两个样本具有显著性差异。
那excel的方法为什么不对?

方差检验

问题:为什么要进行方差检验? 方差检验和均值检验的关系是什么?
答案: 我的理解是,均值检验是比较均值(average),但比较均值同时会考虑方差是否相等及大小差异。比如两个样本均值差别很小,不代表没有显著性差异,关键看spread波动大小(两个分布曲线有多大重叠),所以比较双样本的均值时,有需要分成三种情况(方差已知,未知但相等,未知且不相等)。进行ANOVA多样本均值比较时,则需要等方差,这样才能说明多样本之间是否具有显著性的差异,如果样本的方差不同,应该就不能直接用ANOVA了。

统计量:方差
样本量:单样本、双样本、多样本

  • 单样本:判断一个样本,是否属于某一个给定方差的总体;或者判断一个样本是否能够代表总体?
    单样本举例:例5-13 已知一个产品的某一测试性能的标准差,现在随机抽取30个样本,请问,在0.05下,这30个样本的方差是否和总体一样?
    单样本举例:例5-14,原来的生产产品的标准差是0.1,改进生产设备之后,抽样30个样本,询问是否可以说明,标准差有改进?

  • 双样本:判断两个样本,是否具有相同的方差,即是否具有相同的样本分布? 比如分析两个样本,是否来自同一个总体。
    双样本举例:两个批次的原材料的方差是否相等? 工艺改进之后的方差是否减小了?
    举例5-15: 两种改善BOD的方法,各取样10个和9个并测试,分析这两种改善方法的方差是否相等?

多样本等方差检验:多个样本是否具有相同的方差,最常见于单因子ANOVA,因为前提之一就是等方差! 所以先检验等方差,再进行ANOVA—多样本均值检验。 如果多样本方差不相等,那就进行"近似的ANOVA检验,即Welchs方差分析法"(P153)
多样本等方差举例,比如例5-17,考察四个温度对烧碱产品收率的影响,这就像工作中遇到的三种活化纯碱添加量,三个烘干温度,三个粒径对膨润土铸造性能的影响。 这些ANOVA检验,都以“多样本等方差检验”为前提!

单正态方差检验:卡方检验!
Q&A:什么是卡方分布?一个总体中反复抽样,分析样本方差的分布,得到的“正态样本方差的分布”,即为卡方Chi-square。
Q&A:为什么要进行卡方检验? 根据样本方差判断是否属于总体,或者说“分析单个正态总体样本方差的状况”。

双样本方差检验:F检验 (比较两个样本方差的比值)

多样本等方差检验: 直接用mintab软件进行检验,具体方法我也不懂。

单因子ANOVA—基于“多样本等方差”的“多样本均值检验”!

单因子ANOVA基本原理:三个前提,随机误差,系统误差,组内,组间,F统计量,细节略。

单因子ANOVA多重比较方法
ANOVA本身只能给出“多个水平之间是否具有显著性差异”,但是不能告诉我们哪两个水平之间具有显著性。所以如果需要了解更多,就需要进行"多重比较"。

进行多重比较的关键是如何选定第一类错误风险值的问题!
进行单因子方差分析时,一定要选择Tukey算法,以保证整体误差率为5%。
如果选择"Fisher,个别误差率",两两比较的每次检验的第一类错误都是5%,这样整体第一类错误的误差率肯定会大大超过5¥,所以除非特殊需要不能选择Fisher算法

比较方法的总结

P154 表5-19,按照检验统计量(均值、方差、比率、中位数)和样本量(单、双、多),建设检验总共分成4*3=12种情况,自己想想都有啥例子。

IMG_2732- 6sigma,比较方法的总结

2020.5.16 之前有几天简单梳理,今天早晨花了大概一个小时,差不多弄明白了。 剩下的等价检验和抽样量,再单独作为一篇文章。