本文承接上文(从定义到实践:Shainin如何开展完全析因试验),基于相同的案例,介绍如何使用Design Expert软件进行完全析因试验,重点是统计分析内容,这也是Shainin方法所忽略的内容。首先回顾从定义到实战:全面理解“完全析因试验” (上)中的2k设计的统计分析步骤:
- 估计因子效应:计算主效应和所有的交互作用
- 识别关键的主效应和交互作用:帕累托图,或(半)正态概率图;
- 形成初始模型(全模型,包括所有主效应和交互作用)
- 进行统计检验——ANOVA方差分析
- 改进模型(移走不显著项)
- 模型适合性检验:正态性假设、残差检验
- 绘制和解释主效应图、交互作用图;
- 解释结果
案例介绍:摩托罗拉波焊
15 年前,一个指导工作小组承担了波焊工艺的改进工作,该小组的成员仅参加过一次作者关于试验设计的讲习班。当时的可焊性缺陷水平高达10000ppm。该小组雄心勃勃,其目标是将缺陷水平降低到200ppm以下,即改进高达50:1,实际上,在20世纪80年代早期,世界上还没有一个波焊工艺的缺陷水平能低于10000ppm~15000ppm。
该小组决定进行具有4个因子、每个因子2个水平的全析因试验,具体如下:
因子代码 | 因子描述 | 因子水平 (-1) | 因子水平 (+1) |
---|---|---|---|
A | 焊剂类型 | A19 | A880 |
B | 传送带速度 (英尺/分) | 4 | 6 |
C | 倾角 | 5° | 7° |
D | 预热温度 (°F) | 160 | 220 |
一、创建试验设计1. 打开软件,点击“New Design”,默认进入Regular Two-Level,如下所示,选择4因子16次试验,Replicate=2,点击Next

2. 输入因子、水平,如下所示

注意因子A为Categoric Type(离散变量,或属性变量),而因子B、C、D为Numeric Type (连续变量)。
3. 输入响应及其信噪比

此时有一个很重要的概念“信噪比”,信号是判定两个响应之间存在显著性差异的最小差值,噪音是重复测试的标准差。上图的内容是我根据试验数据大概填写的,不严谨的做法。
Optional Power Wizard: For each response, you may enter the minimum change the design should detect as statistically significant and the estimated standard deviation (generally obtained from historical data). The ratio will then be calculated in the Delta/Sigma field. Press Next to see the calculated power for each response.
4. 统计功效

根据信噪比和试验重复次数,软件给出响应变量的统计功效。如果统计功效小于80%,需要改进测量系统,或者增加试验次数(相当于增加抽样量)。否则容易犯统计上的第二类错误(type II error),给出不可信的实验结论。
Power is reported at a 5.0% alpha level to detect the specified signal/noise ratio. Power should be approximately 80% or greater for the effects you want to detect.
5. 生成正交试验表格软件会在这一步生成正交试验表格,点击Std按照标准顺序排序,可以看到每个试验组合有两次重复,试验组合之间符合正交性。点击Run,按照运行顺序排序并实施试验,以保证随机性。将试验结果填入软件,如下所示。

进入实验分析阶段,只需要按照软件引导,逐项点击,完成简单评估、数据分析、优化和预测等工作。本文介绍下图的Information和Analysis操作。优化和预测部分,不是本文重点,等未来的多响应案例或相应曲面分析时再做介绍。

二、 简单评估(Information)
2.1 Notes记录试验背景、实验结论等;
2.2 Summary查看试验基本信息,比如随机性、是否有中心点试验、模型类型。如下的4FI为4 factor interactions,四因子试验考虑四交互作用,即为完全析因分析;



2.3 Graph Columns——相关性分析的可视化工具!
可以查看试验计划和测试结果,直观判断是否有异常值、误差大小等。比如下图是因子A在高低水平的响应分布,使用Color标记。 这一步可以获得很多初步判断,比如是否有异常点、试验误差大小、明显的交互作用等。

2.4 Evaluation 简单评估
选择合适的模型类型,查看统计功效、自由度等。初步了解是否需要补充试验,比如统计功效是否>80%,比如误差自由度是否太小(建议至少2~4,多多益善)。



在本案例中,一次完全重复总共32次试验,一共31个自由度(另外的一个自由度用于计算总均值),分配给模型15个因子共15个自由度,剩余留给残差项有16个自由度。
三、试验分析
同样按照软件引导,逐项点击。首先强调的是,Shainin方法只包括3.2 Effect和3.5 Model Graphs这两个步。

3.1 Transform 转换
默认不做转换,直接进行下一步。等到Diagnostic时,软件会提示是否需要转换,以及如何转换,再回到这一步重新开始分析。
3.2 Effect 效应
选择4FI,进行完全析因分析,考虑所有的主效应和高阶交互作用。下表的Stdized Effect列为软件算出的主效应和交互作用。

从定义到实践:Shainin如何开展完全析因试验有一个表述错误,方差分析表中的“总和”是每个因子+1水平8次试验之和与-1水平8次试验之和的差值,并不是因子效应,应该除以8才是真正的主效应和交互作用的大小。例如A和AB的“总和”分别为-35和-211,除以8为-4.375和-26.375,对应上表中的主效应A和二交互作用AB。
Effect中的帕累托图和半正态概率图,如下所示,可以快速识别最重要的主效应和交互作用。其中前三名为AB,AD和BCD,分别对应Shainin方法中的红X、粉红X、浅粉红X。Shainin方法中,对方差分析表中所有主效应和交互作用的“总和”进行手动排序,可以给出相同的结论。


3.3 ANOVA方差分析
统计分析软件可以算出所有因子的平方和、均方、F值、p值,根据p值确定因子的显著性,如下图所示,所有的主效应和交互作用都是显著的!

下图是模型拟合相关的分析,特别关注三个R^2项,代表模型质量好坏。检验三个R^2的差值在0.2以内比较合理。Predicted R^2=0.98,代表模型可以解释新数据98%的变异性。

下图则是模型系数,软件同时会给出编码和未编码的模型公式。要强调的是,模型系数是效应值的1/2,原因是-1和+1水平的差值为2。

3.4 Diagnositc模型诊断
模型的适合性检验,包括残差正态性检验,残差vs预测值(resid. vs pred.),残差vs运行序(resid. vs run),残差vs因子(resid. vs factor)等,查看是否存在非正态和异常点。Design Expert还可以提供Box-Cox转换,确定是否需要转换,以及如何转换。

3.5 Model Graphs:查看主效应图和交互作用图。
可视化查看显著的主效应和交互作用图,比如下图为案例中最显著的项:交互作用AB,两条线交叉证明二交互作用AB显著。注意不仅要看是否平行,还要关注每个点的置信区间。还可以滑动下图右方的因子C和因子D的取值,了解交互作用AB是否与C和D相关,即分析更高阶的三交互作用ABC和ABD是否显著。了解显著的主效应和交互作用,下一步就是尝试从专业经验角度解释,特别是交互作用产生的非线性本质。

案例之外的几点思考
1. DoE统计分析背后,还有更基础的统计知识,比如为什么(半)正态概率图可以识别显著的效应和交互作用(Effect阶段),为什么(半)正态概率图可以判断残差是否正态(Diagnostic阶段);ANOVA的原理、残差检验的原理,这些我会作为“统计基础”单独分享。
2. 信噪比非常重要,信噪比的概念有点类似于过程能力指数Pp,Pp是过程规格限与过程波动的比值,一个不够严谨的类比,或许对有些人理解信噪比有所帮助。
3. 如果完全析因试验没有重复试验,或者我们只有重复测量,将测量平均值输入软件;对应完全析因试验来说,没有中心点试验,没有重复试验,那么残差项的自由度为零,就无法计算统计功效、无法进行ANOVA方差分析,因为没有误差项的均方,就无法进行F检验。当然实际还有妥协的办法,就是“剔除不显著项”并入误差项。
4. 细心的读者会发现,ANOVA方差分析,所有的因子都非常显著,p值都小于0.002,按照正常流程,就无法删除显著因子;但此时要注意,因子显著并不代表有实际意义,可能只是误差太小,试验重复性很好所致。所以还是要综合考虑效应值大小,剔除贡献相对较小的项,以简化模型。
5. 本文有疏漏和错误,还望读者留言更正。
如果你认为本文对你有所帮助,欢迎关注公众号、收藏、点赞、转发!如有疑问,欢迎私信留言,一起切磋,共同提高。
