交互作用显著,未必真的存在

引言:在之前分享的摩托罗拉波焊案例中,响应变换可以明显改善模型预测能力,但本文的钻头案例展示的是响应变换的“颠覆性”的作用——消除统计上显著但实际可能并不真实存在的交互作用。
交互作用的重要性
因子间的交互作用是非常普遍的,这也是DoE的价值所在;假如因子之间不存在交互作用,即响应与各个因子之间是线性关系,或者说因子之间彼此独立,那直接使用传统的OFAT一次一因子试验就好了。
交互作用是理解产品/流程复杂性(非线性)的钥匙,引用最近在读图书中的两句话来强调这一点:

The interactions of factors often proves to be the key to understanding a process. p42

Very often, the detected interactions will be a breackthrough improvement in your system. p55

《DOE Simplified》
跳出DoE软件,从机理上解释交互作用
因此,在统计分析阶段,我们常常会发现一些显著的交互作用,特别是二交互作用非常普遍,有时甚至会发现显著的三交互作用(见之前分享的摩托罗拉波焊试验)。
但是,在统计分析阶段,我们容易忽视重要的一步:绘制和解释交互作用图。
例如,下图是之前分享的摩托罗拉波焊案例中的二交互作用AB、AD,工程师要基于专业经验进行机理分析,而非止步于DoE软件的分析结果。
图片
除非交互作用的本质被充分理解了,否则将交互作用的结论推广到试验中没有出现的水平上将是困难的。
交互作用显著,并不一定存在
尝试解释显著的交互作用时,有两个常见的情况需要警惕(这是我当前的认知)。
第一种情况:显著的交互作用并不一定存在,可能源自没有理解清楚“统计显著性(significance)和“工程重要性(importance)的差异。
在之前的文章显著不等于重要?——摩托罗拉波焊案例的延伸思考中,我分享了统计上显著并不代表工程上重要”的案例和分析结果。
基于我当前的阅读和实践认知,有两种可能原因:
  • 误把重复测量当作重复试验,
  • 试验不够随机。
或许还有其他可能,但背后的本质都是“过小的”随机变异,导致统计检验过于敏感。
反过来看,如果是”重要但不显著”的情况,实践中也很常见,背后的本质正好相反,是“过大的”随机误差,可能原因是试验计划不周,很多变异未被精确控制。
第二种情况:显著的交互作用也可能通过对响应值做变换(transformation),例如取平方、取对数、取平方根等,而被消除。
当然响应变换并不一定都能消除交互作用,而且响应变换的目的也全是消除显著的交互作用。
比如在Design Expert响应变换:摩托罗拉波焊案例的延伸思考和操作指南中,Design Expert 建议进行平方根变换,重新进行ANOVA方差分析和残差分析,显著的交互作用并没有消失,但模型的预测性(预测R2)和残差的正态分布都有明显改善,那响应变换也是有意义的。
通过响应变换,消除交互作用的例子
以下分享《试验设计与分析》例6.3中的一个案例。

例6.3 Daniel(1976)描述了一个2^4析因设计,用来研究钻头的推进速率,它是4个因子(钻头负荷(A),流速(B),旋转速度(C),泥浆类型(D)的函数。

实验数据如图6.17所示。此实验的效应估计量的正态概率图如图6.18所示。根据此图,因子BCD以及BC交互作用和BD交互作用需要说明。

图片
图6.21是在变换y*=ln(y)下效应估计量的正态概率图。我们注意到,只有因子B、C、D起作用,这样,解释起来就很简单。也就是说,将数据用正确的尺度表示时,会简化它的结构,模型中那两个交互作用已不再需要了。
图片

我们的结论是,对于y*=ln(y),模型仅需用因子B、C、D就足以说明了。此模型的方差分析概括在表6.14中。模型的平方和是

SS模型=SSB+SSC+SSD=5.345+1.339+0.431=7.115

因此R^2=SS模型/SST=7.115/7.288=98%,所以该模型解释了钻头推进速率中大约98%的变异性.

图片
何时变换

变换前的残差分析:

6.19是残差的正态概率图,图6.20是残差与预测推进速率(模型预测值)的关系图,预测的推进速率来自含有可识别因子的模型。显然,关于正态性和等方差性是有问题的。处理此类问题常用数据变换的方法。因为响应变量是速率,所以对数变换是合理的选择

图片

变换后的残差分析:

6.22和图6.23分别表示残差与正态概率的关系图和残差与预测推进速率的关系图,这两幅图是在对数意义下.对含有BCD的模型而作出对现在这些图形终于满意了。

图片

结合以上案例,通常在以下情况需要响应变换:

1. 残差正态概率图异常;

2. 残差与预测值的关系图呈喇叭状;(预测值越大,残差越大)

3. 参考专业经验,比如响应和因子存在机理上的特定函数关系;

Design Expert建议了一个实用的经验法则:通过计算响应变量的最大值与最小值之比(Ratio = max / min)来初步判断变换必要性。经验表明:若比值大于10,通常需要进行变换(A ratio of max to min greater than 10 usually indicates a transformation is required)。注意这只是一个经验法则,而非响应变换的充分条件。

如何变换

早期使用的一种费时费力的方法是试错法,尝试一种或几种变换,从中选出能产生最满意的拟合响应残差图的那种变换。

现在常用的一种简单有效的方法是Box-Cox方法,Design Expert内置了Box-Cox方法(如下图),可以给出推荐变换形式,更多操作见Design Expert响应变换:摩托罗拉波焊案例的延伸思考和操作指南

图片

响应变换的本质是什么?

之所以要做响应变换,是因为ANOVA的核心假设不成立。

ANOVA分析的核心假设之一是:残差(Residuals,即观测值与模型预测值之差) 应服从正态独立分布,且与预测值(Pred.)、运行顺序(Run)、各因子(Factors)等变量均无关。

在实际当中,这些假定条件通常不完全成立。因此,在这些假定条件的有效性尚未核实之前就依靠方差分析,通常是不明智的。是否违背了这些基本假定和模型的适合性,可以很容易地利用残差检验来进行分析。

《试验设计与分析》
如果响应值在比较小的范围内变化,不容易出现这个问题;而响应范围过大,也就是经验法则Ratio大于100,就容易出现残差不正态、不独立的情况,这本身就是试验控制不足的表现,不论是因为更多的噪声变量,还是因为测试设备不够线性。
对响应变量做变换,“将数据用正确的尺度表示”,本质就是让ANOVA的核心假设成立。

回到实践中,不要止于软件分析

交互作用显著,未必真的存在。

交互作用不显著,未必真的不存在。

一个显著、重要、且无法通过变换消除的交互作用,是可以用简单语言描述的、有具体物理意义的交互作用。

最终,我们仍要借助于专业经验,从机理的层面去解释,这样才能形成工程师的Knowhow,成为真正的问题解决者。


如果本文对你有所帮助,欢点赞👍、推荐❤️、分享📣

学习DoE,使用DoE,只为解决问题!

 

Screenshot