交互作用显著，未必真的存在

引言：在之前分享的摩托罗拉波焊案例中，响应变换可以明显改善模型预测能力，但本文的钻头案例展示的是响应变换的“颠覆性”的作用——消除统计上显著但实际可能并不真实存在的交互作用。

交互作用的重要性

因子间的交互作用是非常普遍的，这也是DoE的价值所在；假如因子之间不存在交互作用，即响应与各个因子之间是线性关系，或者说因子之间彼此独立，那直接使用传统的OFAT一次一因子试验就好了。

交互作用是理解产品/流程复杂性（非线性）的钥匙，引用最近在读图书中的两句话来强调这一点：

The interactions of factors often proves to be the key to understanding a process. p42

Very often, the detected interactions will be a breackthrough improvement in your system. p55

《DOE Simplified》

跳出DoE软件，从机理上解释交互作用

因此，在统计分析阶段，我们常常会发现一些显著的交互作用，特别是二交互作用非常普遍，有时甚至会发现显著的三交互作用（见之前分享的摩托罗拉波焊试验）。

但是，在统计分析阶段，我们容易忽视重要的一步：绘制和解释交互作用图。

例如，下图是之前分享的摩托罗拉波焊案例中的二交互作用AB、AD，工程师要基于专业经验进行机理分析，而非止步于DoE软件的分析结果。

除非交互作用的本质被充分理解了，否则将交互作用的结论推广到试验中没有出现的水平上将是困难的。

交互作用显著，并不一定存在

尝试解释显著的交互作用时，有两个常见的情况需要警惕（这是我当前的认知）。

第一种情况：显著的交互作用并不一定存在，可能源自没有理解清楚“统计显著性（significance）”和“工程重要性（importance）”的差异。

在之前的文章显著不等于重要？——摩托罗拉波焊案例的延伸思考中，我分享了“统计上显著并不代表工程上重要”的案例和分析结果。

基于我当前的阅读和实践认知，有两种可能原因：

误把重复测量当作重复试验，
试验不够随机。

或许还有其他可能，但背后的本质都是“过小的”随机变异，导致统计检验过于敏感。

反过来看，如果是”重要但不显著”的情况，实践中也很常见，背后的本质正好相反，是“过大的”随机误差，可能原因是试验计划不周，很多变异未被精确控制。

第二种情况：显著的交互作用也可能通过对响应值做变换（transformation），例如取平方、取对数、取平方根等，而被消除。

当然响应变换并不一定都能消除交互作用，而且响应变换的目的也全是消除显著的交互作用。

比如在Design Expert响应变换：摩托罗拉波焊案例的延伸思考和操作指南中，Design Expert 建议进行平方根变换，重新进行ANOVA方差分析和残差分析，显著的交互作用并没有消失，但模型的预测性（预测R2）和残差的正态分布都有明显改善，那响应变换也是有意义的。

通过响应变换，消除交互作用的例子

以下分享《试验设计与分析》例6.3中的一个案例。

例6.3 Daniel（1976）描述了一个2^4析因设计，用来研究钻头的推进速率，它是4个因子（钻头负荷（A），流速（B），旋转速度（C），泥浆类型（D）的函数。

实验数据如图6.17所示。此实验的效应估计量的正态概率图如图6.18所示。根据此图，因子B，C，D以及BC交互作用和BD交互作用需要说明。

图6.21是在变换y*=ln(y)下效应估计量的正态概率图。我们注意到，只有因子B、C、D起作用，这样，解释起来就很简单。也就是说，将数据用正确的尺度表示时，会简化它的结构，模型中那两个交互作用已不再需要了。

我们的结论是，对于y*=ln(y)，模型仅需用因子B、C、D就足以说明了。此模型的方差分析概括在表6.14中。模型的平方和是

SS模型=SSB+SSC+SSD=5.345+1.339+0.431=7.115

因此R^2=SS模型/SST=7.115/7.288=98%，所以该模型解释了钻头推进速率中大约98％的变异性.

何时变换

变换前的残差分析：

图6.19是残差的正态概率图，图6.20是残差与预测推进速率（模型预测值）的关系图，预测的推进速率来自含有可识别因子的模型。显然，关于正态性和等方差性是有问题的。处理此类问题常用数据变换的方法。因为响应变量是速率，所以对数变换是合理的选择。

变换后的残差分析：

图6.22和图6.23分别表示残差与正态概率的关系图和残差与预测推进速率的关系图，这两幅图是在对数意义下.对含有B，C，D的模型而作出对现在这些图形终于满意了。

结合以上案例，通常在以下情况需要响应变换：

1. 残差正态概率图异常；

2. 残差与预测值的关系图呈喇叭状；（预测值越大，残差越大）

3. 参考专业经验，比如响应和因子存在机理上的特定函数关系；

Design Expert建议了一个实用的经验法则：通过计算响应变量的最大值与最小值之比(Ratio = max / min)来初步判断变换必要性。经验表明：若比值大于10，通常需要进行变换(A ratio of max to min greater than 10 usually indicates a transformation is required)。注意这只是一个经验法则，而非响应变换的充分条件。

如何变换

早期使用的一种费时费力的方法是试错法，尝试一种或几种变换，从中选出能产生最满意的拟合响应残差图的那种变换。

现在常用的一种简单有效的方法是Box-Cox方法，Design Expert内置了Box-Cox方法（如下图），可以给出推荐变换形式，更多操作见Design Expert响应变换：摩托罗拉波焊案例的延伸思考和操作指南。

响应变换的本质是什么？

之所以要做响应变换，是因为ANOVA的核心假设不成立。

ANOVA分析的核心假设之一是：残差(Residuals，即观测值与模型预测值之差) 应服从正态独立分布，且与预测值(Pred.)、运行顺序(Run)、各因子(Factors)等变量均无关。

在实际当中，这些假定条件通常不完全成立。因此，在这些假定条件的有效性尚未核实之前就依靠方差分析，通常是不明智的。是否违背了这些基本假定和模型的适合性，可以很容易地利用残差检验来进行分析。

《试验设计与分析》

如果响应值在比较小的范围内变化，不容易出现这个问题；而响应范围过大，也就是经验法则Ratio大于100，就容易出现残差不正态、不独立的情况，这本身就是试验控制不足的表现，不论是因为更多的噪声变量，还是因为测试设备不够线性。

对响应变量做变换，“将数据用正确的尺度表示”，本质就是让ANOVA的核心假设成立。

回到实践中，不要止于软件分析

交互作用显著，未必真的存在。

交互作用不显著，未必真的不存在。

一个显著、重要、且无法通过变换消除的交互作用，是可以用简单语言描述的、有具体物理意义的交互作用。

最终，我们仍要借助于专业经验，从机理的层面去解释，这样才能形成工程师的Knowhow，成为真正的问题解决者。

如果本文对你有所帮助，欢迎点赞👍、推荐❤️、分享📣

学习DoE，使用DoE，只为解决问题！