从定义到实战:全面理解“完全析因试验” (上)

之前的文章重点介绍了试验设计(Design of Experiments, DoE)的背景知识,包括三大原则、基本术语(特别是交互作用)、步骤、目的、软件等。本文开始介绍具体工具,第一个工具是DoE中最基础也是最核心的设计类型——完全析因试验(Complete Factorial Experiments)。之前多次提到,完全析因试验是伟大的统计学家Ronald Fisher爵士在在农田科学试验中实践出来的方法,至今已有100多年的历史,但该领域的关键思想并没有变化[2],本文也不过是新瓶装旧酒,梳理我自己的思考,也希望对读者们有所启发。

一、完全析因试验(Complete Factorial Experiments)的定义

析因设计是指,在这类试验中的每一次完全试验或每一次重复中,这些因子(factor)和水平(level)的所有可能的组合都被研究到。[1] 

完全析因试验是指,因子水平的每种组合使用相同次数的析因试验。[2]

Factorial源自Factor(因子),”factorial experiment”可以直译为”因子试验”,但更常意译为”析因试验”,更贴合实际应用。

如果只有一个因子,根据水平多少,可以使用简单对比试验和One-way ANOVA;如果有两个及以上因子以及多个水平,则推荐使用析因试验,包括完全析因和部分析因等。而完全析因试验常用两水平,最多不超过三水平。

Complete强调”完全重复”,即因子和水平的每种组合被研究到,并进行相同的试验次数。”部分析因试验”,只研究一部分因子和水平的组合,如下图所示,代价是主效应和交互作用之间存在混淆(污染),未来会在部分析因试验中详细介绍。

如下图所示,以最常用的两水平试验为例,因子数量从2增加到4,完全析因试验的试验次数分别是4、8、16,试验次数随因子数量呈指数级增加。

完全析因试验的因子数量一般不超过4个,因为4因子2水平一次重复就已经达到16次试验;为了估计试验误差,提高试验精度,有时会增加一次完全重复,总共需要32 次试验。32次试验通常被认为是工业界在资源和时间允许下,进行一次深入分析的试验上限,兼顾试验效率和试验精度。

在Design Expert的析因试验中,两水平完全析因试验(Factorial Design – Regular Two-Level)细分为完全随机(Randomized)和裂区(Split-Plot)两种情况,最常用的还是前者,后者暂且不讲,以后遇到合适的案例再做分享。

二、完全析因试验的定位和目的

正如我们之前在试验设计DoE的目标和类型提到,试验设计通常遵循“筛选 → 分析 → 优化”的逻辑,完全析因试验是”分析“阶段的工具,有时又能兼顾“优化”功能。

通过前期的筛选试验,不论用经典DoE的部分析因试验,还是用谢宁DoE的线索生成工具,我们要从众多潜在因素中识别出1到4个重要因子。

如果筛选出1个因子,该因子就是根因(root cause),之后进入验证阶段。

如果筛选出2到4个因子,则进入分析阶段,使用完全析因试验验证和量化关键因子及其相互作用

在谢恩方法(Shainin,又译为谢宁)和六西格玛改进流程中,试验设计之后还有“统计过程控制”,以保持试验设计的效果。

三、完全析因试验的实践流程

在Design Expert中,完全析因试验被分成四个阶段,如下所示,下面分别展开介绍

四、试验设计——斟酌每一个细节

这一阶段可以对应于试验设计DoE的步骤的前五步,具体输出结论汇总在如下的Design Expert工作表中,包括以下内容:

五、统计分析——让数据“说话”

完成试验并收集数据后,下一步就是将数据导入Design Expert等DoE软件进行统计分析。

统计分析的目的是使用量化的语言,明确哪些是显著因子,哪些是不显著因子,是否存在显著的交互作用,并建立因子与响应之间的数学模型。一般的2k设计的统计分析步骤如下[1]:

  1. 估计因子效应
  2. 形成初始模型 (全模型,即包括所有主效应和交互作用)
  3. 进行统计检验
  4. 改进模型(移走不显著项)
  5. 分析残差(模型适合性检验,线性假定)
  6. 解释结果

后续我会通过一些实践案例,演示Design Expert的操作细节和异常处理方式。

六、优化——将洞察转化为行动

DoE中的高低水平,未必是我们想要的设置水平,因为我们要的是响应变量达到特定目标(望大、望小、望目,即最大化、最小化、趋近特定目标值),比如强度越高越好,杂质含量越低越好;同时还要考虑因子的约束条件,比如速度越快越好,温度只能在特定范围内调节,等等。

优化就是基于因子和响应的约束条件(criteria),软件基于统计分析的模型,输出一系列最优因子水平的组合,使响应变量达到特定目标。

有的项目,存在多个响应变量,同时响应变量之间还存在矛盾,同时多个因子也存在约束条件,这样的项目,最能体现DoE及DoE软件的价值,因为手动计算已经几乎不可能。

下图是来自Design Expert案例[4],三个红色因子,两个蓝色响应,模型根据两个响应的目标选择对应的因子水平。

七、预测与验证——从数据到专业经验

预测与优化不同,预测是软件根据输入的因子水平组合,通过模型计算出对应的响应值及其置信区间。

在实际生产中,可以用来预测不同操作条件下的结果。同时,将实际试验结果与模型预测结果做对比,验证模型在真实世界中的有效性。

如果验证效果很好,DoE统计分析结果和模型,就是一份宝贵的结论,用来提高我们的专业经验。

以上只是一个非常概括的标准流程介绍,实际工作中有很多的特殊情况,比如中心点试验发现模型存在弯曲(存在高阶非线性项),比如响应变量的信噪比不够高,比如模型适合性检验不显著,比如响应需要进行转换,等等,以后有机会展开介绍。后续会用一篇案例分享,介绍如何使用Design Expert操作完全析因试验。

参考文献

[1]《试验设计与分析》Montgomery, D.C.

[2]《试验设计》

[3] www.statease.com/docs/v23.1/tutorials/two-level-factorial/[4] www.statease.com/blog/unraveling-the-mystery-of-multi-response-optimization/


欢迎关注公众号,以及收藏、点赞、在看、转发!如有疑问,欢迎私信留言,一起切磋,共同提高。