好的实验设计的基本原则2-2:实验设计环节如何控制波动

之前两篇文章介绍了前两个原则,一是对比控制,二是控制波动之测试系统; 本文分享控制波动的第二个环节,即实验设计环节。

很多研发项目和技术支持项目的关键是分析波动来源,发现“关键影响变量”,找到了“关键影响变量”就抓住了问题的本质,。

如果研发人员缺乏统计思维,不从控制波动的角度去思考实验设计,就很容易犯错误。

从控制波动的角度来看,实验分成以下三个阶段:

第一步,控制波动的前提是明确波动在哪里,详细罗列所有可能的影响因素,列举时有几个原则,一是多多益善,最开始不要做筛选;二是罗列要有基本逻辑,强烈推荐使用金字塔原理,遵循MECE法则。

第二步,根据经验和专业知识,对影响因素进行分类分组。一种分组方法是,哪些是主要影响因素,哪些是次要的影响因素;另一种分组方法是,哪些是不需要研究详细的影响规律而终点是避免干扰实验的噪声变量,哪些是我们需要详细研究的控制变量。(来个图)

第三步,最后一步才是具体的实验设计和执行环节,具体又分很多实验策略。比如假设思维和对比验证,通过建立假设,然后通过对比实验证实或证伪零假设;比如随机化和区组化, ”随机化你能控制的,区组化你不能控制的“;比如“理想化”策略,这是一个非常有效的控制噪声变量的方法,很多人面对很多变量一筹莫展,如果善用“理想化”策略,就更容易聚焦关键因素。

做完第三步,要经常回头看一下第二步甚至第一步,是否随着实验经验的积累,发现了新的变量,或者之前认为不重要的变量才是关键影响因子,这些是实验中经常会遇到的情况。实验就像PDCA循环(Plan-Do-Check-Action),是一个不断迭代、不断加深对实验的理解、不断趋近答案的过程,按照《控制论与科学方法论》中的观点,就是不断提高控制能力的过程。

学习统计和阅读六西格玛图书后,我们知道,要想控制实验设计的波动,常见的方法就是随机化、区组化、增大样品量、重复实验等操作。这些操作主要是在第三步,但不能一开始就直接做第三步实验设计,不然容易费时费力又不出结果。

好的实验设计的几个原则:对比,随机,尽可能多的样本。——《统计的的世界》
六西格玛实验设计(DOE)之中,控制波动的三大基本原则:重复实验,随机化、区组化。 ——《六西格玛管理统计指南》

至于六西格玛DOE工具,只是第三步实验环节的强大工具,前提还是要缩小实验变量的数量和确定合适的控制范围,然后才通过DOE实验和软件辅助,量化变量的贡献大小,如有必要在拟合模型和“爬坡”。所以欧老师反复强调,DOE只是个工具,如何确定DOE中的因子和水平,这是DOE之外的功夫。

一句话总结就是,先罗列可能的影响因素,然后进行重要性排序和分组,最后进行实验验证(对比验证或DOE等),通过迭代实验,找对“关键影响变量/因子”。



换一个角度讲,实验设计中控制波动的错误操作是什么?

错误1:控制得太粗糙,一般是研发人员的专业知识欠缺或实验经验不足所致。

错误2:控制得过细,这是完美主义者常犯的错误,但还常常引以为豪。实验讲究效率,不能用战术上的勤奋(所有影响因素都研究透彻),掩盖战略上的懒惰(忽视了实验之前的影响因素罗列、筛选、分析、验证)。用麦肯锡咨询的话说,不要妄想烧干大海。

错误3: 不分主次一锅乱炖,缺乏逻辑性。



简单分析工作中遇到的几个相关案例。

举例1: 化妆品客户使用进口膨润土制备一种轻微分层的“分层化妆水”产品,实验室评估效果完全达到竞品状态;但是购买一包产品并进行试生产时,发现分层效果有明显差异。我去拜访客户,通过和客户沟通,了解客户的实验情况,协助分析具体原因。

这是一个典型的寻找未知影响因素的技术支持项目,首先罗列膨润土最相关的一些影响因素,然后通过和客户沟通,了解他们已经做的对比试验,协助他们分析实验结论,以及是否需要增加实验。

罗列影响因素:膨润土添加顺序,分散条件(温度、时间、搅拌转速、搅拌器类型等),膨润土本身的粘度波动,其他未知因素

我最先想到的是膨润土的分散差异导致不同的分层效果,所以和客户确认他们的操作一致性,对方给出了非常明确的肯定。既然同一个样品的重复都能获得一致的分层效果,这样就排除了膨润土本身的添加顺序、分散条件和粘度波动的可能性。我当时的想法是,如果找不到原因,就要用”理想操作“再重复实验。

最后和客户确认订购的膨润土的牌号和coa数据,才发现和之前实验室提供的样品不一样,而我们和代理商之前都”默认“是一样的产品,问题就这么简单的解决了,顺便增加了进口膨润土产品的认识。

举例2: 客户使用一款进口膨润土的泥膜产品,使用两个批次的膨润土样品,做出来的泥膜小样的稳定性有明显差异,客户怀疑是膨润土导致了泥膜产品的不稳定性,又临近产品生产上市,所以我去客户当面讨论,尝试协助分析分析问题。我拜访客户时,心里完全没底,不确定能否帮助客户解决问题,但是很兴奋,因为解决未知问题才有成就感啊。

罗列影响因素:膨润土添加顺序,膨润土的分散溶剂,分散条件(温度、时间、搅拌转速、搅拌器类型等),膨润土本身的粘度波动,配方中的其他助剂的影响,其他未知因素

现场和客户沟通,客户清晰的描述目前的问题,首先和客户明确”稳定性不好“是什么意思,用什么方法测试的,重复性如何,排除测试系统的波动误差。然后我从膨润土的分散方式的角度去询问,是否是膨润土分散不同导致稳定性的波动,比如分散条件和添加顺序,客户答复说她注意到了这个影响因素,实验做到了尽可能地一致,认为不是这个原因,因为同一批分散出来的样品,也出现了稳定性差异。

我继续从改善膨润土分散的角度考虑,询问泥膜配方中的溶剂是什么,为了获得更理想的分散效果,我建议客户将泥膜中的醇类溶剂和水一起分散膨润土,这样降低膨润土浆体的固含量,进一步提高分散效果,从而进一步降低分散效果差异的影响(这是我的推测),客户表示可以尝试一下。

因为我之前对泥膜配方了解不多,所以请客户给我提供了他们的基础配方,去掉我们认为不影响稳定性的添加剂比如活性物、香精和pH调节剂(事后看,这里就犯错了,我以为的不是正确的!),也是避免客户配方泄密。这样我回到实验室,研究如何优化膨润土的分散条件以改善泥膜的稳定性(这是我当时唯一能想到的解决办法)。

回到实验室,利用客户提供的初始配方,摸索出基本的泥膜操作流程。然后设计不同的膨润土分散条件,制备一系列的泥膜小样,然后进行稳定性观察。结果出乎意料,所有的泥膜小样都是稳定的,并没有出现客户遇到的稳定性不足的问题。

异常就代表着有没有意识到的影响变量,通过和客户再详细沟通,发现泥膜需要满足一定的pH要求,客户会调节pH,而我下意识忽略了这个变量,因为”膨润土对pH不敏感“。回头重新做实验,发现调节pH显著(significantly)影响泥膜的粘度,自然就影响到了泥膜的稳定性。

所以最终的结论是,膨润土泥膜配方对pH敏感,下一步就是如何避免或减缓pH对泥膜稳定性的影响,这个问题就简单了,此处不提了。

值得一提的是,实验过程中保持开放的心态,多观察实验中的变化和异常,实验异常是好事,这是推翻假设和发现未知变量的过程。如果只顾埋头做实验,别人让做什么就做什么,就忽视了很多新影响变量,错失解决办法。

举例3:客户建议我们提供一种测试洗衣粉中的膨润土含量的方法,考虑到膨润土的标准测试方法是吸蓝量测试(CEC),我们用研究吸蓝量数据和膨润土含量之间的相关性(统计相关性),以确认是否能达到客户的精度要求。

我们配置从0到100%的一系列样品,膨润土含量分别是0,2,4,6,8,10,20,30,40,50,60,70,80,90,100%,一共15个样品,按顺序编号,因为测试周期较长,分成三组(0-8%,10-60%,70-100%)依次交给实验室同事,请他们协助测试。

结果发现,组间规律性不强,组内线性都很好。我当时的疑问就是,样品并没有随机编号,测试人员知道结果是递增或递减的规律,从而下意识引导他们去趋近于更有规律的数据,当然这不是造假,这更多是一种心理暗示。因为CEC测试的终点是滴定终点,肉眼观察终点本身存在误差,而洗衣粉的引入放大了误差,所以测试人员就会下意识地贴合样品编号的顺序。事后重新随即编号测试,线性明显变差,也验证了这一点。 这个例子犯了没有随机性的错误。

举例4: 测试膨润土的柔顺增强性能,具体方法是洗涤四组毛巾,分别添加不同含量的膨润土,洗完后,每组毛巾上别上不同颜色的曲别针,或者贴上不同颜色的标签,以示区分。然后各取出一条毛巾,随机平行挂在一起,请同事分别进行打分。 这里的毛巾柔顺测试,几组毛巾贴了不同颜色的标签,然后挂起来让测试者测试柔顺性能。

不谈主管打分的设定和数据分析,这儿想要强调的还是随机性和盲测,每次四组毛巾,一直用ABCD,BCDA,CDAB和DABC排序,这不叫随机,这本身也是规律。测试者可能在摸毛巾之前已经推测到,毛巾的顺序是依次递进的,但又要证明自己的手感,这样客观评价结果中就掺入了主观的判断。另外如果毛巾上的标签不能完全隐藏起来,我们认为测试者不会关注到,但测试者无意之中的观察,也会对他们的评价造成干扰。

总而言之,成功的实验总是相似,失败的实验却各有各的错法。本文是从实验设计中的波动控制的角度谈一下想法,作为自己的工作经验总结,也希望对看到本文的朋友有所启发。

2021-11-10 update
2021-12-14 update
2022-2-7 2-8 update
2022-2-17 发布