我现在的公司(Minerals Technology Inc,简称MTI)有化妆品原料业务,为了了解市场情况,也在关注一些同行业公司的产品,近期看到陶氏推广的一款美白抗衰老(平滑皱纹)的化妆品原料Agecap,和我们现在在国内推广的视黄醇retinol传输系统(Microsponge C116A,含有23%视黄醇Retinol)有相似之处,所以了解了一下细节,却发现产品的实验数据和结论涉及到统计学的描述,这些统计学表述及其结论的关系值得探讨,以避免有意无意的误解。
所以借着这个机会,说说如何看统计描述。
陶氏的产品及表述如下
Customers want to protect their skin from external factors—such as sun, pollution, and smoking—and keep their skin looking beautiful as they age. AgeCap™ Smooth Cosmetic Ingredient traps selectively reactive oxygen species to stop damage before it is incurred.
The Dow Chemical Company
资料中有两个图片,下图是其中一个。图中对比了四种功效成分的平滑皱纹skin smoothing效果,每个活性成分测试了时间零点(day 0)和84天后的表现。
结论就是AgeCap和Vitamin C都比Placeto(空白组)有更显著的skin smoothing效果。
分析的本质是比较
Dow提供了测试结果,虽然宣称比retinol抗衰老效果好,但是完全没有提及使用的是多少含量的retinol,没有定量对比就没有多少意义,纯粹为了说明自己好而已。
那应该用和多少份的retinol比较呢? 这取决于要比较什么优势,比如AgeCap和retinol相当的刺激性为前提,或者相当的成本为前提,等。
否则只有结果的好坏,没有提供比较的平台是什么,那这种结论就不严谨。 当然很可能这只是为了简化才这样,而非Dow有意为之。
很多人为了证明自己的产品好,就把别人的产品放在了一个低劣的位置上去评估。比如经典的抗衰老添加剂retinol有公认的效果,但是使用0.05% retinol肯定不如0.1%retinol,如果只加0.02%就只是概念宣称了。
上图中的p值——随机性
要真的看懂图中表述的含义,最关键的次理解统计学中的p值概念。
p值来自显著性检验方法,指的是“零假设成立时的可能性”,具体见读书笔记《统计学的世界》第4部分统计推断 读书笔记-2 显著性检验。
拿上面的数据来说,比如橙黄色retinol组,day 0和day84之间有-5.2%的功效改善,这-5.2%的改善是源自retinol的功效,还是试验误差,答案就在p=0.107这儿,有10.7%的概率是随机性导致了观察到的-5.2%的改善,有89.3%的概率确实来自于retinol。
-6.2% p=0.017 和-5.0%,p=0.040也是一样的解释方法。
另外图上的几个横线也标记了p值,同样是表达这种差异来自于随机性而非性能差异的可能性。
比如对照组Placebo 和AgeCap的差异是p<0.01,这说明AgeCap有非常明显的效果,只有不到1%的可能性是没有效果的。但是比较AgeCap和retinol,比较AgeCap和VC,都是p<0.5,这就等于说,从概率上无法判断谁好谁
2019-07-17 这个博文放在Mweb草稿中大概一两个月了,整理发表,基于此增强自己对统计学的理解,希望没有犯错误。。