在《统计数据会说谎》读书笔记 – Zero 读书笔记中, 第四章是无事瞎忙,提到的一个情况是,在没有显著性差异的地方非要比较出高低,就像用一个人早晨称体重是105,晚上称体重是103,就欢呼雀跃“我瘦了”。 实际情况是,体重秤本身可能有2斤的误差,所以105±2和103±2之间根本没有显著性差异(多说一句,这里面还有一个置信区间,而不是绝对)
上面“无事瞎忙”的第一种情况,即”测量方法过度粗略”,周围有很多的例子。
举一个工作中的例子,为了研究膨润土配方中添加剂A的含量对性能的影响,称量10g膨润土加入0.10g、0.15、0.20g添加剂A,加水搅拌配置泥浆然后测试泥浆粘度,通过比较粘度变化情况分析添加剂A的影响规律。 如果使用实验室的十分之一位天平(即显示0.00两位小数),那称量的0.1g、0.15、0.2g添加剂A,这样的实验操作是无法给出准确的结论的。 因为百分之一位天平的最后一位是存在很大的误差的,称量了0.15g,实际准确范围可能是0.12~0.18g之间。所以这个实验应该使用更精确一点的天平,比如0.000的天平(千分之一位)。
再举一个工作中的例子,我要测试两个泥浆溶液的密度,直接使用十分之一的天平称量7.0g,加入到200ml水(只精确到个位数)中,充分搅拌之后将部分溶液倒入100mL量筒中,通过将加入质量(0.1g精确度)除以体积读数(1mL精度),得到泥浆密度,这样一折腾,密度的精确度有多少呢? 最后得到的泥浆密度和水的密度完全区分不开。 这就是泥浆密度测试方法有太大波动,根本达不到我们想要的精度。 想要获得1.00g/mL精度的结果,还需要用精确度更高的天平和量筒,或者直接使用专门的泥浆比重计。,如下图所示,可以读取1.03g/mL的结果,精确到第一位小数点,这样足以区分不同泥浆的密度。

“无事瞎忙”的第二种情况是“过度精细”,即“测量方法过度精细”,精细过度产生的是浪费。 还是以称量体重为例,某人为了减肥要每天称重了解自己在半年甚至一年内的体重变化趋势,从而验证“迈开腿,管住嘴”的减肥效果,一般体重秤的精确度可能2斤就足够了,如果有哪位千金小姐非要买一个百分之一甚至千分之一精度的体重秤,那就真的是要被我嘲笑一番,这可真是无意义的奢侈消费啊。 同样道理,上面说的称量添加剂质量或体积,如果使用过度精细的仪器,也是一种浪费,比如用百分之一位的天平足矣,非要用万分之一的天平,就没必要了。
在过度粗略和过度精细之间,就是我们想要的平衡点,此时正好是我们想要的精度,既不会因为粗略导致结论不准确,又不会因为精细而产生不必要的浪费。
不仅精细和粗略之间有一个合适的平衡点,其他方方面面也是如此,比如现在春节了,工作和家庭的平衡,学习与在家唠嗑的平衡,等等,此处不再展开。
Revision:
2019.2.6 大年初二 山东老家,继续读《统计学会撒谎》有感,草稿 20min
2019.2.8 抽空补充完整,使用mweb软件完成并发布