随手学统计:品茶背后的假设检验

2015-05-08 15:55 来源:丁香园调查派 作者:Stone
字体大小
- | +

调查派在 2014 年推出的「随手学统计」第一季为大家介绍了一些统计学的概念,如死亡率和病死率、灵敏度和特异度等,受到了不少医生的好评。

如今「随手学统计」第二季伴随着夏天的脚步重新归来,本期我们将在袅袅茶香中为大家介绍假设检验的原理。

女士品茶的故事


话说在英国的生物统计权威 R. A. Fisher 教授发表于 1935 年的著作《The Design of Experiment》中,有一个著名的「女士品茶」的故事。

那是 20 世纪 20 年代,一个在剑桥夏日的午后,一群大学的绅士和他们的夫人们,正围坐在英国剑桥户外的桌旁,享用着下午茶。在品茶过程中,有一位女士声称自己在喝英式茶的时候能区分出来是先倒的茶还是先倒的奶。

于是 Fisher 君就打算设计一个实验来验证这位女士是否真的如此天赋异禀,具备这样的品奶茶能力。
0844405zsw96bhts5xhsa6.jpeg

实验设计


常识告诉我们,如果想得到有意义的结论,就应该随机给女士几杯茶让女士鉴别一番,根据她答对的次数(或者答对的比例)来判断她是否有这个能力。可是问题是,要做多少次实验呢?根据结果我们又如何来给出定量的结论呢?

教授在当年就给出了他的一套实验思路:

他调配出了 8 杯其他条件一模一样而仅仅是倒茶倒奶顺序相反的茶,其中 4 杯先倒奶,4 杯先倒茶。然后他让女士品尝之后告诉他哪 4 杯是先倒奶,剩下的当然就是先倒茶啦。

结果分析


分析实验结果的时候,教授运用了这样的逻辑:

他首先假设女士没有这个能力(这个假设被称为原假设),然后如果女士很好的鉴别了这 8 杯茶,那就说明在原假设成立的情况下,发生了非常反常的现象,以至于原假设的成立是令人怀疑的。从统计的角度来说,如果在原假设成立的前提下,发生了非常小概率的事件,那我们就有理由怀疑原假设的真实性。

这也是教授假设检验的基本思路。

教授的原假设是 H0:女士没有这样的能力。在原假设的前提下,我们认为女士是毫无根据地瞎猜。这就如一个袋子里放了 8 个球,黑白各 4 个。不放回随机抽取 4 个球,其中白色球数 X 的概率分布为:(有木有回到高中的感觉?)
QQ截图20150507135504.jpg

对于这样的概率分布,教授认为,即使 X=3,女士品出了 6 杯茶,我们也不能拒绝原假设,认为女士有鉴别能力。如果在此时拒绝了原假设,那在 X=4 的情况下(女士鉴别出了 8 杯茶!)也要拒绝原假设。所以在原假设成立的前提下,拒绝原假设的概率变成了 17/70。也就是说如果女士没有这个品茶能力,她竟然能侥幸通过所有测试,使我们错误地认为她有这个能力的概率居然有 17/70!这种错误被称为第一类错误 α,一般来说不希望这个错误发生的概率超过 5%。

女士真的天赋异禀吗?


根据以上分析,Fisher 只有在女士把 8 杯茶都鉴别出来的情况下,才会认为她有这个能力。那后来这位女士怎样了呢?教授没有描述这项实验的结果,可是有位叫 David Salsburg 的统计学家写了一本书《The lady tasting tea》,在书中他告诉我们这位女士还真把 8 杯茶都鉴别出来了!
s24222987.jpg

本期小结


假设检验包含了小概率反证法思想。小概率思想是指小概率事件(P<0.01 或 P<0.05)在一次试验中基本上不会发生。反证法思想是先提出原假设 H0,再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立;若可能性大,则还不能认为假设不成立。两者共同构成了统计假设检验的核心思想。

题图来源于:Wikipedia

还想学更多统计学知识?你可以扫描下方二维码关注微信丁香调查

在微信中回复「第一讲」,查看《细说死亡率80%」

在微信中回复「第二讲」,查看《那些年绕晕我们的「率」

在微信中回复「第三讲」,查看《内含乾坤的「平均值」

在微信中回复「第四讲」,查看《灵敏度和特异度(上)

在微信中回复「第五讲」,查看《灵敏度和特异度(下)

在微信中回复「第六讲」,查看《公正的「标化」


加入丁香园调查派,参与专业调查,做个有态度的医生。

编辑: 胡靓

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。