样本量估算:你准备好了吗?

2015-12-04 21:54 来源:北京大学第三医院临床流行病学研究中心 作者:​王晓晓 赵一鸣
字体大小
- | +

周一到了,小明又要见导师了。

小明:我准备收集一些病例,做个研究。

导师:准备纳入多少病例啊?

小明:50 例吧。

导师:50 例够吗?

小明:应该够,大家都是这么个样本量。

导师:……

这样 OK 吗?查查文献,问问大家,看看大家的样本量都在什么范围,跟着大家走总不会错?是这样吗?小编表示怀疑。经小编一番考证,发现样本量估算需要考虑以下几点。

第一:制定统计分析计划

首先要明确资料类型:是计数资料还是计量资料。若是计数资料,就涉及到率的可信区间、单个率的比较、多个率的比较。若是计量资料,就涉及到均值的可信区间、单个均值的比较、多个均值的比较。

比如,欲研究两种药物降压效果有无差别,以血压下降值为评价指标,如何制定统计分析计划呢?研究中资料类型属于计量资料(血压下降值),涉及两组之间的比较,也就是说,要比较两组均值有无差异。

第二寻找重要参数值

明确了比较均值还是率,确定了是单组还是多组,接下来,找到相应的样本量估算公式,参照公式,去寻找重要的参数值。

比如,想比较两个独立样本的均值,知道每组样本的均值、标准差也就足够了呢。至于,这些参数值的获得,总是有方法的,我们可以查询最相关的文献,可以通过预实验……

第三定义α和β

如果你查询了样本量的公式,那你肯定发现α和β频频出现。α是检验水准,一般双侧为0. 05,单侧为0.025;1-β是检验功效,一般取β为0.1或者0.2。

第四确定组间的比例

如果研究中有分组,就涉及到组间比例的问题。组间比例可以是1:1,但并不要求必须是1:1。

比如,按照1:1的比例,算出每组至少需要95人,但是,根本找不到这么多病例,怎么办呢。可以看到,1:1时至少需要95人,1:2时可能71人就够了呢……需要提醒大家注意的是,组间比例不宜过大或过小,过大或过小时,会需要很大的总体样本量,不划算哦。推荐组间比例在0.25~4之间比较好。

第五估算样本量 

估算样本量的同时,需要考虑失访等其他因素以及适当增加样本量。这时候,可谓是万事俱备,只需把参数值、α和β、组间比例代入公式,样本量就来了。

需要注意的是,临床研究过程中由于失访,资料不合格等会造成样本量的消耗,所以,研究设计之初应考虑到这些因素,在估算的样本量基础上,适当增加10%~20%样本量,以保证最后纳入分析时能保证足够的样本量。

本文来自北京大学第三医院临床流行病学研究中心,版权归原作者所有;丁香园已获授权转载。

查看信源地址

编辑: 张婷

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。

  • App下载