周一到了,小明又要见导师了。
小明:我准备收集一些病例,做个研究。
导师:准备纳入多少病例啊?
小明:50 例吧。
导师:50 例够吗?
小明:应该够,大家都是这么个样本量。
导师:……
这样 OK 吗?查查文献,问问大家,看看大家的样本量都在什么范围,跟着大家走总不会错?是这样吗?小编表示怀疑。经小编一番考证,发现样本量估算需要考虑以下几点。
第一:制定统计分析计划
首先要明确资料类型:是计数资料还是计量资料。若是计数资料,就涉及到率的可信区间、单个率的比较、多个率的比较。若是计量资料,就涉及到均值的可信区间、单个均值的比较、多个均值的比较。
比如,欲研究两种药物降压效果有无差别,以血压下降值为评价指标,如何制定统计分析计划呢?研究中资料类型属于计量资料(血压下降值),涉及两组之间的比较,也就是说,要比较两组均值有无差异。
第二:寻找重要参数值
明确了比较均值还是率,确定了是单组还是多组,接下来,找到相应的样本量估算公式,参照公式,去寻找重要的参数值。
比如,想比较两个独立样本的均值,知道每组样本的均值、标准差也就足够了呢。至于,这些参数值的获得,总是有方法的,我们可以查询最相关的文献,可以通过预实验……
第三:定义α和β
如果你查询了样本量的公式,那你肯定发现α和β频频出现。α是检验水准,一般双侧为0. 05,单侧为0.025;1-β是检验功效,一般取β为0.1或者0.2。
第四:确定组间的比例
如果研究中有分组,就涉及到组间比例的问题。组间比例可以是1:1,但并不要求必须是1:1。
比如,按照1:1的比例,算出每组至少需要95人,但是,根本找不到这么多病例,怎么办呢。可以看到,1:1时至少需要95人,1:2时可能71人就够了呢……需要提醒大家注意的是,组间比例不宜过大或过小,过大或过小时,会需要很大的总体样本量,不划算哦。推荐组间比例在0.25~4之间比较好。
第五:估算样本量
估算样本量的同时,需要考虑失访等其他因素以及适当增加样本量。这时候,可谓是万事俱备,只需把参数值、α和β、组间比例代入公式,样本量就来了。
需要注意的是,临床研究过程中由于失访,资料不合格等会造成样本量的消耗,所以,研究设计之初应考虑到这些因素,在估算的样本量基础上,适当增加10%~20%样本量,以保证最后纳入分析时能保证足够的样本量。
本文来自北京大学第三医院临床流行病学研究中心,版权归原作者所有;丁香园已获授权转载。