新英格兰医学杂志 (The New England Journal of Medicine,以下简称「新英格兰」) 是医学领域的顶级学术刊物,没有「之一」。用大家熟悉的衡量学术刊物的指标影响因子来说,「新英格兰」2015 年的影响因子高达 55。可以说是独孤求败。相比之下,其他学术刊物如柳叶刀的最新影响因子是 45;我们一般科研工作者可望不可及的自然、科学、细胞期刊的影响因子也只有 30 出头。所以「新英格兰」的编辑一说话,整个美国乃至世界医学领域都为其「马首是瞻」。
可是,「新英格兰」 2016 年 1 月 21 日这一期的「编者按」(Editorial)——「数据分享」(Data Sharing) 一文却在科学界捅了个大马蜂窝。不但引起了诸多科学家在 Twitter 上纷纷与其「划清界限」,更引发了科学界对医学科学的敏感话题「数据分享」的再次热议。那「新英格兰」到底说了什么呢?
「新英格兰」每一期的「编者按」都是介绍当期杂志里面最有价值的文章。这一期也不例外,讲的是早期直肠癌患者在手术切除肿瘤之后是不是需要做化疗。文章提了一个新观点:只有很少数(4%)的患者会从化疗中获益。这些患者的共同点是,他们(也只有他们)的肿瘤中缺少一种特殊的蛋白。所以早期直肠癌的治疗方案应先检查肿瘤中的蛋白再行确定。
这个项目是由科研人员与一个非营利组织合作,获取并分析了大量患者数据之后提出了这个新观点。照理说编辑这么总结一下就很好了。凡是地球人都可以看出这项科研很有意义。
可是「新英格兰」的大编们偏要继续拔高,画蛇添足。他们说这个项目的这种「合作型」数据分享才是王道,把数据公开放在网上的做法是歪门邪道。等等,「新英格兰」的编辑不可能讲这种不靠谱的话吧?!我们来看看相关的英文片断:
…a new class of research person will emerge — … possibly stealing from the research productivity planned by the data gatherers, or even use the data to try to disprove what the original investigators had posited. There is concern among some front-line researchers that the system will be taken over by what some researchers have characterized as「research parasites」
意译一下:这会产生一种新的研究人员——他们可能(通过抢先发文章)盗窃数据收集者的生产力,或者甚至用这些数据来反证数据收集者的结论。有些工作在一线的科学家忧虑我们的科研系统将被这样的「科研寄生虫」占领。
哇哦,我第一次读到这一段时,连看了三遍都不敢相信「新英格兰」的编辑会讲这么没水平的话。当然 Twitter 上的各国科学家看了这个不答应了!一时间无数人在 Twitter 上发言「我就是科研寄生虫」。
那么,「新英格兰」为什么这么说,这种说法又错在哪里呢?下面我们分别讨论「新英格兰」的两个受争议的论点。
反证结论?
科学之所以成为科学,是因为它可以「证伪」。任何科学结论都需经得起他人的推敲与质疑。科学发展就是在不断推翻、完善旧理论过程中螺旋上升的。任何科学实验都要能让别人检查你的数据,重复你的结论。
所以「用这些数据来反证数据收集者的结论」正是真正的科学方法。「新英格兰」的观点:只把数据提供给「合作者」不给「科研寄生虫」,是反科学的。「科研寄生虫」对科学的贡献「新英格兰」应该知道得很清楚。因为一个叫 Anil Potti 的人。
在 2006 年,杜克大学的 Potti 博士在「新英格兰」上发表过一篇轰动一时的癌症研究文章。文章的大意是他发明了一种基因测试的方法可以预言肿瘤细胞会对哪一种化疗药物最有反应。这在当时是很火的一个研究方向,有可能对肿瘤临床治疗有革命性的影响。美国国家医疗研究院(NIH)给了 Potti 几百万美元做临床实验。
著名的 MD Anderson 癌症中心想把这项革命性的成果用于肺癌临床治疗。可是 MD Anderson 的科学家 Keith Baggerly 与 Kevin Coombes 发现 Potti 发表的数据有一些疑点。所以他们去找 Potti 要原始数据。Potti 只给了一部分,另外一部分找借口不给(显然来者不怀好意是来「反证,挑刺」的)。
不过 Baggerly 与 Coombes 这两人也确实是大牛,居然在没有原始数据的情况下,用统计手段证明 Potti 肯定在数据上做过手脚。这事儿后来闹大了。到 2010 年,杜克大学停止了 Potti 的所有临床实验。在 2015 年,美国联邦政府调查结论是 Potti 用纳税人的钱伪造了数据。真要说谁是「科研寄生虫」的话,不分享数据的 Potti 才是寄生虫!
至于那篇轰动一时的「新英格兰」文章?于 2011 年被撤下。考虑到「新英格兰」今日的观点,实在是莫大的讽刺。我建议大家去网上看看那篇篇撤下的文章(见参考文献 2)。文章写得十分「严谨」又发表在超级杂志上,要是没有原始数据分析,谁敢不信它的结论?(注:Potti 事件前后共撤稿了十几篇,其中数据问题最严重的是在 Nature Medicine 上的一篇,不过「新英格兰」文章是整个事件的开始。)
在癌症研究上有一句话叫「In God we trust, everyone else must bring data」(我们相信上帝,任何其他人都得拿出数据)。这是通过几十年科研,几千亿美元投入,得来的深刻教训:很多看起来很有希望成功的治癌新方法都得不到临床数据的支持。我们现在强调循证医学(evidence-based medicine)就是因为以前走过的弯路太多了。
otti 这件事还是在造假相对很少见的美国科学界发生的事。要是在世界范围看,医学科研造假是一个很严重的问题。数据分享是保证科学质量的最重要的办法之一。所以「新英格兰」的观点是很不负责任的。
盗窃科研成果?
那么「盗窃科研成果」呢?这就更可笑了!难道数据收集者得不出的结论,其他人也不能得出了?要知道有一种科研方法叫 Meta 分析(Meta Analysis)就是专门二次研究别人的数据。
那么如果数据收集者没时间分析数据被「寄生虫」抢了先怎么办?我们看看美国国家自然基金会与美国宇航局是怎么解决这个问题的。大家都熟悉哈勃空间望远镜。那上面的科研项目也都是由科学家申请,宇航局批准的。取得的数据,先发给申请人,但是一年后自动向公众开放。也就是说,如果申请人一年内不出成果,那任何人都可以用这个数据。
宇航局这么做的原因是因为这些数据本来就是纳税人出钱才取得的。如果科学家一年不行动,纳税人就可以让有时间有兴趣的其它科学家或者公众来用这些数据。
同理,在「新英格兰」这样超一流杂志上发表的项目,一般都有美国国家医疗研究院(NIH)的资助(NIH 一年的科研经费三百二十亿美元,全是纳税人出钱)。难道纳税人看一看自己出钱产生的数据也是「盗窃」?
还是那句话:不分享数据的人才是寄生虫!
结束语
值得庆幸的是,从 Twitter 上激烈的反应看,「新英格兰」的观点远非医学领域的主流。事实上,很多主流医学期刊,比如说 BMJ、Nature 等都要求作者提供原始数据。「新英格兰」本身也在 2014 年发表过一篇文章,讲药企葛兰素史克把它资助的 200 多个临床实验数据拿出来共享的经验,结论是「即使对于追求利润的药企来说,数据分享也是十分可行的。作为追求科学发展的科学家来说,我们还能有借口不做吗?」
另外,在「编者按」发表之后短短四天,「新英格兰」发表了一个新的「编者按」澄清并改正了以前的立场。亡羊䃼牢未为晚也。新「编者按」写道:
there is a moral obligation to the people who volunteer to participate in these trials to ensure that their data are widely and responsibly used. … we will require a commitment from authors to make available the data that underlie the reported results of their work within 6 months after we publish them.
… We believe that we will all benefit most if this is done collaboratively, but the Journal’s data sharing policy will apply in all settings.
译:我们对自愿参加临床实验的病人们负有道义的责任:要保证他们贡献的数据会被广泛地,负责任地应用。… 我们将会要求作者们在文章发表六个月内提供原始数据。
译:… 我们(仍然)相信,合作型的数据共享是最有益处的,但是我们杂志的数据共享政策会对所有情况适用(不论是「合作」与否)。
最后,我们引用 美国医学协会会刊(最新影响因子 35)的一个「编者按」与大家共勉:
Replication is a vital part of the scientific method. Fields outside of medicine have already embraced sharing experimental data, as have the basic biological sciences within medicine. The culture of clinical research in medicine will need to evolve for open science to succeed.
译:可重复性是科学方法的重要组成部分。医学以外的领域,以及基础生物学,已经在共享实验数据。临床科研也需与时俱进,「开放的科学」才能成功。
参考文献及相关资料:
1. Dan L. Longo and Jeffrey. Data Sharing. N Engl J Med 2016;374:276-277.
3. Darrel Ince. The Duke University scandal-what can be done? Significance 2011; 8:113-115.
6. Proprietary Rights of MIKULSKI ARCHIVE FOR SPACE TELESCOPES.
8. Jama Editorial: Replication is a vital part of the scientific method.
9. Jeffrey M. Drazen. Data Sharing and the Journal. N Engl J Med 2016.