科学家对期刊影响因子(JIF)可谓又爱又恨。JIF 是用于给技术类期刊权威性排名次的衡量标准。他们不只用其决定向哪里提交研究论文,还包括评价同行以及影响谁得到工作机会、终身职位以及项目资金。所有这些均要依赖这一简单、易读的数据。
然而,很多人认为一份期刊的影响因子是无用的,或者甚至有损于科学界,应当不予理会。为了设法进一步了解这个问题,一群研究人员和期刊编辑近日公布了一个数据集以及对用于计算这一「魔力数据」的被引频次的分析。他们的结论有可能会让影响因子衡量标准的批评者感到高兴。
计算影响因子看起来几乎有些直截了当。它指的是一份期刊的文章在过去两年中被引用的平均次数。例如,《自然》杂志目前的影响因子为 41.456,这大致可以解释为,在过去两年中,《自然》的每篇论文被引用了 41 次。
但这一数据很容易误读。例如,如果文章的引用频次和一个人的身高类似,那么平均数据将有一定的信息量。如男性平均比女性高,实际上知道性别之后,在预测一个人的高度时人们可以做得比随机猜测更好。但是对于在任何一份期刊上发表的文章,引用率的分布存在很大的偏离。只有一小部分有影响力的论文拥有最多的引用率。而大量的论文引用率较低,甚至是没有引用率。因此,平均引用数据经常存在较高的误导性。
JIF 有「两个问题」,西班牙巴塞罗纳庞培法布拉大学细胞生物学家、并未参与此项研究的 Lucas Carey 说。其中一个问题是「它作为一种预测指标毫无意义」,这意味着在高影响力期刊发表论文并不意味着一篇文章被引用的几率会更高。另一个问题是「JIF 的计算方式是不透明的」。
其不透明性来自于计算这一数据的私人公司汤森路透。该公司通过向科学网(Web of Science,一个详细的期刊库)销售访问渠道赚取利润,其组织的引用数据并不是公开的。需要花费精力才能获得那些引用频次的数据,它们需要从论文的参考书目部分进行整理。期刊会使用多种格式,一些期刊要求对引文进行缩写,这样使其很难辨认出被引用的论文。统计错误和完全的失误也会给数据整理增加挑战。
那么,为什么期刊出版商不彼此合作,利用汤森路透的数据库计算自己的影响因子呢?去年这一想法在英国皇家学会的一次会议上曾被提出,伦敦帝国学院细胞生物学家 Stephen Curry 说。「这很容易让人们信服。」他说,「所以核心的团体在随后几个月有机地组织在一起。」
参与 7 月 6 日数据发布的 11 家期刊包括《科学》《欧洲分子生物学杂志》《信息计量学杂志》《皇家学会学报 B》《公共科学图书馆》旗下的三个期刊、《自然》及其两个姊妹刊物。2013 年和 2014 年,这些期刊发表了 36.6 万多篇研究论文以及 1.3 万多篇评论。该团队随后梳理了汤森路透数据库,在 2015 年对这些文章的所有引文进行了统计。加拿大蒙特利尔大学期刊引用专家 Vincent Larivière 带队进行了数据分析。
研究结果给 JIF 的批评者提供了更多的弹药。引用频次的分布偏离度如此之高,以至于上述任何一本期刊中 75% 的论文低于期刊平均引用数据。因此,如果利用一本期刊的 JIF 来预测任何一篇文章的影响力都接近于猜测。该分析还揭示汤森路透数据库中存在的大量错误,很多引用与已知的论文无法匹配。「我们希望这次分析有助于揭露 JIF 被夸大的价值,同时强化这样的争论,即它是评估研究或科研人员的不恰当的标准。」该团队在一篇上传到 bioRxiv 网站的预印文章中总结称。
该团队拿着这份分析与汤森路透联系,该论文共同作者、德国海德堡《欧洲分子生物学杂志》主编 Bernd Pulverer 说。「这次讨论非常具有建设性,汤森路透希望继续对话。」他说,「然而,他们一方面认可我们提出的关键问题,但另一方面并不想改变任何可能导致期刊排名系统崩溃的事情,因为他们认为这是其重要的商业财产。」
此次数据公布后能否引起一场革命呢?可能不会,英国牛津郡学术出版专家 David Smith 说。「这些来自数量有限的期刊的结论非常有趣,值得进一步在更大范围内展开调查。」他说,但是却需要更多期刊的引用数据。「这里的一个问题是,高影响因子期刊是否拥有根本不同的引用特点。」但即便 7 月 6 日公布的数据代表了整个科学界的情况,Simith 认为,没有哪个单一的数字能够评估科学家研究的价值。「JIF 不是问题所在。」他说,「是我们认为学术发展需要这样的工作。」