孙学军老师的博文《2012年度SCI杂志影响因子早知道》中提到,“根据往年的经验,杂志的影响因子和数据库中的数据并不完全偶合。存在几乎5-10%左右的误差,也不了解任何这方面的解释”。我猜测一下可能的原因。本来想在该文的评论中说一下,但我发现发评论无法贴图片。没图片说不清,也就自己写一个博客吧。
PLoS ONE稿件量太大,检索难度大,不适合举例。我用一个论文数少的期刊为例,Biology Direct。
在Web of Science的主检索页面输入期刊名称Biology Direct,论文发表时间选择2009-2010。
检索到Article和Review共115篇,这115篇文章在2011年共被引用432次。
用432除以115得到影响因子3.76。这个值一般都低于最后公布的影响因子。孙老师估计是5-10%的误差。下面是我猜测的原因。
在Web of Science首页点击Cited Reference Search,输入期刊名和时间,得到该期刊2009-2010年发表论文的被引用情况。
这个页面上Citing Articles一列的所有数值之和是934。而上一个图显示检索到的被引用总次数是835次。两者之差99次,在前面的检索中未检索到。以此图显示结果为例,Agur, Zvia和Agur, Z.三行实际上是同一篇论文,由于引用论文的参考文献写作不规范、打字错误等原因,后面两条没有对应上Web of Science收录的Agur, Z.2010年这篇文章中。用Agur, Z.2010年的论文查询只能查到被引5次。但是检索期刊被引用情况时,统计的是Biol Direct这一期刊条目下的被引用次数,后面两行的被引用次数2会被计算进来。
这99次,最理想的办法是逐一看在哪一年被引用的。我粗略估计其中大约一半是在2011年被引用的,432+50=482次。这样,计算出Biology Direct2011年的影响因子也就是482/115=4.19。
提醒大家,你的论文被引用情况,用Cited Reference Search查到的会比Search界面稍多一些。
我不知道Thomson Reuters公司是不是按我说的这样计算影响因子的。如果不是,不是我说的方法不可靠,而是他们计算影响因子的精确性有待提高。3.76和4.19之间的差值,大致符合孙老师说的5-10%的误差。
注:我们实验室,除了做生物学研究外,在基于引文的科研评价方面也做过一点工作。我们的研究结果显示,用论文正文中文献的出现次数代替参考文献目录中文献的计数,会更准确地反映不同文献对科学的贡献。相关论文发表后,我还写博客介绍了一下,《改进SCI:平均分配>按劳分配》。相对来说,我比多数生物学科研人员对Web of Science更熟悉一些。