h指数评价科研人员或并不靠谱

2012-09-17 16:33 来源：科学网作者：黄晓磊

字体大小

- | +

现在h指数有愈加流行的趋势，大家认为相较于影响因子，h指数能从总体上更客观地评价研究者的水平。影响因子更多地是对期刊的评价，而h指数则兼顾了研究者的被引次数和文章数量。文双春老师被推荐至头条的博文用了个刺激人的题目《h指数准确预测科学家伙能否成大器》。但其实，姑且不论预测一个家伙能否成大器是很难的一件事儿，如果从h指数计算的本质来看，它仍然有不靠谱性。

一个缺陷是，基于不同的检索数据库如Web of Science、Scopus、Google Scholar，算出来的某个研究者的h指数常常不一样，这跟数据库的收录范围有关。这时候，我们选择用哪个？估计很多人愿意用比较高的那个。这三个里头，更多时候或许Google Scholar给出的h指数最高，我发现它有时会将非论文的材料算作引用（如果这个材料提到了你的文章）。实情是，这些检索数据库并不能体现你文章的所有引用，比如WoS，更侧重于SCI收录期刊的引用，直到最近才稳定的将一些中文期刊的引用算进去。另外，不同学科领域被这些检索数据库收录的程度不同，比如分类学期刊被收录为SCI的比例小，而分子生物学和医学则高很多。因此，不同领域科学家的h指数其实并没有太多可比性。

但我觉得一个更加值得关注的缺陷是：h指数没有区分作者的实际贡献。

来看一个简单的例子。A和B是紧密的合作者，两者共同发表论文，共同署名了20篇引用次数超过20的文章。这时候两者的h指数都是20，表面上看好像科研水平相当。但是，在这20篇文章中，A是15篇文章的第一作者，而B只是5篇文章的第一作者。很明显，A作者应该有更大的贡献。所以，h指数倾向于对大的研究团队有利，多个合作者会共享比较高的h指数（大合作的实验学科就比常单兵或小集团作战的理论学科h指数高），这种情况下混淆了不同作者的实际贡献。

要真正衡量研究者的实际贡献，应该对h指数做适当的改进。比如，只统计某位研究者作为第一作者或通讯作者时的h指数。对于上面的例子，A的h指数就应该是15；而B是5。这个简单的改进也是很粗糙的，因为有时候难以界定研究者在非第一作者文章中的实际贡献。

为了让评价更细致客观，可以考虑在计算h指数时对不同顺序的作者有个权重。比如，第一作者权重为1，第二作者权重为0.7，第三作者为0.4。如果第一作者同时是通讯作者，那么权重为1；如果通讯作者非第一作者，其权重计为0.8。还是上面的例子，假定A是15篇文章的第一作者，是另5篇的第二作者；B是5篇文章的第一作者，另15篇的第二作者。这时候计算两者的h指数：A为（15*1 + 5*0.7）=18.5；B为（5*1 + 15*0.7）=15.5。我们可以发现，用现有的计算h指数的方法，A和B用h指数所代表的科研贡献都被高估了，并且现有的方法掩盖了A和B实际贡献的大小。

不知道科学计量学领域是否已经有人用这个思路修正h指数，我在Scientometrics期刊用“author+order”做关键词进行检索，没有发现相关的论文发表。如果还没有关于作者顺序对h指数影响的研究发表，我建议相关领域的同志们考虑下这个问题并且设计一定的算法。当然要考虑到其他一些问题，比如作者排名的权重问题（即如何更客观地衡量在文章中的实际贡献）。同时，也不得不考虑到修正算法的简洁性，太复杂不利于推广使用，h指数和影响因子之所以能流行，就是因为其简单性。当然，对于发表论文时作者不按实际贡献排名（比如可能按名字字母顺序）的领域，就要想其他能反应实际贡献的修正算法。

注：本文是想谈h因子可能存在的缺陷，希望大家能提出相应的看法，而非说h指数没有合理性，或者说建议只看第一或通讯作者。留言中有些同志说“你整个标准出来”，我觉得这是非理性的讨论方式，恕不予回复。

编辑： zhongguoxing

版权声明

本网站所有注明“来源：丁香园”的文字、图片和音视频资料，版权均属于丁香园所有，非经授权，任何媒体、网站或个人不得转载，授权转载时须注明“来源：丁香园”。本网所有转载文章系出于传递更多信息之目的，且明确注明来源和作者，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。同时转载内容不代表本站立场。

os

os

os

os

os

关注频道微博

快速获悉最新信息

App下载

下载医学时间

每天10分钟成学霸
X
关注我们

手机扫一扫

关注丁香园微信号

胸外	肾内	风湿免疫	感染
呼吸	消化	丁香公开课	检验
医疗器械	血液	超声	康复
耳鼻喉	重症	口腔	皮肤
精神	医院汇	神外	眼科
整形	普外	影像	麻醉
泌尿	儿科	妇产	会议
丁香六度	健康互联	药品汇	PUBMED
内分泌