同行评审的数据论文可行吗?

2013-01-17 20:58 来源:科学网 作者:黄 晓磊
字体大小
- | +

科学数据共享越来越引起广泛的关注和讨论,“大数据”一词也更多得进入大家的视野。我之前在《科学家为何不愿意分享数据?》一文中介绍了我们所开展的一项有关科学家对数据共享的态度和期望的国际调查研究。调查显示科学家希望从数据分享中获得相应的回报,并在科研评价体系中获得足够的认可。

2012年2月,全球生物多样性信息机构(Global Biodiversity Information Facility,GBIF)在其网站宣布了一份意见书,提倡推进基于同行评审的生物多样性数据发表模式。这实际上是GBIF和出版商Pensoft在2011年所提议的“数据论文(data paper)”的升级版本。他们提议“用于网络共享的数据集的元数据文件可以采用学术论文的形式发表”(即数据论文),该类论文主要是一个包含数据集链接的元数据文件。作为一种新的共享模式,联合国生物多样性公约组织(Convention on Biological Diversity,CBD)在其2012年4月份的一份旨在促进生物多样性数据共享的文件中推荐了数据论文。

数据论文被提出的主要目的是为改善科学评价机制和数据质量控制提供一个方法。一方面,数据论文是正式的学术论文,其引用可以被用于科研评价体系,从而激励科学家更多的分享生物多样性数据。另一方面,同行评审过程可以进一步控制数据集的质量。就其出发点,数据论文看起来很合理,也因此一些从事生物多样性研究的同行也已在一些报告中介绍数据论文。但实际上,如果考虑到潜在作者群体的行为特征,以及同行评审过程本身的特点,数据论文或许缺少一定的可实践性。

收集并分享生物多样性数据的人群基本上可以分为三类。一是由公共资金支持的博物馆或标本馆,对于这些单位来说,共享数据本就是其基本义务(比如大多有对外共享数据库),因此数据论文对他们的吸引力有限。二是“公众科学家(citizen scientist)”,即非职业研究人员或爱好者,这类人或许乐意用数据论文来共享数据,他们却很多并不熟悉学术出版模式。三是职业的科学家群体,这类人是数据分享的主体。但对于他们来说,其研究多是问题驱动,并且往往不愿意分享尚未分析研究的原始数据,我们所开展的国际调查就揭示了这一点。因此,从前在作者群的特征来看,数据论文的适用对象并非那么广泛。

实际上,科学家在发表学术论文时,多将相关数据用附件材料的方式共享,这也是作者的基本义务。因此,数据论文在我们看来有些重复发表的嫌疑:科学家有必要将其在附件材料中共享的数据用数据论文的方式再次发表吗?

数据论文的推广还有一些其他问题。比如,是否应该有篇幅或数据量限制?一个广泛分布的物种的几十条分布记录好像不值得发表一篇数据论文。另外,目前鼓吹数据论文的出版商多采用开放获取的出版模式,且收取一定的发表费用,那么科学家在发表数据论文时,谁来承担发表费用?就科学家的个体意愿来讲,很少有人愿意花钱将自己的原始数据共享。对于公众科学家来说,由于没有研究经费的支持,不可能期望由他们支付数据论文的发表费用。我之前发博文介绍过《同行评审中的“审者悲剧”》,数据论文的同行评审过程无疑会加重所谓的“审者悲剧”。

虽然GBIF和Pensoft提供了一个数据发表流程,从2011年5月至2012年10月,只有五篇数据论文在Pensoft期刊发表,并且数据论文的倡议者参与了其中两篇(“托儿”)。这也暗示数据论文的可实践性存在一定的问题。如果要进一步推广数据论文,上面所提出的问题值得思考和讨论。

实际上,要解决数据论文所主要关注的科研评价和数据质量问题,并非要大力鼓吹所谓的数据论文,期刊和数据保存机构采用联合数据保存政策是一个更值得推广的策略。数据保存机构可以给每个数据集(论文相关数据或直接提交的数据)分配一个唯一且可以交互的数据标志符(DOI),可以容易的解决数据所有权和引用等问题;期刊采用较为严格的数据保存政策,要求论文作者在投稿时提交详细的元数据描述并将相关数据分享至数据保存机构,也有助于控制数据质量。

相关文献:

Huang X, Hawkins BA, Qiao G. 2013. Biodiversity data sharing: will peer-reviewed data papers work? BioScience, 63: 5-6.
Huang X et al. 2012. Willing or unwilling to share primary biodiversity data: results and implications of an international survey. Conservation Letters, 5: 399-406
Huang X, Qiao G. 2011. Biodiversity databases should gain support from journals. Trends in Ecology & Evolution, 26: 377-378.
Chavan V, Penev L. 2011. The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics, 12 (Suppl 15): S2.
Hochberg ME, Chase JM, Gotelli NJ, Hastings A, Naeem S. 2009. The tragedy of the reviewer commons. Ecology Letters, 12: 2-4.

编辑: zhongguoxing

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。