科学家为何不愿分享数据?

2012-08-29 16:23 来源:科学网 作者:黄 晓磊
字体大小
- | +

我们联合中国科学院、美国加州大学、美国农业部和加拿大蒙特利尔大学等单位的同行,在前段时间开展了一项有关科学家对数据共享的态度和期望的国际调查研究。该调查研究取得了一些很有意思和启发的结果。科学家为何不愿意分享数据?什么情况下愿意分享?哪些措施可以促进共享?

科学数据共享越来越引起广泛地关注和讨论,一方面由于数据共享对于科学本身和“大科学(big science)”的发展至关重要,也由于它是各国政府科学决策的重要议题。《科学》和《自然》都曾在近期发表社论和专刊来讨论如何科学数据共享存在的问题及如何推进共享进程。2012年3月29日,美国白宫科学和技术政策办公室以及总统执行办公室宣布启动“大数据(big data)计划”。

在全球变化和环境恶化背景下,为更好地理解和保护地球生物资源,生物多样性数据的共享显得尤其重要。2001年,由联合国环境规划署和多国政府启动了“全球生物多样性信息机构(Global Biodiversity Information Facility,GBIF)”,旨在促进全球生物多样性数据的共享。虽然近年来有越来越多的大型数据共享计划被启动,但包括GBIF在内的众多计划存在一个问题:它们“自上而下”的运作模式会忽略众多科学家们的观点和意见,从而可能妨碍数据共享进程。实际上,作为数据的收集者、发表者和使用者,科学家们的任何意见都应该被科学决策过程充分考虑。

为更好地了解科学家对于生物多样性数据共享的态度、经验和期望,我们联合中国科学院、美国加州大学、美国农业部和加拿大蒙特利尔大学等单位的同行,于2011年7月至9月开展了第一项有关该主题的国际调查研究。调查采用网络问卷的形式,参与调查的对象包括生物多样性和保护生物学领域主要期刊的通讯作者,以及相关领域国际学会的成员。调查引起了国际同行很大的兴趣,研究团队共收到五百多份回复及来自150多位科学家共十八页的评论。这些回复和评论真正反映了科学家们对于生物多样性数据共享的观点。

调查结果显示大部分科学家都认为数据共享非常重要,并愿意分享已发表论文的相关数据,但超过60%的科学家不愿意共享未发表的数据。调查显示在生物多样性领域数据分享文化并不发达,一些技术和认识障碍包括需要对数据做更多分析、同行竞争、缺少足够的回报、缺少简便的数据提交工具、没有足够的时间和经费、不熟悉相关数据保存机构等。

实际上有关数据共享有两类截然不同的看法:部分人认为由公共资金支持的研究所获得的数据理应向全社会共享;另一部分人认为科学家共享数据应该获得相应的利益或回报。调查显示科学家们希望从数据分享中获得相应的回报,比如数据所有权、共同作者身份、更多的引用等。很多被调查者认为数据共享应该在科研评价体系中获得足够的认可,比如数据集的重新利用或引用应该获得像论文引用一样的对待。

一个有意思的假设是:受到研究单位或资助机构鼓励的科学家应该更倾向于分享数据?对调查结果的统计分析清晰地证实了这个推论。这暗示研究结构或资助结构对于科学家的分享行为有重要的影响力,来自单位的积极措施将有助于促进数据共享。

通过对主要全球性多样性数据库的调研,我们之前曾在《Trends in Ecology & Evolution》发文建议“多样性数据库和科学期刊采用联合数据保存政策”,将研究论文所基于的多样性数据用较为统一的数据格式整合进数据库。通过对《Journal of Biogeography》杂志2010年所发表的104篇标明物种和分布数量的论文(全年论文的一半)的统计分析,我们发现这些论文贡献了12782个物种的367000条分布记录。这些数据说明一个期刊仅一年就可贡献大量的生物多样性数据。联合数据保存政策对于数据库和期刊应该是双赢的策略,并将是一个在数据数量和质量上可持续的方法。在该次国际调查中,大部分科学家表示愿意接受联合数据保存政策,并表示愿意在论文发表后立刻或者在一小段时间内将相关生物多样性数据共享。这暗示联合数据保存政策的方法值得推进。

调查还反映了科学家对多样性数据库的期望,包括标准数据格式、简单易用的数据提交工具、高数据质量、数据库间的交互和协调等。

该国际调查研究首次关注作为生物多样性数据分享者和使用者的科学家们的看法,所获得的数据集也有重要价值。总结和讨论该调查结果的论文于最近发表在《Conservation Letters》。为了践行数据分享,我们已将所获得的原始数据集和十八页评论在Dryad共享,供大家下载使用。

针对调查所揭示的问题,论文给出了促进数据共享的相应建议,比如:利用统一数据标识符(DOI)可以解决数据所有权和计算引用的问题;研究结构和资助机构应该更多地鼓励数据分享并提供详细的分享指南;数据库和期刊采用更加合理和严格的数据保存政策;数据库应更多地考虑数据提供者和使用者的夙求,提高数据库的可操作性和数据质量。

编辑: zhongguoxing

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。