Nature 杂志教你如何用软件管理参考文献

2015-11-30 13:34 来源:中国科学报 作者:宗华
字体大小
- | +

有了数字参考管理工具,被埋葬的知识和被发现之间只有一个关键词搜索的距离。

Adam Rocker 并未指望管理其数字参考图书馆的软件能提出开展研究的更好方法。不过,他的电子文件归档系统 ReadCube 会定期扫描图书馆,并推荐一些相关论文。这和一些音乐文件管理程序会强调所推荐的曲目颇为相似。Rocker 说,这一功能带来了一些出乎意料的收获。

Rocker 是一名研究生,目前在加拿大渥太华大学学习医学。他曾研究过斑马鱼的细菌感染。当时,ReadCube 推荐了一篇利用微流体诱捕斑马鱼的论文。这比他自己的方法要简单很多,但 Rocker 通常不会阅读微流体领域的文献。他说,被提醒注意到这项研究「真的很有帮助」,尽管最终因太过寄希望于自己的项目而未采用这种替代方法。

正如 Rocker 所发现的,今天的文献管理工具已经超出简单的电子归档。如今,每个工具通过提供一系列不断演进的额外功能吸引着顾客,就像瑞士军刀一样。

日前,Nature 杂志聚焦了 8 种工具:Colwiz、EndNote、F1000Workspace、Mendeley、Papers、Read Cube、RefME 和 Zotero。它们均参与了文献管理市场的竞争,一些在简化浏览过程和建立文献图书馆方面表现出色,而其他工具专注于创建文献目录,通过共享工作空间的使用协助合作,或者推荐论文。

「驯服」文件

每种工具的存在都是为了帮助研究人员「驯服」被下载得杂七杂八且分散的 PDF。大多数科学家会涉及这个问题:在他们从期刊网站——通常指定费解的字母数字代码为文件名——抓取到 PDF 并将其大量转储到任何方便的文件夹中时,随着文件的多个拷贝遍布硬盘,混乱便会很快出现。

「在科学界,或者至少从我的经验来说,我们往往最终在桌面上会有这样一个文件夹:它的里面充斥着 3000 个名字真的很诡异的 PDF 文档。」西班牙巴塞罗那 Bellvitge 生物医学研究所神经学家 Raúl Delgado-Morales 表示。

文件管理工具通过为硬盘建立索引解决了这一困扰。通常,将一个 PDF 拖动并放入应用窗口的过程,会触发软件尝试利用数字对象唯一标识符(DOI)或标题对其进行辨认,并且从在线服务器上检索相关元数据,比如标题、关键词或作者名字。

研究人员还可指派软件监控存放文档的特定文件夹。随后,他们能通过简单地搜索作者名字、关键词,或在一些情形下搜索自己的标注寻找 PDF。比如,Delgado-Morales 利用 Papers 组织他的文献图书馆解决了这一问题。Papers 是一款根据用户选择的任何方案自动重新命名文档的应用程序。其他工具也提供类似功能,除了 RefME。RefME 是一款网站和手机应用程序,仅储存参考资料列表而非 PDF 本身。

核心功能

大多数工具能帮助研究人员输入来自多种在线资源的文献。很多提供在应用程序内搜索诸如 PubMed 和谷歌学术等外部数据库,以及能从期刊网站和其他网页上抓取文献数据的浏览器插件。

美国弗吉尼亚州乔治梅森大学 Zotero 项目负责人 Sean Takats 介绍说,成立于 10 年前的 Zotero 是一个免费的开源软件项目,专门用于解决从网页浏览器中提取信息的问题。「这是 Zotero 的关键功能,并且是同其他文献管理工具相比最强大的功能之一。」RefME 则利用智能手机的相机扫描条形码,提供不同寻常的参考文献选项。

参考文献管理软件最著名的功能之一是在一篇研究论文中插入文内引用,并以任何形式创建文献目录。被广泛使用的商业软件包 EndNote 提供这一功能已有数十年,但目前面临着来自很多现代工具的竞争。

很多工具能同常见的文字处理软件交互,因此输入一篇研究文章的用户只须选择他们想提及的论文然后点击按钮让代码插入文档中,即可标记文本内引用。随后,用户能根据上千种期刊的风格,从下拉清单中选中选项,创建文献目录和文内引用。

大多数工具包括用于阅读并为文章作注解的内置 PDF 阅读器——通常允许用户搜索评论和注解,以及基于云端的在 iPad 和台式电脑之间同步这些评论和 PDF 的能力。例如,在 ReadCube 中,PDF 里的文中引用和作者名字能呈现为主动超链,提供直接获取被引用文章和发表目录的途径。当在合作出版商的网站上查看并为 PDF 作注释时,同样的功能也是可用的。

在这些工具中,很多能辨认同图书馆中特定条目相关的文章,或者基于图书馆整体内容推荐文章。和 ReadCube 类似,F1000Workspace 利用一种算法完成此项功能。它还会利用约 1000 位专家所作的推荐。不过,很多单机软件产品也能推荐论文。

共享图书馆

目前,很多工具允许研究人员设置群组图书馆,或同远程合作者共享重要论文,尽管这一过程被谨慎管理着,以防侵犯出版商的版权。比如,Mendeley 公共群组中的人仅能共享关于一篇论文的信息,这相当于图书馆目录的一个入口。只有私人群组中的用户能共享并修改 PDF,而群组必须升级到一个付费账户,才能添加超过 3 个人。

明尼苏达大学组织心理学博士生 Brenton Wiernik 利用 Zotero 的共享图书馆完成涉及该领域中文献系统性回顾和元分析的合作项目。他介绍说,此类工作可能牵涉到 15~20 人:一些人把文章下载到共享图书馆中;其他人阅读它们;当然,更多人负责添加注释和标签,并且记录关键数据。

根据 Wiernik 的介绍,这一过程和利用共享的云存储文件夹类似,而额外的好处是 Zotero 能追踪并保存元数据、笔记和注释。比如,研究人员可利用专用标记指示他们正在处理一篇文章,以此告诉合作者应当处理不同文章,以避免重复工作。

F1000Workspace 和 colwiz 均能将共享功能扩展到准备草稿和管理项目上。F1000Workspace 公司产品研发经理 Joao Peres 介绍说,通过该工具,研究人员能利用插件将微软 Word 草稿上传到一个安全位置,从而使团队成员对共享的拷贝进行评论,尽管文本无法在浏览器中被编辑。Peres 计划实行将论文直接从 F1000Workspace 发送给期刊编辑的「一键」文章提交功能,而这会从 F1000Research 期刊开始。colwiz 还允许用户将文件共享到一个在线驱动器,以供团队成员查看和评论。

考虑到这些工具高度重叠的功能,用户的选择通常归结于特定的个人偏好。比如,加州桑迪亚国家实验室材料学家 Richard Karnesky 因开源精神而支持 Zotero。

或许,利用文献管理工具的最好原因在于此项技术能提供一种可搜索记忆的形式。礼来公司资深研究科学家 Boyd Steere 表示,想象一张堆满了打印出来的论文的桌子。而如今,充斥着 PDF 的电子文件夹在很多方面同样不容易操控。不过,有了数字参考管理工具,被埋葬的知识和被发现之间只有一个关键词搜索的距离。

查看信源地址

编辑: 任悠悠

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。