有了文章的 DOI,还会搜不到文章吗?很多科研工作者可能都经历过类似的问题,明明知道标题、作者,甚至 DOI号,却发现找不到论文。
图片来源:知乎
根据 Nature 官网的一则报道,超过 25% 的学术论文并未被妥善存档和保存,面临着永远「消失」的风险。
图片来源:Nature
这是危言耸听,还是确有其事?大家不妨和学霸君一起来一探究竟。
揭露数字档案的保存缺陷
根据上述报道,Nature 援引的其实是一项今年 1 月发表在期刊:
Journal of Librarianship and Scholarly Communication 上的题为《Digital Scholarly Journals Are Poorly Preserved: A Study of 7 Million Articles》的论文,论文的作者 —— 马丁 · 伊夫 (Martin Eve)来自伦敦大学伯克贝克学院。
图片来源:论文截图
在这项研究中,马丁 · 伊夫检查了 7,438,037 份带有数字对象标识符(DOI)的出版物是否被妥善地进行了存档。
DOI 大家应该都不陌生,这是一套识别数字资源的机制,通常由数字、字母和符号组成,可以理解为出版物「身份证」,具有唯一性,一旦生成就永远不变。
正因如此,很多时候科研人会盲目地相信只要 DOI 存在,论文就会永远存在。但事实真的是这样吗?
答案显然是否定的!
马丁 · 伊夫发现在其研究的七百多万份出版物中,有 27.64% 的出版物似乎没有被妥善地存储,仅有只有 58% 的 DOI 引用了至少一个存档库中的作品!这意味着,有超过四分之一的研究成果可能了无痕迹地消失在数字世界中。
图片来源:论文截图
更令人担忧的是,只有 0.96% 的 Crossref 成员机构可以确认在 3 个或更多的档案库中保存了超过 75% 的内容,这一发现暴露了当前学术数字档案保存系统的严重缺陷。
毫无疑问,当下的数字存储工作未能匹配上不断增长的学术研究产量。
数字档案长期保存有多难?
当然,上述研究不仅为学术界敲响了警钟,更是对数字化时代的一次深刻反思。数字化在带来的便捷同时也伴随着风险,反映在学术圈便是学术出版物长久保存的严峻挑战。
类似于纸质化材料,数字化的科学出版物同样也面临着长期保存的严峻挑战。
图片来源:Nature
服务器的故障、数据的损坏、技术的过时等等 …… 任何一种情况都可能导致研究成果的丢失,而这些技术故障的发生并不罕见。
除此之外,版权法律的限制、资金和资源的限制也在一定程度上加剧了科学出版物长期保存的难度。
毕竟咱的论文要是发了,如果学校没有订阅相关期刊,有时候自己下还得付费呢。在这种情况下,想在自己的主页提供下载备份显然是不现实的。
随着越来越多的学术期刊选择电子出版,不再出版纸质期刊,倘若缺乏有效的长期保存策略,这些宝贵的知识和数据的丢失将是不可逆转的。
大家不要以为这是危言耸听,Jeanette Hatherill 在 2020 年的一篇题为《'At-risk articles': the imperative to recover lost science》指出,由于不被索引、缺乏保存措施,许多发表在掠夺性期刊上的研究文章正面临消失的危机。
图片来源:论文截图
这些研究不仅难以被发现和引用,一旦发布平台停止运营或忽视基础维护,这些文章可能会永久消失。
更为严重的是,这些「消失」的科学可能包含有价值的研究成果,其损失将是全人类智库的巨大损失。
事实上,这样的事情已经在悄然发生。有研究报道,2000 年至 2019 年期间,超过 170 本开放获取期刊已经从互联网上消失 ……
面对这一严峻形势,我们必须采取行动。
如何拯救正在消失的论文数据?
想要改善研究论文的数据存储现状,咱们还任重道远。
在各种可行的方案中,加强数字档案的稳定性和安全性至关重要。在未来,出版机构或许需要采用更加先进的数据备份和恢复技术,以确保即使在不可预见的灾难面前,数据也能得到有效保护。
其次,开放获取政策的推广也是确保出版物安全的一个可能方式。
科学出版物的自由下载和传播可以促进知识的自由流动和广泛分享,同时还可以让一份科学出版物可能在多处都存在备份,以避免其消失的命运。
最后,各大研究机构、图书馆、出版社和科技公司等都应共同承担责任,建立一个更加稳定、可靠的学术存储环境。
公众和学者们也应提高对这一问题的认识,支持相关措施的实施。
在这个信息快速更迭的时代,保护学术论文免于「消失」是每一个人的责任。通过我们共同的努力,我们可以确保科学的光芒不会因为技术问题而黯淡,让后人也能在前人的基础上继续探索未知的领域。
试想一下,当你去世 100 年后,自己的论文还可以被其他人访问、学习,这难道不是一件很酷的事吗?