在国家自然科学基金重大项目「动物源病原体的发现及其对人类致病性研究」(项目编号:81290343)等支持下,中国疾病预防控制中心传染病预防与控制研究所张永振研究员领导的研究团队,在病毒发现和起源进化的研究上取得重大突破,从无脊椎动物中发现了 1445 种新病毒,对这些新病毒与已知病毒的遗传进化研究结果,极大地完善了对 RNA 病毒的系统与进化路径的认识。
相关成果于 2016 年 11 月 24 日以「Redefining the invertebrate RNA virosphere」(无脊椎动物 RNA 病毒圈的重新界定)为题的研究论文在线发表在 Nature 上。
国内外重要媒体对该研究成果进行了报道。国际顶尖学术期刊 Nature Review Microbiology 发表评论(Highlight),以「解开 RNA 病毒圈的秘密」为题,高度评价了该项研究的重大科学意义。
病毒被称为生命科学的「暗物质」,在已知生物中基因组变异速度最快。自 1892 年人类发现第一个病毒,到 2011 年国际病毒分类委员会(ICTV)出版的第九次报告,已认定及待定的病毒共有约 2284 种(包括 DNA 病毒和 RNA 病毒)。已有的研究主要集中在引起人、动物及植物病害的病毒,导致「系统与进化病毒学」知识不够完整。
该项研究在我国北京、浙江、湖北、广西、新疆等地的陆地、江河、湖泊以及黄海、东海、南海等海洋中采集了九个动物门(节肢动物门、环节动物门、星虫动物门、软体动物门、线形动物门、扁形动物门、腔肠动物门、棘皮动物门、脊索动物门背囊亚门)超过 220 种无脊椎动物,采用转录组深度测序及相关的生物信息学分析技术,共发现 1445 种全新的病毒。
这些新发现病毒不但相互间的序列差异很大,而且与已知的 RNA 病毒序列差异也很大,表现出复杂多样的系统进化地位。按照现有的病毒分类规则,部分新发现病毒与已知病毒的差异之大足以把它们定义为新的病毒科或目(如:越病毒、秦病毒、赵病毒、魏病毒、燕病毒)。
本研究将新发现的病毒和已知的病毒分成 16 个进化群,以及可能独立成为新病毒科或新病毒目的越病毒、秦病毒、赵病毒、魏病毒和燕病毒。进一步分析发现,新病毒的遗传多样性不但远远超过了已知的病毒,而且填补了进化树上病毒属间、科间、目间的系统发生空缺,使得原本孤立的病毒科、目之间呈现出进化的连续性。
在每个进化群,病毒有非常广泛的宿主谱,包括不同的宿主生物门类,甚至不同的生物界;而感染不同生物门的病毒在进化树上是分散的,表现出不同模式的聚集簇。这些研究结果体现了病毒与宿主之间存在着复杂的相互作用,既有频繁的跨种间传播实现宿主转换,又有病毒与宿主间的局部的共进化。
病毒基因组在进化上呈现出巨大的灵活性。研究发现,病毒的结构基因和非结构基因进化历史呈现出很大的不同,这意味着病毒在长期的进化历程中结构基因和非结构基因发生了广泛而频繁的基因重组。重组既可发生在负链 RNA 病毒间、正链病毒间、正/负链病毒间,又可发生在 RNA 病毒与 DNA 病毒间,甚至 RNA 病毒与宿主之间。
RNA 病毒基因组的复杂多样还体现在基因的获得和丢失。由于 RNA 病毒序列短、进化快,导致病毒基因的获得或丢失很难发现。分析新发现的病毒基因组发现,这些事件在 RNA 病毒的进化进程中频繁发生。这表现在复杂的 RNA 病毒含有大量的辅助基因,最简单的病毒则仅由一个 RNA 聚合酶(RdRp)基因组成,这也同时提出了什么是病毒的问题。
更值得注意的是,RNA 病毒也经常从细胞生物中获取基因,包括 RNA 解旋酶、甲基转移酶、核酸酶外切酶、蛋白酶、ADP-ribose 结合蛋白和双链 RNA 结合蛋白基因,甚至大肠杆菌群集运动蛋白(NANAR 结构域)基因等等。这些基因在病毒进化史上出现的时间很不连贯,在基因组所处的位置也具有很大的灵活性,表明这些基因经历了多次独立的基因获得和缺失事件。
现有的研究认为,在病毒基因开放阅读框的数目与排列、结构和非结构蛋白基因的顺序、以及病毒基因组分节段的频率和节段的数量等特征是保守的。然而,本研究发现在一些正链 RNA 病毒进化过程中出现高频率的分节段或去分节段化(即重新成为不分节段基因组)。负链 RNA 也有多种分节段的组织形式,如布尼亚类病毒的基因组不仅具有原来认为的 3 基因节段,而且现在发现一些病毒由 1-7 个不等的基因节段组成。这都显示出现有知识体系和分类体系的严重缺陷。
总的来说,本研究结果呈现出一个比目前的分类系统所描绘的亲缘进化关系更复杂的、基因组进化更灵活多样的病毒圈,从而为研究病毒甚至生物的遗传与进化提供了新的理论基础。该研究建立的病毒检测体系、发现未知病毒的方法,为实现在新发突发传染病的防控上做到早识别、早预警、精准防控奠定了基础。