病毒起源与演化
2020年02月号

基于全基因组数据解析新型冠状病毒的演化和传播

作者:贾盛崧

华南海鲜批发市场的SARS-CoV-2可能是从其他地方传播而来的,或者说华南海鲜批发市场并非是SARS-CoV-2的起源地。由于第一批被确认的受感染患者与市场没有联系,因此受感染的人有可能将SARS-CoV-2传染给了市场上的工作人员或经销商,然后在市场内迅速传播。

中科院西双版纳热带植物园副研究员郁文彬等人开展了一项非常有意思的研究。他们收集了覆盖了四大洲12个国家的93个新型冠状病毒样本的基因组数据,通过全基因组数据解析,追溯了传染源及扩散路径。

背景介绍

截至2020年2月19日,新型冠状病毒SARS-CoV-2已波及中国各省和非洲、亚洲、欧洲、北美、大洋洲等25个国家,累计感染7.5万余人。

SARS-CoV-2可以人际传播,中国春节前的大规模人口迁移加速了疾病传播。从2020年1月30日到2月16日,每天确诊的感染病例超过2000例。

SARS-CoV-2的原始宿主可能是蝙蝠,并可能通过中间宿主(非蝙蝠哺乳动物)传播给人类。流行病学调查显示,武汉首批被诊断为新冠肺炎的41名感染患者,27名患者感染前曾接触过华南海鲜批发市场(该市场出售野生哺乳动物),这表明SARS-CoV-2起源于该市场的可能性很高,然后感染者将其传染给市场之外的其他人。然而,这一结论一直存在争议,因为第一例确诊感染者和其他12人没有华南海鲜批发市场接触史。因此,一些研究者认为华南海鲜批发市场不是SARS-CoV-2传播给人类的最初来源,或者并不是唯一来源。该市场已于2020年1月1日关闭,这使得SARS-CoV-2中间宿主的信息和身份无法确认,在缺乏潜在中间宿主的情况下,SARS-CoV-2的起源和传播模式仍然不明确。

2019年12月中旬武汉首次报告COVID-19疫情,2020年1月在中国其他各省和其他国家发现的第一批感染者,均在近期有武汉旅居史或武汉相关人员接触史。例如,深圳第一例确诊患者和他的4名家属,于2019年12月29日至2020年1月4日在武汉短暂居住;美国第一例确诊患者于2020年1月15日去武汉探亲,之后返回了华盛顿。SARS-CoV-2可以人传人,因此部分学者认为武汉是SARS-CoV-2的起源地。但是,由于华南海鲜批发市场尚未被确认为SARS-CoV-2向人类传播的唯一来源,武汉市发现的首例患者和报告首批患者中无该市场人员接触史的感染源尚未确认,因此这一假设尚未得到充分验证。然而显而易见的是,在COVID-19暴发的早期阶段,华南海鲜批发市场促进了SARS-CoV-2的人际传播,感染的旅客迅速蔓延到整个中国和其他国家。

研究目的

(1)确定SARS-CoV-2基因组变异情况;(2)推断全球样本之间的演化关系;(3)推断SARS-CoV-2在武汉和武汉以外地区的传播史。

研究方法

研究者利用GISAID-EpiFluTM数据库(访问日期:2020年2月12日)中的93个SARS-CoV-2全基因组,通过全基因组数据解析,对近两个月来SARS-CoV-2的人际传播和扩散进行研究。

研究者利用DnaSP进行编码区域比对的单倍型分析,使用单倍型演化关系网对单倍型进行演化分析。利用DnaSP和Arlequin估计种群大小的变化。根据膨胀参数τ(τ)、公式t=τ/2u计算种群规模的暴发日期。

研究结果和讨论

1、SARS-CoV-2基因组突变

通过对93个SARS-CoV-2全基因组进行分析,SARS-CoV-2基因组长度在29782bp到29903bp之间。包含140个突变位点,编码区包含120个突变位点,可以分为58个单倍型(单倍体基因型)。其中120个突变位点分布在8个编码区(coding sequence, CDS)。这120个突变位点与119个密码子相关,包括79个非同义替换密码子和40个同义替换密码子。其中42个非同义替换改变了氨基酸(AA)的生化性质。目前尚不清楚非同义替换及氨基酸生化性质的改变,是否会改变SARS-CoV-2的感染及传播能力。

与已报道的SARS-CoV和MERS-CoV基因组相比,SARS-CoV-2的基因组突变率较低,表明SARS-CoV-2仍在经历稳定的演化,而没有和其他病毒重组导致较大程度的突变。

2、SARS-CoV-2的种群扩张

使用Arlequin软件进行错配分布分析发现,SARS-CoV-2进行了两次种群扩张。扩张的时间为28.72天(95% CI:12.29~54.36天),而最新取样日期是2020年2月3日,因此离这个日期最近的一次扩张发生在2020年1月6日。此外,对2020年1月6日前22个基因组的错配分布分析显示,在2019年12月8日曾发生过种群扩张,当时只有一例受感染的患者被正式报告。分析表明,12月前SARS-CoV-2已经在武汉发生人传人,最早可能是从11月中下旬开始。

3、SARS-CoV-2的单倍型演化关系

如图1A所示,SARS-CoV-2的58个单倍型以及相关的蝙蝠RaTG13-CoV演化关系网络图,主要可以分为五组,A/B/C/D/E组。在演化关系网中,H1、H3和H13是三个核心单倍型。H3和H1的关联在于8759bp位置和28151bp位置的两个突变。H13和H38通过一个单倍型中间载体mv1,与蝙蝠RaTG13-CoV相关。因此,将A/B/C组视为它们的中心单倍型(超级传播)。D组和E组是根据两种新的超级扩张单倍型H56和一个介质载体mv2识别的,这是一个假设的(通常是祖先的)单倍型,在目前的样本中并没有。

在演化关系网中,4个卫星单倍型及H35,与H13单倍型相关(A组);9个卫星单倍型、H38+H45、H50单倍型,与H3相关(B组);H1单倍型最为核心,共有29个单倍型相关,26个卫星单倍型和H40+(包括H43和H47)单倍型直接来源于H1单倍型(C组);D组的5个单倍型和E组的4个单倍型,也来源于H1单倍型,这两组可以认为是C组的亚组。

4、SARS-CoV-2的起源之地?

演化关系网络图显示,中间载体mv1可能来自中间宿主或第一个受感染的人类。通过这些关联,可以推测单倍型H13和H38是比较古老的(祖先)单倍型,并通过单倍型H3衍生出单倍型H1。单倍体的两条主要演化路径是:从H13到H3到H1,或者从H38到H3到H1(图1C)。两种情况都表明H3是从祖先单倍型到H1的关键连接。

然而,在来自湖北武汉的样本中未检测出H13和H38。H13仅在5例广东深圳患者病毒样本中被发现,其中包括家族聚集案例中的父亲(即香港大学袁国勇院士文章中的患者2),他是广东首批发现的感染患者之一。两个衍生的单倍型,H14和H15,也只在深圳发现(H14来自患者2的孙子);另外三个单倍型,在三个来自日本的样本(H53和H52)和一个来自美国亚利桑那州的样本(H35)中发现。根据流行病学资料,这一深圳家庭是在疫情暴发后去的武汉,他们可能是在武汉期间在医院或未知公共场所被感染,这说明H13可能起源于武汉,但武汉地区的收集到的样本中均未见A组的单倍型。从演化关系网络图上来看,A组的单倍型只与H3单倍型有关联(见于武汉样本EPI_ISL_406801,该样本患者无华南海鲜批发市场接触史)。可能的情况是,深圳的五口之家是H13的新近来源,从H3演化而来,因此H13没有在武汉传播,或者尚无样品测序。H38来自于美国的第一例确诊病例,他应该是在中国探亲时被感染的。H38的来源解释,可以如同H13(H13也来源于H3)一样来自于H3,衍生的H45来源于在武汉工作的重庆患者。

H3单倍型只有一个来自武汉的样本,与华南海鲜批发市场没有联系,而该组中的其他样本则来自其他国家和地区。值得注意的是,华南海鲜批发市场的所有样本均为H1单倍型或其衍生的单倍型(H2、H8和H12),表明短期内存在市场内的循环感染。华南海鲜批发市场的SARS-CoV-2可能是从其他地方传播而来的,或者说华南海鲜批发市场并非是SARS-CoV-2的起源地。由于第一批被确认的受感染患者与市场没有联系,因此受感染的人有可能将SARS-CoV-2传染给了市场上的工作人员或经销商,然后在市场内迅速传播。在2019年12月初,与预计的感染者扩张时间相对应,拥挤的市场加剧了SARS-CoV-2在有该市场活动史人群中的传播,并传播到整个城市。

5、SARS-CoV-2在区域和全球的传播

来源于54例中国患者的基因组样本中,重庆(3个样本)、广东(18个样本)、湖北(22个样本)、台湾(2个样本)和浙江(4个样本),有两个以上的样本,其他5个省份有一个样本。湖北武汉2019年12月24日至2020年1月5日的样本中共涉及13个单倍型,分别属于C组(H1和11个卫星单倍型)和B组(仅H3)。这表明,SARS-CoV-2在武汉市早期传播是快速的。2020年1月10日至23日采集的18份广东样品,涉及15个单倍型,分别归属于A组、C组和E组,提示广东的SARS-CoV-2有多种不同的来源途径。台湾2份样本编码H3、H24,重庆3份样本编码H1、H40、H45,这两个省有两个输入来源。浙江4份样本编码H1和H24,是H1单倍型演化来源的。

中国以外有31个单倍型,分属A组~E组。其中27个单倍型为区域独有的,只有2个泰国样本和1个美国样本为H1单倍型,1个澳大利亚和比利时样本为H3单倍型,1个美国样本为H19单倍型,1个新加坡样本为H40单倍型;来自亚洲5个国家的12个样本,涉及10个单倍型。湖北武汉有7个单倍型,广东深圳有3个单倍型。大洋洲的5个样本涉及B组、C组和D组的6个单倍型,来自澳大利亚,均与武汉有关;H3、H25、H26、H55(与H1相关)患者来自武汉,患者之间的人际传播过程中发生了H25到H26的突变,他们来自昆士兰同一旅游团;由于H56患者于2020年1月25日从武汉飞往悉尼,H27患者于2020年1月15日从武汉飞往墨尔本,H56与H27患者之间的联系尚不清楚。来自欧洲4个国家8个样本的患者共涉及7个单倍型;比利时和德国的患者前往或留在武汉;在英国的患者与武汉没有关联,但从H28到H29有家族性传播;法国的患者可能是通过三种不同的途径感染的,即与武汉有关的H44、与重庆/新加坡有关的H43和与中介传播者有关的H30。

来自美国的13个基因组样本中,有3个来自华盛顿的患者,涉及相同的单倍型H38;而其他的10个样本涉及8个单倍型,覆盖了所有的A~E五个群组(图1A),因此输入性感染的来源很复杂。3个单倍型(H1-加利福尼亚、H19-威斯康星州、H38-华盛顿州)与武汉相关,3个(H19-威斯康星州、H35-亚利桑那州、H42-加利福尼亚)到5个(H41 加利福尼亚、H58-伊利诺斯州)可能与广东相关。其余的单倍型(H36-加利福尼亚、H37-加利福尼亚和H57-马萨诸塞州)与来自中国武汉的其他国籍患者 (H54和H56) 有关。目前还不清楚他们是在哪里感染的。

6、演化关系方法为SARS-CoV-2的流行病学研究提供新思路

用传统方法对SARS-CoV-2进行流行病学研究是非常困难的,因为直到12月29日才作为一种新的冠状病毒被确认,可能在11月底和12月初就出现了一些症状轻微或无症状的感染者,但是被忽视了。此外被视为SARS-CoV-2诞生地的华南海鲜批发市场,自2020年1月1日起关闭。本研究利用SARS-CoV-2的基因组数据,推断了58个单倍型的演化关系,并提出华南海鲜批发市场H1及其后代单倍型,应来源于与市场无关的H3单倍型。这表明华南海鲜批发市场的冠状病毒是从其他地方输入的,其他研究人员也提出了同样的观点。演化关系网络表明,H13和H38应该是古老的单倍型,通过一个中间单倍型mv1与蝙蝠RaTG13 CoV关联。由于目前可用的样本不包括第一个确定的感染患者和12月初的其他患者,因此可能会遗漏最“古老的”单倍型。如果有来自这些患者的任何样品,则值得进行基因组测序以进行系统流行病学研究,以帮助确认武汉是否为SARS-CoV-2的起源地。同时,如果今后有更多的样本进行测序,武汉市部分感染患者样本中会发现H13和H38单倍型。这对于寻找SARS-CoV-2的原始来源将是非常重要的,因为H13和H38都是“古老的”单倍型。

单倍型的演化关系网络,可用于复盘在局部范围内的人际传播方向。中心单倍型可以认为是超级扩张单倍型,而远端单倍型是最近的后代单倍型。例如,来自华南海鲜批发市场的确诊患者有共同的祖先单倍型H1,这表明他们感染源相同,他们可能是市场上的超级传播者。这种传播现象也可能发生在深圳的A组患者身上。该方法在深圳家庭(H13→H14)、昆士兰旅游团(H25→H26)、英国家庭(H28→H29)和从武汉返回的日本人(H53→H52)中找到了具体的人传人方向。大多数国外感染者直接或间接与武汉有关,但其中一些感染者,尚不清楚确切的感染地点。正如前文所述,日本和美国的一些病人可能在广州感染,而法国的一些病人可能在重庆或新加坡感染。因此,研究者怀疑是超级传播者将病毒从中国传播到世界各地。至少,感染了H56、mv2以及H54的人,传播过程中至少演化出三种单倍型。

(报道:贾盛崧)

参考文献:ChinaXiv:202002.00033

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5