自新冠肺炎疫情发生起来,病毒溯源工作基本围绕武汉华南海鲜市场,疫情初期的大多病例和该市场有关联。不过,新冠病毒起源地目前仍充满争议。之前,《柳叶刀》刊发的最早一批41例患者中的部分患者,以及2019年12月1日发现的第一例患者,并没有证明和该市场有关。
值得注意的是,根据中国学者最新的基因组变异研究,关于新冠病毒是如何进入人类社会的,有了新的见解。其结论包括:一、华南海鲜市场的新型冠状病毒可能是从其他地方传入的,在市场中发生快速传播蔓延到市场之外;二、新型冠状病毒在2月12日(论文数据截止时间之前)之前发生过2次明显的种群扩张 ;三、现扩散的病例至少来自于3个途径 ;四、新冠病毒基因组尚未发生明显重组事件 。
这些结论来自中国科学院西双版纳热带植物园、中国科学院核心植物园、韶关大学英东生物与农业学院、华南农业大学、北京脑科学与类脑研究中心(CIBR)团队。他们另辟蹊径,从病毒基因演化角度试图描绘出病毒传播路径,并找出谁有可能是“零号病人”。
该项研究通讯作者为中国科学院西双版纳热带植物园副研究员郁文斌,论文标题为“使用整个基因组数据解码新冠病毒的进化和传播”。研究最早于2月19日发表在中国科学院科技论文预发布平台 ChinaXiv 上,2月21日更新发布第二版。
武汉样本中没有祖先单倍型,或从其他地方传入
在这项研究中,研究团队使用了来自GISAID EpiFluTM数据库的93个完整的新冠病毒基因组,其中中国患者样本有54个,包括重庆3个样本、广东18个样本、湖北22个样本、中国台湾2个样本、浙江4个样本,另外其他5个省份有1个样本。中国境外包括亚洲其他国家、欧洲、大洋洲、北美洲的39个样本。样本采集时间为2019年12月24日至2020年1月5日。
通过对93个样本的全基因组数据解析,新冠病毒的基因组大小在29782bp-29903bp 之间,来自GISAID的EPI_ISL_402131基因组(即bat-RaTG13-CoV)也被列入,目前它的序列被认为最接近新冠病毒。研究团队基于8个编码区120个变异位点(包括79个非同义替换和40个同义替换,42个非同义替换改变了氨基酸的生化性质),得到58种单倍型(基因类型)。未检测到明显的重组事件。
图1(新冠病毒的基因组单倍型,红色圆圈表示华南市场样品,蓝色圆圈表示与市场无关样品。)
具体来说,这58种单倍型其中被分为5组。其中三个中心单倍型为H1、H3、H13,分别为A组、B组、C组,这三种单倍型被认为是古老超级传播者。D组和E组的中心分别是两种新的超级传播者单倍型,即H56和mv2。
58种单倍型中,H13和H38都可能是祖先单倍型,是系统发育中最基础的分支。两者均通过H3衍生出H1,即两条主要的演化路径为H13-H3-H1,或者H38-H3-H1。论文提到,两种情况都表明,H3是祖先单倍型到H1之间的关键。
但值得注意的是,武汉的样本中都没有H13和H38这两种祖先单倍型。
作者们认为,H13和H38可能通过一个假设的中间单倍型mv1与蝙蝠冠状病毒RaTG13相关联,由于目前的样品中没有第一例感染者的样本和12月初的早期感染者的样本,最早的祖先单倍型可能还没有被发现。演化网络表明,假设的单倍型mv1可能来自中间宿主或第一个被感染的人。
武汉现有的样本中没有一份编码A组中的单倍型。A组的单倍型在遗传上只与来自武汉的单倍型H3有联系(只有1份EPI_ISL_406801),但该病例与华南市场没有联系。值得注意的是,华南海鲜市场的所有的样品均有H1单倍型或其衍生(H2, H8-H12),说明该市场在短期内即发生了传播感染。
作者们认为,可能的情况是,华南海鲜市场的新冠病毒是从其他地方传播过来,或者至少华南海鲜市场不是新冠病毒的原始来源。有可能是受感染的人将新冠病毒传染给了市场的工作人员,然后在市场上迅速传播。拥挤的市场增加了新冠病毒对去过该市场人群的传播,并于2019年12月初传播到整个城市,这与估计的种群扩张时间相一致。
而祖先单倍型H38的样品来自美国华盛顿州的病患(美国首例),该患者于1月15日结束武汉探亲回到华盛顿州。
研究团队认为,现有武汉样本中没有检测到H13和H38单倍型,可能是因为现有样品主要采自几家定点医院,而且样品采集时间局限于2019年12月24日和2020年1月5日。如果能在武汉其他医院早期的病患检测到这两种单倍型,将对于寻找病毒来源非常有帮助。
扩散病例至少来自3个途径
将58种单倍型分成了五组后分析显示,广东的病毒可能有三个来源,重庆和台湾的病毒有两个来源。
在中国的54个样本中,重庆3个样本、广东18个样本、湖北22个样本、台湾2个样本、浙江4个样本,其他5个省份有1个样本。
武汉2019年12月24日至2020年1月5日的样本编码了13种单倍型,属于C类和B类。这些关系表明,新冠病毒在武汉的传播处于早期阶段。H1和H3是湖北以外地区单倍型的祖先。
从2020年1月10日至1月23日采集的18个广东样本,编码了15种单倍型,属于A、C、E组,表明有多个来源输入广东。三个单倍型(H14、H15、H17)可能在本地演化,表明新冠病毒最初蔓延到深圳时即发生了人际传播。来自台湾的两个样本编码H3和H24,分别属于B组和D组,重庆的三个样品编码H1、H40和H45,分别属于B组和C组,显示这两个省或地区输入了两种来源。C组4个浙江的4个样本编码H1、H24,属于C组,显示仅从H1单倍型来源输入。
中国境外总的样本编码了31种A-E组的单倍型。其中,2个来自泰国的样本是H1单倍型,分别来自澳大利亚和比利时的1个样本是H3单倍型,1个来自美国的样本是H19单倍型,1个来自新加坡的样本是H40单倍型。
来自亚洲5个国家的12个样本编码了10个单倍型,7个和武汉有关,3个和深圳有关。在日本东京,人际传播可能发生到H53单倍型患者到H52单倍型患者身上,患者此前从武汉撤回日本。
澳大利亚患者的5个样本分别编码B、C和D组的6个单倍型,均与武汉有关。病例(H3)、病例(H25、H26)、病例(H55,和H1有关)直接来自武汉,H25到H26发生了人际传播,来自昆士兰同一旅游团。H56患者与H27患者之间的联系不明确,因为H56患者于1月25日从武汉飞往悉尼,H27患者于1月15日从武汉飞往墨尔本。
一种可能是有一个中间传播者,他也传播了新冠病毒,并且传染给了法国、美国和中国台湾的其他病人。
8个欧洲样本编码了7个单倍型,来自四个国家的病人。比利时和德国的患者均有武汉旅行史。英国的患者没有报告与武汉有关,但有发现从H28到H29的家族性传播。法国的患者可能是通过三种不同的途径感染,即与武汉有关的H44、与重庆或新加坡有关的H43,以及与中间传播者有关的H30。
来自美国的13个样本中,有3个来自华盛顿的同一名患者,编码了相同的单倍型H38,另外3个样本编码了8个单倍型,覆盖了A-E 5组,因此输入性感染的来源很复杂。3个单倍型(H1、H19、H38)与武汉相关,3个(H19、H35、H42)与5个(H41、H58)可能与广东相关。其余的单倍型(H36、H37、H57)与非中国患者(H54,越南;H56,澳大利亚)有关,这两例患者来自武汉。
总体来看,广东深圳一家人在早期就通过人传人进行了传播。有较多样本的澳大利亚、法国、日本和美国,他们的患者感染源至少有两个,尤其是美国包括了五个来源。
非常值得关注的是H56这个超级传播者单倍型,它同时是澳大利亚、法国和美国,以及我国台湾患者的传染源。其他国家患者因为样品比较少,大多数的来源比较单一,他们除了是武汉旅游输入或在武汉感染外,有一些人可能是在广东、新加坡等地被感染。
图2(58种新冠病毒单倍型的演化关系和地理分布(A, B)。基于进化分析和流行病学研究,作者们推断出单倍型演化路径(C)和可能的传播和传播路径(D)。)
研究还发现,中国和其他国家之间单倍型样本的多样性存在显著差异。其他国家样本的单倍型多样性较高,可能是因为其采样日期大多在2020年1月22日之后,而中国的样本则在2020年1月22日之前。此外,作者推测,国际长途航班时的低水平辐射暴露可能加速了新冠病毒的突变率。
研究团队最后强调,使用传统方法对新冠病毒进行流行病学研究是非常困难的,因为一些有轻微症状或无症状的感染者在11月底和12月初可能被忽视。此外,被认为是新冠病毒发源地的华南海鲜市场,自2020年1月1日起已关闭。
他们提到,由于目前可获得的样本不包括12月初发现的第一例感染患者和其他更多患者,因此可能会漏掉最常见的祖先单倍型。如果有来自这些患者的冷冻样本,就可以进行系统流行病学研究的基因组测序,以帮助确定新冠病毒的起源地地。
来源: 澎湃新闻