什么是病毒?
病毒,“病”和“毒”,我们人类对这两个字是恐惧的,这个名字代表了我们敌对的状态。但是它从哪儿来的?
病毒的英文名字叫virus,它真正的名字是来自拉丁文。过去医生都是用拉丁文来写处方的,其中一个目的就是表现出医生非常有学问,而且医生开的处方一般病人也看不懂。在中世纪的时候,这个拉丁文virus代表的是一种可以传播疾病的毒素。说什么东西有毒,我们就说它是virus。
之后,显微镜、光学显微镜发明了以后,发现还有一些微生物存在,这些微生物我们命名为细菌。科学家用了一个网,它的大小约为200纳米左右,进行了过滤,把细菌过滤掉了,但是留下来的液体仍然有毒性,而且可以传染,可以传播,特别是可以传染活的细胞,剩下的这些物质就被命名为病毒了。但是我们仍然看不见它,直到电子显微镜的出现,我们才知道原来还有一种微生物,它实际上是一种颗粒。
病毒的定义:一组可传染的、拥有遗传物质的、依赖于细胞的一种寄生物,它常常被蛋白包裹,有时有膜,通常它是以颗粒存在的。平常,它以静止的颗粒存在,进入细胞以后,它就表现出了活力,所以它到底是生命还是非生命是有争议的。科学界认为它是一种生命的边缘状态(edge of life)。再让我们回顾下生命是怎么起源的,这一直是困扰科学家、学者的一个很重要的问题,有人说它是外星来的,有人说它是闪电在大气里合成的,但是比较可靠的科学依据是,宇宙大爆炸以后,各种物质聚集在地球上,其中在海底有碳、氧、氮、磷,而这些物质在一定的温度下,包括环境、酸碱度以及一些放射物质的诱导下,在海底,在地壳变动中,偶然形成了一系列的分子,而这些分子是生命所必要的,比如形成了核苷酸,它连接起来以后形成了最初级的一个可复制、可传代的物质,就是RNA,而RNA协同周围的很多氨基酸,形成了蛋白,形成了酶之后,就形成了生命的现象。所以,极有可能生命是起源于这种遗传物质,而现在这种遗传物质就是携带在病毒这种颗粒体内的,也是现在地球上所有生命都具备的。从RNA变成了DNA后更稳定,之后形成了一系列的生命现象。
45亿年前,我们的地球形成了,那个时候是一个混沌的状态,整个太阳系还没有完全固化下来。但是地球在40亿年前出现了气候的变化,海洋形成,海就是孕育生命的一个大孵化器(incubator),越来越明确的证据证明,生命在那形成了,之后走上了陆地。地球上最早的生命痕迹是38亿年前,在澳大利亚发现了岩石上的生命迹象,它已经形成了细胞的结构(图1),包含了遗传物质,再加上遗传所需要的一套配套的整个体系,包裹在一个包膜下。它大小是多少呢?细菌和细胞约是微米大小。如果把毫米分成1000份,每份就是一个微米,而微米再分1000份就是纳米,而病毒是多大呢?病毒体在几十纳米到一个微米之间,而细菌是快到一个微米到几个微米之内,所以显微镜可以看到它。
我们的生命是依据于遗传物质的,而遗传物质肯定是在生命细胞的单体之前就存在,科学家在找证据来证明生命起源于RNA。而病毒就是一种可进入细胞寄生、复制的RNA/DNA颗粒,它存在于整个世界,数量是我们全部生命现象的10倍以上,它在水里有1030之多,一勺海水就有200万个病毒颗粒,一升水里的病毒数量就超过我们人类的数量。
水里有一种噬菌体(phage),它有尾巴,通过扎在细胞上,可以把遗传物质输入到细胞里面去进行复制。这样的噬菌体头尾相连有多长?是1亿光年。地球上,HIV这种逆转录病毒在人类的身体里有多少?1016之多,是按照3700万病毒携带者来计算的,这是非常可观的数据。所以,病毒在我们整个的地球上,对生物的均衡,以及生态的平衡,起到非常关键的作用,它无处不在,在我们每吸入一口空气的时候,就有很多病毒进入,在我们吃一次蔬菜色拉的时候,就有几十亿个病毒通过口腔进入肠道,最后从粪便排出去,而且有很多病毒是跟我们共生存的,比如多瘤病毒,在我们每次小便的时候都有几十万/几万个这种病毒排泄出去。
科学家已经证明,我们体内的基因,有8.3%左右的染色体DNA碱基是从逆转录病毒来的。逆转录病毒可以整合到我们的DNA内,沉睡在那,一旦有机会就可以复制,但是好在这部分沉睡在我们基因里的病毒遗传物质是静止的。在我们体内,每个细胞都有31亿个碱基对,其中8.3%是病毒留给我们的痕迹,而且年代非常久远,是在我们人类的祖先形成之前,病毒已经进入到我们体内。所以,病毒和外界的环境是促进我们成为今天的我们的一个很关键的因素,它在很多的关键点上,是让我们更适应环境,让我们出现了一些关键的突变,把它的基因嵌合进了我们的基因组中。我们的身体其实清除不了这些病毒的,它们跟我们已经长期共存了,比如说疱疹病毒,在我们身体里有十几种疱疹病毒,你得了一次水痘,那个病毒也沉睡在我们的神经根上,EB病毒、多瘤病毒、巨细胞病毒,这一系列病毒在平常跟我们都是相安无事的,但是如果我们的抵抗力降低,它就会冒出来了。我在这所讲的意思是病毒在我们的环境中无处不在,特别是海水中。在我们身体里也是无处不在,皮肤、大脑、神经、血管、内脏,全部都和病毒是共同生存的(图2)。所以,我们叫它病毒,其实是不公平的,实际上它是一种有生命边缘迹象的颗粒,我们跟它是共生存的。
病毒可能是地球上所有生命的祖先,它的起源非常早,它散布于环境中和人类的体内,我们和它共生存,而且在人类的基因中有它的痕迹。
病毒长什么样?
1939年,科学家拍到了第一张病毒的照片(图3),这是噬菌体,它附着在细胞外边,一串噬菌体附着在细胞上,非常漂亮,这获得了诺贝尔奖。
病毒到底有多大呢?如果按从大到小的顺序排列的话,次序如下:植物细胞、动物细胞、细菌、病毒,核糖体(细胞器)、蛋白,从微米大小一直到了纳米大小。我们用来观察它们的工具有光学显微镜、电子显微镜、X衍射以及磁共振(图4)。
2019新冠状病毒现在被叫做SARS-CoV-2,它引起的疾病叫COVID-19,也就是2019年冠状病毒病。用电子显微镜观察病人标本,可以看到这个病毒周围有很多突起,像皇冠一样,所以它叫冠状病毒。它是由最外边的S蛋白(spark,结合细胞上的受体)、双层脂膜(从人类细胞而来)、糖蛋白,以及与核蛋白混合起来的遗传物质组成的(图5),一共只有8个基因,但是在RNA病毒里已经算长的了。它有将近3万个碱基,它RNA的单链是碱基,其中有8个功能基因生产一切它需要的东西,就像一个厨师进入了厨房,利用厨房的所有用具,带着菜谱就把东西都做出来了。
病毒分多少种?
大致从外形上分为三种(图6):
①螺旋体形(比如埃博拉病毒);
②球体的,即20面体,或是20面体的倍数,比如60面体、120面体。它非常艺术性地组成了一个牢固的结构,而这个牢固的结构又不是用化学键结合的,它是编织起来的,进入到细胞以后,它会马上释放出遗传物质;
③还有一类是不定型的或者叫做杂型的,比如潘多拉病毒,它的直径达1微米,可以说体型巨大。
巴尔的摩教授发现了逆转录酶,他发现逆转录病毒并不是原来认为的直接进入细胞以后就开始生产了,而是整合到我们自己的染色体里,开始用我们自己的“设备”去复制它。
要是以信使RNA(mRNA)为中心来探讨病毒分类,一共可以分成7类(图7)。
病毒的轨迹
人类从非洲迁徙出来,到了中东,之后又到了南亚、到了非洲,到了东亚,之后到了美洲(图9)。科学家已经用遗传学把人类的迁徙全部过程描述出来了,当追踪我们体内跟我们共生存的多瘤病毒,发现它的轨迹跟我们人类是一模一样的:从非洲到了中东,到了南亚,到了大洋洲,到了东亚,之后到了美洲(图8)。多瘤病毒在我们身体里存在了几十万年,通过它在各个地方的基因表现,我们可以追溯到它的迁徙轨迹。
我们是怎么来描述病毒或者生命整个的迁徙过程或者基因变异过程的呢?有一个公认的进化树(Phylogenetic tree),根据遗传的特性,从祖先到其子代,再到孙子代,再往下、再往下……一步一步地往下描述,就形成了树根、树干、树枝,也就是祖先(ancestor)以及子代的描述。科学家就这样追踪到了人类的轨迹:非洲人在非洲待的时间最长,基因变化最多;其子代进入到了中东,变化会更多一点;然后进入到东亚,这个时候我们就非常接近了。再看中华民族之间的变化,通过基因的变化,就可以追溯到,汉族人和日本人非常相像,但是和纳西族、土族、锡伯族就远一些(图10)。
在我们祖先整个的迁徙过程中,时间和环境的变化打磨出了遗传的痕迹,每一代人,200个碱基的变化,于是给了我们追溯的可能。
2019新型冠状病毒是哪里来的?
科学家在武汉暴发新冠状病毒肺炎疫情以后,马上采集了病毒的标本,做了全基因组学的研究,把其基因全部描述了出来。这将近3万个基因碱基序列描述出来以后,再和过去的数据库进行对比,结果发现它和蝙蝠身上的一种病毒是近亲(same clade,clade的意思是进化枝),和2003年暴发的SARS是远亲,是旁系的关系(图11)。也就是说这一次的新型冠状病毒,很大的可能是从一种蝙蝠的病毒变异过来的,因为它们除了有共同的祖先,还有共同的分支。
用类似的方法我们也找到了哺乳动物的共同祖先,发现我们有80%的基因/碱基和老鼠是一样的,这让我们不敢相信,我们和老鼠是共同的祖先;在700万年前,我们和猩猩是哥俩,我们是更近的一个共同祖先;2000多万年前,我们和猕猴是共同的祖先。
新型冠状病毒如何传播?
病毒要进入细胞,才能去复制它自己,它是个寄生体,它必须进入细胞,要不然它只是包着遗传物质的颗粒。
它怎么进入细胞呢?它必须结合细胞受体,结合到受体以后,病毒包膜和细胞膜融合,释放遗传物质,就开始用我们细胞的machinery这一套加工设备,最后合成出来它的遗传物质,它的胞膜,然后再把细胞撑破,病毒就全释放出来了(图12)。所以,它第一个要解决的就是要结合细胞,要找到一个合适的结合点。我们身体里有很多细胞都有这种结合点。比如说在我们的肺,特别是下呼吸道,就有细胞带有ACE2(血管紧张素2)。
蝙蝠的这个病毒原来是结合不了人体细胞上的受体的,但是经过一系列的变化、出错,结合点蛋白的基因出现了一系列的变化,而且是非常频繁的变化,非常巧,形成了一个可以结合ACE2受体的结合点(receptor binding domain),对人类受体有非常强的结合能力。而且,新型冠状病毒有一个纠错的能力,这是它比较特殊的地方,它有一个纠错蛋白,让它在复制中间不要出错,所以它复制准确性非常强。所有的巧合集中在一起,出现了这种可以传人、而且传染力非常强的新型病毒。
它到底是怎样的轨迹呢?我们都知道,在武汉有一个华南海鲜市场,都说华南海鲜市场是传播最集中的地方,或者是起源地(grand zero)。是不是真的这样?一篇发表在《柳叶刀》杂志上的文章是世界上第一个总结病人数据的文章。我们看最左边浅蓝色的柱子,浅蓝色代表没有华南海鲜市场接触史(图13)。所以,在12月1号有这么一组病人就没有华南海鲜市场接触史。12月10号也有2个病人没有华南海鲜市场接触史,结果病了。这41个病人中,有27个是有华南海鲜市场接触史,有14个病人根本就没有接触史,这就给我们提出了一个潜在的问题。
现在我们回过头来看这个问题,没有华南海鲜市场接触史到底是怎么回事?科学家在继续研究。中科院西双版纳热带植物园副研究员郁文彬等人开展了一项非常有意思,而且非常棒的研究。他们收集了覆盖了四大洲12个国家的93个新型冠状病毒样本的基因组数据,通过全基因组数据解析,追溯传染源及扩散路径,看看在不同的国家、不同的地点,这些病人所携带的病毒的遗传物质,整个的迁徙过程/进化过程是怎么样的状态?
研究人员分析的前提是,所有的新冠病毒都有一个共同的祖先,当前的这些病毒在传播过程中发生了变异,但是这种变异是有迹可循的,所以可以通过分析确定病毒样本之间的演化关系。研究人员基于 120 个变异位点得到 58 种病毒单倍型(基因类型)。
研究人员根据冠状病毒进化的整个顺序进行了排列和分组,分成了5个组,A、B、C、D、E。结果发现,华南海鲜市场出来的那些病人,起码很多都是第3代了。也就是说在A组中间,并没有华南海鲜市场病人,也就是说华南海鲜市场的病毒是外边带进去的。因为A这样祖先级的,或者是次祖先级的基因的遗传特性,是在华南海鲜市场之前。
图15非常有意思,他把整个病毒的迁徙进化过程描述在这里了。其中有一个单体的分类,是38和13,这两个分类是属于次祖先级的。他们都共同的变异,形成了一个子代,叫H3型的,H3型的才形成了华南海鲜市场的H1型。在整个武汉就发现了一个H3型,而在广州发现了13,在美国华盛顿州的第一个病人是发现了38。这让我们非常吃惊,可以看到的是那些病人已经跑出去了,在武汉的发源地,没有找到祖先或者是零号病人,这个现象现在是让我们非常困惑的。而处于次祖先级的或者是在树干上的病人,是在广州和在美国华盛顿州被发现了,在华南海鲜市场已经进入到了基因传播的第3代,然后再向更广泛的地方传播。
通过以上的回顾可以看到这样几个现象:新型冠状病毒起源于蝙蝠,然后通过一个中间受体(现在认为是穿山甲),到了人的身上,在这之前它已经变异了很多年。从遗传的角度来分析的话,应该是在2009年就开始朝着这个方向变异了,经过11年,最后它有传染人的本领了,结合了我们细胞上的受体,进入细胞,变成了一个致病性的病毒。原来它是在动物身上、哺乳动物身上生存的。
我们可以看到它的轨迹是什么?华南海鲜市场不是第一个病人的起源地。在这之前起码还有两代,还有一个更远的一代,我们目前还没有发现。
通过遗传手段,基因技术,科学家们追到了这样的途径,科学家就像侦探一样一点一点地把真相揭开,追求真理。
这一次病毒的传染力、结合受体的能力强于SARS病毒的和中东MERS,但好在有80%的感染者是轻度和中度的,需要隔离和对症处理就自愈了,还有15%是重度的,需要支持治疗,进入到了重症病房,还有5%是危重的,这时候需要呼吸机、需要俯卧位、需要肌松剂、需要支持生命体征。目前,死亡率在这一组5%的危重病人中还是比较高的,达到接近一半。
随着技术的不断进步,抗病毒药的不断研发,可能我们会有更好的方法,但是它目前在全中国的死亡率、致死率,应该只有0.2%,但这也是对生命的一个很大很大的威胁。目前没有特效药,有超过100多个临床研究已经注册了,在全世界也有多家跨国企业都开始进行疫苗的研究。
这一次的COVID-19,SARS-CoV-2和SARS什么不同呢?它在一个月之内,感染人数已经达到了超过7万人,而SARS经过一个月病人数还是非常低的(图16),所以新病毒的传播力非常强(图17),但是致死率并不是那么强。特别是在我们国家现在的经济体制非常庞大的情况下,对世界的影响是非常大的。
所以病毒的规律和细菌是不一样的。病毒进入体内以后,它要进入细胞,开始加工它的遗传物质,它的蛋白,然后形成越来越多的病毒。比如,冠状病毒的大小是70个纳米,当它在细胞里复制到细胞容纳不下的时候,细胞被撑破,病毒释放,然后再感染其他的细胞,它是一步一步上去的。细菌是1到2、2到4这样加倍往下复制的。所以病毒它有一个静止期,之后一个释放期,然后又一个静止、又一个释放,这样阶梯性来释放的,它的病程也有这样的规律。
目前虽然还没有特效药,但是我们对整个生命的支持让我们的身体能赢得时间,调动免疫力,最后能用我们的免疫力来压制病毒。
小结
什么是病毒?病毒是一个有遗传物质的,包裹在蛋白内的颗粒,它可以寄生在细胞内去复制和再生它自己,最后释放出来。它只要不进入细胞,就只是一个颗粒,进入细胞以后,它可能成为一个活体,成为一个生命的现象。大部分病毒都是不致病的。它可能是我们整个生命现象的祖宗。它遍布在整个的自然界,我们的身体里,甚至是我们的基因里都有8%有病毒的痕迹。
它可以是螺旋体状、柱状的,也可以是球形的,20面体加倍的,也可以是不定型的,它的大小一般都比细菌要小,细菌比我们人体细胞要小,病毒在显微镜下看不见,必须要用电子显微镜。病毒和我们实际上是一个伴随的伙伴关系。
冠状病毒,我们能不能像找人类祖先一样一直追踪这个物种的根源?但是病毒有一个问题——它变异太大,我们现在能掌握的是3万年前冠状病毒的起源,再往前我们追不到了,因为它没有很好的细胞结构,所以化石中很难找到。
这一次的冠状病毒,现在的证据是蝙蝠身上的一种病毒是它的祖先,变异后形成了传人的能力。中间宿主,目前发现可能是穿山甲。病毒在这个宿主中,经过基因的突变,形成了很强的结合人体ACE2受体的能力,结果能进入人体肺泡细胞和支气管细胞,引起了严重的新冠状病毒肺炎。
新冠状病毒整个的走向痕迹是什么呢?从基因的痕迹可以看到,华南海鲜市场绝对不是第一案发现场,在这之前起码还有两三代病人,所以我们目前还没有发现零号病人。据推测,如果按照6~7天为一个传染周期的话,再往前推应该是在11月份出现了零号病人,因为目前发现的第1个病人是12月1号发病的。我们也期待更多的科学研究来展示病毒的特点和病毒整个进化的轨迹,找到零号病人,还原整个拼图,这对控制疫情是非常有帮助的。
非常感谢这些科学家,现在的科学技术已经让病毒无处藏身了,第一时间全基因的序列给测出来了,找到了它的来源,找到它的传播轨迹,找到它结合我们细胞的受体,这为以后治疗药物的研发和疫苗的开发提供了很好的依据。
希望大家能加强锻炼、好好睡觉、健康饮食、保持心情愉快,保护好我们的免疫力,迎接新的特效药以及疫苗的到来。
参考文献:
Nature 2016;537:500-501
Science 2008;319:1100-1104
Lancet 2020 https://doi.org/10.1016/S0140-6736(20)30251-8
Lancet 2020 https://doi.org/10.1016/S0140-6736(20)30183-5
ChinaXiv:202002.00033v2