医生根据什么来选择治疗用药或者治疗方案呢?现在,在临床医学上推动了一个非常先进、非常科学的一个体系,这是诞生在20世纪末期的一个医学革命,这就是循证医学(evidence based medicine)。
什么叫循证医学?循证医学就是医生根据现在可获得的最好的临床和基础研究的数据,加上医生的经验和判断,结合病人的价值来选择临床应用的治疗方案。所以,其中包含三个因素,一是最好的证据,二是医生的判断和经验,三是病人的价值。
先来说证据,科学家将证据分成了几个等级(图1):最强的证据来自随机对照临床研究(RCT研究)。第二等是队列研究,队列研究是从因到果的观察,可以是前瞻性的,也可以是回顾性的。所谓因和果,比如抽烟和肺癌之间的关系,抽烟是因,要想看果,就可以调查一批人——一部分人抽烟,一部分人不抽烟,到两三年以后、三五年以后来看有多少人得肺癌。队列研究不是干预性的,是观察性的研究,是从因(可能的相关因素)到果的观察。还有一种是从果到因(相关因素)——肺癌病人匹配没有得肺癌的另一群人,来看看肺癌和烟草以及其他因素的关系,它是从果到因。
第四等级的证据链就没有对照和分析了,就是观察一组病人,比如治疗了20个病人,治疗效果怎么样?安全性怎么样?这是病例串的研究。
再往下一个等级,也就是倒数第二个等级是个案报道——一个病人治好了,这个证据可以当做一个支持,但是非常弱。
最下面的等级就是细胞实验、动物实验、非人体的实验研究,提示这个方法可能会有一些苗头,它和专家意见的等级一致,比如专家根据自己的经验、推断、理论,得出来一些建议和推荐,这种证据其实是最低等级的。
如果一个专家说某个药是特效药,一定要有最高等级的证据支持,也就是随机对照试验(RCT研究)。
任何一个药,它要用在临床上作为一种治疗手段,通常来讲是要经过随机对照试验来证明它有效的。一种药物整个的发展过程(图2):最早的时候是我们要找到疾病的靶点;然后筛选小分子、大分子,此时还不能成为药物,可能是一个候选物;之后开始做一些体外实验,比如对细胞有没有效,即使对细胞有效,它离临床应用还有非常大的距离,比如雷公藤——雷公藤的提取物叫雷公藤甲素,在体外几乎可以把所有的肿瘤细胞都给杀掉,但是一上动物或者人体,就有很强的毒性,让它根本就没办法变成一个药。所以,体外试验的结果和临床的距离还是非常大的。
之后,完成安全性和有效性,还有药代动力学研究,一系列的临床前研究是用动物来做的,然后进入到临床实验,临床试验还分成1期、2期、3期。1期临床是看药物怎么吸收、怎么分布,药物对正常人群、健康人群的安全性怎么样;2期要看不同剂量对疾病治疗的初步效果;3期是多国、多中心或者是多中心的研究,比较这个实验药物和现在可获得的最好的药物,或者是和空白对照比较,其效果怎么样,是不是统计学上有显著差别,而这3期临床试验是非常关键的,它能证明这个药在人群中是不是针对这个疾病是有效的、安全的。
这样一系列的研究需要的一个周期大约10年~15年。而3期临床试验作为最后一个阶段的药物研究试验是非常严格的,必须是随机对照试验。举个例子,比如当年来氟米特在做药物注册研究的时候,它就做了多国多中心的研究,其中有一个研究把253个类风湿关节炎病人分成了两组,采用随机对照,一组是来氟米特,一组是当时最好的治疗药物MTX,然后对两组进行比较(图3)。最后得出的结论是——来氟米特(爱若华)在24个月的观察周期内,它的有效率优于甲氨蝶呤(图4)。
为什么要做随机对照研究呢?实际上在早期的时候大家没有注意到随机,随机的意思就像扔硬币,扔的正面一组,反面另一组,在扔硬币的过程中,可以避免人为的一些偏见或者是人为的随意性。比如说在英国曾经做过这么一个研究,就是要研究治疗晕船的一个药物——药师发明了这个药以后就给了船长,船长把船开到了纽约,又从纽约开回到伦敦,回来后他跟药师讲这个药太有效了,吃了药的人没吐,没吃这个药的人都吐了,大家在庆祝的时候,有人问到底谁吃了这个药,船长说船员、海员都吃了这个药,而乘客没有吃这个药。大家可以想象,海员在海上漂了几十年或者是十几年,他的抗晕能力和一般的第1次坐船的乘客是没法比的,所以造成了很大的偏差,人为造成的偏差,此时药物实际上不一定是有效的,它的有效性是值得质疑的。所以,需要随机入组,这是非常关键的。
当我们遇到这样的一个研究的时候,我们首先要看它是不是随机入组。
我们现在遇到的新冠状病毒引起的疾病,WHO刚刚把它命名为COVID-19, “CO”代表Corona(冠状),“VI”代表Virus(病毒),“D”代表Disease(疾病),“19”代表疾病发现的年份2019年。最早的时候我们叫它新冠状病毒肺炎,现在看来不单单是肺炎,它可能造成全身多器官的功能衰竭。现在WHO将之命名为冠状病毒引起的疾病,这就更贴切了。
新冠状病毒感染的一个致死原因是急性呼吸窘迫综合征(Acute Respiratory Distress Syndrome ,ARDS),抢救非常艰苦,也非常困难,临床医生都在找怎么样来治它。
这是一篇发表在2013年《新英格兰医学杂志》的文章,它研究了俯卧位对减少ARDS抢救中的死亡风险有什么帮助(图6)。这是一项随机对照试验,病人分别俯卧位或者躺在床上至少16小时,观察28天和90天的存活病人比例。研究用了466个病人,随机分成两组,一组分到了俯卧位,趴在床上,一组分到了仰卧位,其他的治疗都一样,最后看在28天、90天患者死亡率的差别,见下图(图6),如果是用俯卧位,即图上面的红线,其存活优势是显著超过仰卧位的。所以得出结论:如果是俯卧位,病人的死亡率在28天的时候只有16%,而仰卧位是32%。俯卧位减少了一半以上的死亡风险。90天的时候,仰卧位的死亡率是41%,俯卧位是23%,同样也是减少了一半以上的风险,50%以上的风险,差别显著。所以,它得出的结论就是抢救ARDS的病人应该用俯卧位至少16小时。这种结论就是非常强的证据,它是采用了随机对照试验。
2010年发表在《新英格兰医学杂志》上的一篇文章研究了ARDS在抢救的时候,使用肌松剂,让病人所有的肌肉松下来,然后再上呼吸机,和不上肌松剂的病人相比,到底有没有区别(图7)?
研究用了340个ICU的病人,看看使用肌松剂和不用肌松剂的2组之间存活有没有差别。340个病人随机分成两组,一组接受肌松剂,一种接受安慰剂,为什么要用安慰剂?就是进一步避免人为的一些偏差。最后的结果非常有意思,见图7,可以看到如果使用肌松剂,显著优于没有使用肌松剂,改善了30%以上的风险。这样的结果非常可信,它使用了科学证据最高级别的设计——RCT研究。
再看另一篇文章,是在2020年1月31号刚刚发表的,是针对新冠状病毒疾病即COVID-19治疗的一个案例的报道,发表在《新英格兰医学杂志》上(图8):一个美国人不幸感染了冠状病毒,第4天的时候,他的肺一点儿问题没有,到第5天住院以后可以看到他的右左下肺已经出现了一点炎症、肺炎的迹象,到了第6天突然加重,出现了毛玻璃样的改变,这个时候他的血氧饱和度降到了90,正常的血氧饱和度应该是95~100,他降到90,并不是特别严重,但是已经出现了呼吸衰竭的迹象。
这个时候ARDS的初步表现出来了,临床医生就给他用了一个治疗埃博拉病毒的试验药物,这个药物中文名字叫瑞德西韦(Remdesivir),而这个药物从来没有被用到临床上,这次被用到了这个病人身上,因为这个药物是一种核苷酸类似物,它是一个腺嘌呤的类似物。它进入到人体以后,病毒就会误认为这是一个它复制的原料,而这个原料整合到RNA的链上,就刹了一个闸,病毒就不可再复制,因为这是一个伪相——它很像原料,但是它不是原料,最后病毒无法复制,被饿死了,或者说终止了复制。第7天开始用瑞德西韦,第8天病人的状况就好转了,体温降下来了,而且毛玻璃样改变有所缓解(图9)。
根据这一发现,中日友好医院的一位主任医生申请了两个临床试验。现在所有人体上的实验都要通过当地的伦理委员会,最好受到药监局的监管,同时要在全世界一个公认的网站上ClinicalTrial.gov注册,这是美国FDA设立的一个网站,所有的临床实验都应该在那注册,把实验思路和方案写清楚,为以后发表文章、同行评议做准备,也为以后的药品注册,也就是成为一个临床应用的药物做好准备。
中国学者非常棒,因为新冠状病毒疾病在武汉、湖北已经肆意蔓延开了,所以有很多病人需要有效治疗方案,而这个药的苗头是非常有意思的,中国学者就申请了这样的一个研究,并且去备案了。2020年2月6日第1次备案,到2020年2月10号又做了一次修改。他就是要做瑞德西韦和安慰剂的对比,来看它是不是对控制新冠状病毒感染有良好的作用。他计划入组452个重症病人,这是一项3期的随机对照试验。如果这个实验做完了,就可以得出一个比较可靠的证据,看该药对冠状病毒导致的疾病是有效还是无效,安全性怎么样。他计划是在4月3号完成入组,然后整个研究完成是在5月1号。第2个试验是用轻到中度活动的病人来入组。
这两个试验如果做完了以后,科学家就可以拿出很好的证据来证明瑞德西韦对新冠状病毒感染导致的这些疾病的治疗效果,而这个数据经得起推敲,是非常高级别的一个证据链。这个研究就处于证据金字塔的顶端,叫RCT研究,所以我们期待这项研究。
我们要牢记金字塔的最底部,也就是证据链中最弱的那个是体外试验。动物实验加上专家观点都是最低级别的。再回到我们刚才的话题,从医生选择药物原则来看看怎么辨别是非。医生选择药物的原则,是根据证据等级来选择临床用药,这就是循证医学的精髓所在,根据我们现在可获得的最好的临床和基础研究的数据、证据,结合经验和判断,再结合病人的价值来制定治疗方案,而证据最高等级的就是RCT研究。
所以我们该如何辨别是非呢?当看到一个宣传说现在有个特效药,我们一定要问该产品处于研发的哪一个阶段?是体外实验、动物实验,还是到了人体实验,到了第几期。如果说还处于体外试验阶段,那是非常早的,处于证据最底层,我们可以祝贺他,但是我们不要相信这个药现在就是一个特效药,它还有很长的路要走。如果说有人体实验的数据,我们要问,这是谁主导的研究,刚才我给大家举了几个例子,比如俯卧位可以降低ARDS抢救的死亡风险,用肌松剂48小时、用2天,也可以降低死亡风险,主导这些研究的都是非常好的医生。大家想想,一个俯卧位或用肌松剂,一般厂家是不资助的。如果是厂家主导的、企业主导的,一般都是为了药物注册或者是研发所驱动的,按照道理来讲,如果这个研究没有完成3期临床试验、没有获得国家批准,是不允许去宣传或者推广的。我们要看他是不是获得了药政部门、主管部门、国家药监局的批准。
一定要记住,专家观点和体外实验是科学证据链里最低等级的。比如说前段时间治疗新冠状病毒的时候跳出来了一些学者来宣传双黄连能治疗冠状病毒,因为以前能治疗,现在双黄连也能治疗,我们这时候就要问他,你做过哪些RCT研究,你是怎么设计的?研究多少病人入组了?什么样的入组条件?最后的终点是怎么评价的?研究过程怎么控制的?最后才能得出结论。
我相信双黄连目前还没有用于治疗新冠状病毒感染的研究,即使要用,也应该是在ClinicalTrial.gov或者是在药监局去注册这样的一个研究,设计一个随机对照试验。还有很多专家是说中药或凉茶是有用的,也需要证据,还有说其他的一些抗其他病毒的一些药物,对冠状病毒也应该有效,体外实验证明了这一点,这也应该拿出证据。如果没有人体试验,特别是非常好的设计和控制下所做的3期临床试验或RCT研究,是没有资格或者是没有证据来说某一个产品是特效的。
今天跟大家分享了这样的一个思维方法,也就是说从医生选择治疗药物的一个原则,背后的证据链来辨别产品宣传,特别是现在互联网传播迅速,大量的伪科学和夸大疗效的产品宣传,如何辨别真伪,如何辨别是非?希望这些知识能帮助大家辨别过度宣传。