现代观点
2019年05月号

过去25年间,临床试验发生的25个变化

作者:刘亚青

临床试验的概念可以追溯到数百年之前,在1025年出版的《The Canon of Medicine》书中,波斯科学家阿维森纳描述了试验新治疗手段或方案的规则,其中包括了所有可以避免意外结果的步骤——从记录用药时间到收集结果。然而,纵观临床试验这几个世纪的发展,最重要的变化却是近几十年才出现的。

美国自由作家Mike May及其团队通过对临床专家的访谈,总结出了过去25年间临床试验的25个变化。这些变化涉及四大方面,包括总体进展、临床试验类型、特定程序和分析方法。但总体趋势是临床试验变得越来越复杂。

一、总体改变

1、越来越多的临床试验由企业推动

几个世纪以来,大多数新药的临床研究都由学术界推动,而现在跨国制药公司和研发外包机构(contract research organizations,CRO)成了主导力量,特别是III期临床试验。从20世纪90年代开始,CRO市场开始急剧增长。2016年,制药服务公司Quintiles Transnational与医疗信息公司IMS Health以90亿美元交易合并,形成了全球最大的CRO服务企业 IQVIA,表明了CRO服务市场的巨大价值。

2、相似药物的试验增多

由于越来越多的药物针对已验证过的靶点,因此过去25年,临床试验从“概念验证”转变成了药物检验。比如对于心脏病,过去是寻找新的治疗方案,而现在是测试多种药物的疗效。塔夫茨药物开发研究中心的负责人Ken Getz认为:“许多公司扎堆对同一机制的分子进行开发,这会带来巨大的资源浪费,同时争夺患者的竞争更加激烈,可能导致假阴性结果的增加”。可见,并非所有改变都对临床试验有益。

3、在分子水平筛选参试者

随着对疾病分子机制越来越深入的认识和研究,比如,特定的基因突变,提高了临床试验设计者选择最佳患者进行研究的能力。因为即使在同一疾病中,患者的分子差异也会影响药物的疗效和安全性。而现在我们可以利用生物标记来判断哪些病人更可能获得临床收益。这使得临床试验更高效。

4、加强试验人员的培训

除了在分子标记物上的进步,今天的临床试验团队还必须通过加强培训来提高自身的水平。2017年1月1日,美国国立卫生研究院开始要求每个NIH资助的临床试验,试验人员必须加强对良好临床试验规范(Good Clinical Practice,GCP)的学习,学习内容包括试验设计、实施、监督和管理。NIH要求整个试验过程必须符合GCP标准,并确保团队每个成员都了解试验运行的标准,提交试验期间遇到的任何问题,从而确保临床试验更安全,并提高试验结果的价值。

 二、试验类型的变化

5、适应性试验

传统临床试验按照设计开始和结束,但适应性设计可以依据前期试验所得的部分结果调整后续试验方案,从而及时发现与更正试验设计之初的一些不合理假设,比如进行剂量调整。适应性试验可以减少研究成本,缩短研究周期。2004年,FDA在“战略路径倡议”中制定了适应性试验方法,加速药物上市。目前,这种方法仍处于开发阶段,尤其是监管层面有问题待解决。

6、篮子试验

传统的随机临床试验是一种治疗对应一种疾病,而篮子试验则是一种药物对应一篮子拥有同一基因突变的疾病,比如可以是好几种癌症。这种方法源于对癌症分子认识的提高,而且这种方法允许临床医生同时探索一种药物是如何影响在多种肿瘤中发生的同种突变的。 因此,在这种试验中,可以根据疾病及分子标记对患者进行分组。 此外,这种试验依赖于“精准”药物,这类药物需要作用于特定的分子靶点。

7、下台阶试验

大多数临床试验往往在治疗方案中添加东西,但下台阶试验却恰恰相反。比如,在既定的包含多种药物的治疗方案中,下台阶试验会研究移除一种或多种药物后对治疗的影响,目的在于用最少的药物获得同等甚至更优的效果。纪念斯隆-凯特琳癌症中心的肿瘤内科医生拉里诺顿认为 “下台阶试验中蕴含哲学思考,在我年轻的时候,问题是‘我们怎样才能做得更好?’,现在是‘如何用更少的药物达到同样效果’,这两种思维完全不同。”

 8、平台试验

一些临床试验只能测试很少的变量,而平台试验则不然,它可以测试多种治疗方案,而且不设定结束时间。平台临床试验也可以是适应性的,允许随着时间的推移从研究中去除或者增加治疗方案。 尽管平台试验没有固定的运行时间,但这种方法可以通过测试较少的患者和较低的失败率找到合适的治疗手段,同时明显缩短试验时间。

9、真实世界研究

药物上市以后往往会产生新的信息。因此,一些监管机构不仅检查临床试验数据,也会检查真实世界证据(real-world evidence,RWE),而这来自真实世界数据(real-world data,RWD)。真实世界数据主要采集自电子健康档案、患者回家后自己收集的数据等。美国FDA就用真实世界数据监控上市后的安全性、不良反应,以此制定监管决策。获得真实世界的信息这一点也可以被纳入临床试验方案的设计中。此外,医疗服务提供者可以利用真实世界数据创建指南,指导治疗怎么用、何时用。

10、假手术

在外科手术临床试验中,有时需要进行假手术,即除了真实的手术介入外,其他诸如静脉输液、麻醉、切口、缝合等都一般无异。“这种情况在20世纪90年代中期之前很少发生,因为人们担心让病人暴露于假手术的风险,但现在已经变得更加普遍,特别是在骨科,如关节镜膝关节手术、椎体成形术,甚至心脏手术研究中都有使用”,哈佛大学医学史学家大卫琼斯说。尽管如此,一些科学家仍然担心假手术的伦理问题。

11、伞试验

所谓伞试验,就是把同种疾病的病人招募到一起,按照不同驱动基因进行分组,并分配不同的精准靶向药物。这种试验虽然具有复杂性,但是益处也是非常明显的:可以快速知道哪种药物对某种突变驱动的患者最有效。伞试验强调了在更短的时间内获得更多的信息。

三、临床试验过程的变化

12、试验要注册

早在2004年11月,在墨西哥城举办的WHO部长级峰会就提出要发展临床试验注册,由此催生了国际临床试验注册平台(International Clinical Trials Registry Platform,ICTRP),以便公众获取临床试验信息。多个国家都出台了相关规定和注册渠道,2017年美国FDA 42CFR法案就要求在美的临床试验需在ClinicalTrials.gov上登记;欧盟也有临床试验注册要求,所有这些举措都旨在推动临床试验的透明度和信息的可获得性,但也有不少临床试验不进行登记或数据更新不及时,导致数据不完整

13、线上招募

临床试验中招募足够多的患者是非常有挑战性的。美国退伍军人事务部的Grant Huang及其同事2018年在《当代临床试验》(Contemporary Clinical Trials)杂志发表的一篇文章中写道:“患者招募是决定临床试验成败的关键因素,这已经是一个全球共识。但事实上,有86%的临床试验未在规定的时间内招募到足够的参试者”。甚至有20%的临床试验因为招募不足而被迫停止。所幸,从20世纪90年代开始,网络招募兴起,在一定程度上提高了招募成功率。

14、招募标准更精细

患者招募,就是要找到符合试验入选标准的人。试验要解决的问题特异性越高,就越需要精准地挑选参试者。此外,针对特定分子标记或突变的药物试验也会进一步缩小潜在的患者“池”。为了获得所需的临床试验患者数,必须调整招募标准,以获得更具代表性的患者样本。

15、试验方案复杂化

除了患者招募标准变得更复杂以外,临床试验方案也变得前所未有的复杂。而方案的复杂化,给内部研发团队、医疗卫生服务人员、患者和监管机构都带来了更多的负担。临床试验团队从患者身上更频繁地收集更多的信息。试验方案的复杂化不仅是因为患者招募标准的复杂化,还因为更多的流程和终点。2018年的一项分析指出:“试验方案的复杂化阻碍了临床试验的开展,降低了效率,提高了新药研发成本”。 例如,从2001年到2011年,临床试验中所采用的终点增加了86%。

 16、弥合入组偏倚

2017年11月28日,美国NIH更新了其政策,要求被其资助的临床项目在开展时应该纳入女性和少数族裔,特别是在3期临床试验中,以判断药物对不同性别和不同人种、不同民族的效果。而要想了解药物或治疗是否因性别或种族而异,唯一方法就是将这些人群纳入临床试验。

17、简化为单一伦理审查委员会

临床试验中,患者的健康和安全被托付给伦理审查委员会(institutional review board,IRB),该委员会的任务是进行伦理审查以保护参试者。在多中心临床试验中,伦理审查是由各中心自行负责的。2018年1月25日,NIH要求其资助的临床项目采取单一的IRB来管理多中心临床试验,旨在除去无效的和重复的审查程序,在确保受试者的安全、健康权益受到保护的前提下,加速临床伦理审查。

四、数据采集/分析上的变化

18、信息化控制

临床试验的发展变化推动了对软件工具的需求,既要让一切井井有条,又要方便提取。从注册、在线招募,到入组标准和试验方案的复杂化,都促成了对强大软件工具的需求。临床试验管理系统(clinical trial management system,CTMS)之类的软件可以满足许多需求,包括试验计划、监控多个中心、挖掘结果数据都得以实现。 此外,CTMS还可以跟踪试验中的物资供应和财务状况。虽然试验曾经依赖于箱子里一摞摞的纸质材料,但只有软件才能满足当今的需求。

19、融合荟萃分析

随着临床试验数量的日益增长,截止到2018年9月,在ClinicalTrials.gov上登记的试验达到了28.5万之多,涉及到204个国家。对科学家们来说,如何从海量研究中综合、比较它们的结果是个不小的挑战。在这种情况下,荟萃分析(meta-analysis)这种统计工具应用得越来越多。

2014年的《European Heart Journal》杂志上,有科学家曾报道“荟萃分析发表的数量自20世纪90年代以来呈指数级增长”。尽管这种方法非常有用,而且应用广泛,但科学家们也提醒使用meta-analysis要谨慎,因为即使稍微偏离规则都会导致误导性结论的产生。

20、直接数据共享

虽然荟萃分析是常用的一种试验数据共享形式,但其他更直接的分享方式也越来越多。在某些研究中,数据本身可以直接共享,所以其他科学家可以直接用新方法分析这些数据。2018年,国际医学期刊编辑委员会所属期刊中就要求提交的研究论文中必须包含数据共享声明,其中要描述哪些数据会被分享,何时及如何分享。一些资助者也已经越来越多地要求数据在初步分析之后要进行共享。

21、共享中的保护措施

在数据共享越来越多的同时,临床试验设计必须控制数据访问方式,解决伦理和隐私问题。这催生了数据访问委员会(data access committees, DACs),负责控制数据如何被共享。WHO指出,必须保护数据的隐私和机密性,“避免因数据收集而使人或组织被谴责或被排斥”。尤其在共享方面,WHO要求匿名化、遵循知情同意原则,以及明确的伦理框架来控制数据的采集和使用。

22、数据采集方式升级

实时和远程收集数据有利于临床试验的开展,而可穿戴设备和智能手机App是提供这类数据的最佳选择。FDA负责人Scott Gottlieb指出,真实世界的数据流有助于发现安全性和有效性的早期迹象。尽管该领域的一些技术尚不成熟,但搜索ClinicalTrials.gov网站可以看出,有500多项研究都使用了某种形式的可穿戴技术。但要特别注意的是,研究人员要确保这类设备所采集数据的准确性。

23、追求一致性
比较不同临床试验的结果需要在世界范围内建立兼容性,这取决于各个组织和政府之间的大量合作。 例如,2003年7月,国际人用药品技术要求协调委员会(International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use,ICH)要求欧盟和日本的新药申请(new drug applications,NDAs)要采用通用技术文件(Common Technical Document,CTD)。CTD文件会以统一格式描述质量、安全性和有效性信息。ICH还将CTD称为“向FDA提交NDAs的推荐格式”。

 24、应用贝叶斯

在临床试验中,概率对于不确定性的衡量起着至关重要的作用。P值是经典临床统计方法,而贝叶斯则为概率加入了主观因素——支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。美国德克萨斯大学MD安德森癌症中心的生物统计学教授Don Berry是将贝叶斯应用于临床试验的先行者,45年来他一直尝试改革临床试验,但是花了20年才获得一点点进展。在未来的45年里,这种分析方法很可能会用在越来越多的临床试验中,并从数据集中提取更多的数据。因为现在,一些科学家已经对P值的使用提出了质疑,尤其是对P值的解释,这为贝叶斯的应用提供了空间。

25、野心勃勃的大数据

对于一些专家来说,临床试验和大数据是完美组合。当结合人工智能和机器学习时,极大的数据集可能会产生更大的结果,甚至可能改变临床试验现有的结构。已经有人开始认为,大数据会让随机对照这种试验方法消失,因为机器学习可以创建虚拟对照来实现同样的目的。但这不意味着所有专家都认为大数据可以解决临床试验中的每个问题。

(编译:刘亚青)
参考文献:Nature Medicine 2019;25:2-11

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5