提前终止临床试验存在风险和危害

有争议的话题

2012年11月号

卷首语

寻找内源的满足感

医学进展

手机杂志

医学前沿

有争议的话题

现代观点

医学与社会

医生日记

放弃也是一种治疗

医学里程碑

蛋白质间相互作用图谱工程

在他乡

曾在异乡

提前终止临床试验存在风险和危害

当随机对照试验的中期分析结果显示，治疗收益较大，研究者有时候会在试验计划之前提前中止临床试验。加拿大麦克玛斯特大学的临床流行病学和医学生物统计学系的Guyatt GH教授和其同事们表示，这样的行为可能会产生深远而有危害的后果。

在1989年发表的一项生殖模拟研究报告中，研究者Pocock和Hughes表示，由于收益显著而提前终止随机对照临床试验，一般会导致过高估计治疗效果。但是从那时起，该研究内含的警告就被大部分人所忽视。

2005年发表在《JAMA》的一篇系统调查文章显示，因临床收益差异明显而提前终止的试验（被认为是截短的试验）所产生的治疗效应经常不被认可（半数试验的相对风险下降超过47%，而四分之一的试验相对风险下降超过70%），且小样本的临床试验会更多地出现明显高估治疗效应。随后，研究人员将在系统回顾和荟萃分析中包括的所有被截短的试验与未被截短的试验进行比较，发现提前终止的试验的治疗效应被大大高估（截短试验 vs未被截短试验，相对风险比率为0.71）。此外，研究者还发现效应高估可能与被截短试验的样本量有关：大幅度高估往往出现在样本量小于200的试验中；较小幅度但重要的高估一般发生在样本量200〜500的试验中；而样本量超过500的试验一般只会有小幅度高估。

在很多情况下，当真正的治疗效应并不是很大，被提前终止的小样本量试验（临床事件很少）往往会大幅度高估治疗效应。大样本量研究也会高估临床效应，但这种高估可能会产生某些重要、不合逻辑的推论和误解，某些时候甚至是很大的误解。

此外，被截短的试验产生高估效应的现象有特别的危害，因为这些令人瞩目的结果往往会发表在核心期刊上，被媒介快速传播，并很快被写入医疗指南和质量保护动议中。发表于2012年7月14日《英国医学杂志》的“分析专栏”表示，指南应当高度怀疑那些因收益差异明显而提前终止的临床试验所得出的结果，尤其是对那些样本量小且无法复制的临床试验，并专门列举了以下的三个实例：提前终止的临床试验导致错误地估计了治疗效应，并最终会危害患者。

#p#副标题#e#

非心脏手术的β受体阻滞剂

1999年，一项比索洛尔（一种β受体阻滞剂）治疗血管病变患者非心脏手术的临床试验计划入组266例患者，但在入组112例患者后，该试验就被提前终止了。比索洛尔组的59例患者中有2例达到了复合终点（即心源性死亡或心肌梗塞），而对照组53例患者中有18例达到了复合终点。研究者报道，比索洛尔组患者的相对风险降低了91%（95%的可信区间：63%〜98%）。2001年《新英格兰医学杂志》发表的一项专家意见就将β受体阻滞剂推荐给所有正在接受非心脏手术的高风险患者。2002年该领域内第一权威的临床实践治疗指南就将β受体阻滞剂推荐给同样的高风险患者。2001年，美国的质量保障动议认为，β受体阻滞剂可能会改善高风险患者的安全性。

然而，2008年发表的一项包括超过12000例正在接受非心脏手术患者的系统回顾和荟萃分析显示，β受体阻滞剂能降低35%非致命的心肌梗塞发生几率（95% CI：21%〜46%），但非致命中风发生几率会增加2倍（Odds Ratio=2.1），并可能会增加全因死亡率（Odds Ratio=1.20）。

尽管该荟萃分析提出了质疑，但随后的2009年和2012年出版的指南还是继续推荐β受体阻滞剂，甚至是极力推荐。β受体阻滞剂的支持者建议，低剂量和早期应用β受体阻滞剂能预防所有人群的中风风险的增加。虽然这种做法可能是对的，但是支持这种理论的证据是有限的。如果那个荟萃分析的结果是正确的，那么对于接受非心脏手术的心血管疾病患者，应用β受体阻滞剂会引起致残性的中风风险增加。必须痛苦承认的是，对于β受体阻滞剂的推荐可能会让大量患者经历致残性中风，但目前指南还是将β受体阻滞剂推荐应用于围手术期患者。

危重患者的强化胰岛素治疗

2001年，一项单中心随机试验报道，强化胰岛素能降低合并高血糖的危重患者的死亡率，减少42%的相对风险（95% CI：22%〜62%）。作者应用了大量终止试验的阈值（P=0.01），且反复审视了研究数据和方案，并宣称该研究的设计是允许提前终止研究的。这一研究结果受到很多人热情拥护，并很快被纳入到临床指南中去。2003年版指南就推荐，血糖的上限值应该≤8.3mmol/L。也发表了很多要求血糖上限值≤8.3mmol/L的试验。

幸运的是，该研究者的提前终止试验的决定并没有扑灭后续研究的热情。2008年发表的一项系统性回顾汇总了后续的研究结果，驳斥了强化胰岛素治疗降低死亡率的理论，并提出这种做法会增加低血糖的风险。稍晚发表的一篇系统综述也确认了这些研究发现。然而，多个指南制定小组仍然鼓吹，血糖的上限值应该≤8.3mmol/L。这些指南与基于近期研究结果所制定的推荐形成了反差，后者推荐血糖的上限值应该在7.8mmol/L〜10 mmol/L。

#p#副标题#e#

活化蛋白C临床试验

因试验被缩短而出现误导性结果现象的最近一个例子就是应用重组人活化蛋白C（rhAPC）治疗合并败血症的危重患者试验。该试验原始文章发表在2001年，临床试验在第二次中期分析之后被提前终止了，原因是在死亡率上已出现了明显差异。2004年的败血症患者生存运动（一项改善治疗的全球倡议）推荐，将该药物作为败血症患者治疗方案的一部分。随后发表于2005年的另一个试验强化了原试验rhAPC增加出血事件风险的担心，并提出了有关原试验中死亡率是否明显下降的严重问题。然而，2008年更新的败血症患者生存指南和2009年的另一个指南都继续推荐rhAPC。但是，在进一步研究结果失败后，该药物在去年退出市场，没有给指南制定小组根据最近的证据而改变推荐的机会。

不要再匆忙地做出判断

模拟显示，对于一系列具有足够权重的、有相同终止规则的试验进行系统回顾，能有效避免高估治疗效应。然而，这些模拟是假设一个试验的结果不会影响另一个试验的开展。这些假设不可能反映出真实情况。实际上，如果研究者做出提前终止试验的决定是合理的（由于患者不接受实验药物的干预，因此不再有伦理问题），就不会再进行改正试验。

因此，因提前终止试验而产生治疗效应的高估是两个相关现象（巨大的效应往往不能被复制和提前终止的随机试验结果往往高估治疗效应）的一个极端例子。现在，越来越多的方法学家正在指导临床医生和指南的制定者来解释临床试验的证据。这些指导应该包括对因收益明显而提前终止试验的结果表示高度怀疑，尤其是那些样本量相对较小的试验和不能复制的试验。

那些发表在高影响因子期刊上的、被提前终止的、具有令人惊奇结果的试验可能会导致媒体和指南制定小组快速而不严谨地引用，而专家们可能会不加批判地理解并且面对新的数据不愿意推翻原来的推荐建议。人们往往会寻找证据来确认原先的理念，同时贬低新的证据。

此外，如果这些药物售价昂贵且能产生巨大的经济效应，生产者就更愿意继续使用那些药物。药物生产企业能非常有效地影响临床医生和指南制定小组成员的行为，某些时候两者之间也具有巨大的利益冲突。因此，企业的影响可以部分解释为什么人们面对矛盾证据还是继续支持原先的推荐。

对于研究者，解决这个问题的办法就是避免引用那些提前终止试验的结果。我们可以对那些因收益明显而提前终止的试验提出质疑。上述的三个案例就是说明了这个问题。

专家们和指南制定小组成员应当保证，当证据基础不大且主要来源于那些被截短的试验，他们的推荐和汇总的证据应该反映出证据的不确定性，治疗效应可能会被高估。这样就能降低进一步危害的可能性。

由于治疗收益明显而提前终止临床试验是非常不明智的。这种做法可能会过高地估计药品的疗效，也会给临床实践产生误导。此外，一旦写入指导原则更可能会对患者产生严重的危害。因此，在提前终止一项临床试验前，请慎重，切不可因为喜人的结果而忘记了潜在的风险。（作者：马驰、王敏骏）

参考文献：《British Medical Journal》2012;344:e3863

提前终止临床试验存在 风险和危害

提前终止临床试验存在风险和危害