医学里程碑
2013年04月号
医学进展

计算医学:从模型到临床的过渡

    计算医学——使用计算机模型和先进的软件来探索疾病的发展规律及治疗特点,已经逐渐为众多医生所熟悉,并在心脏疾病、癌症和其他疾病的防治中得到了越来越多的应用。通过数字工具,研究人员已经开始使用实验和临床数据建立模型,以解决复杂的医学谜团。日前,约翰•霍普金斯大学计算医学研究所的研究人员在《科学•转化医学》杂志发表了题为“计算医学:从模型到临床过渡”的论文,对该领域的最新进展进行了综述,并对未来计算医学的转化应用进行了展望。

    约翰•霍普金斯大学计算医学研究所成立于2005年,由大学的工程学院和医学院进行合作,目标是使用强大的计算机来分析并对疾病机制进行数学建模,其结果将被用来帮助预测疾病的高危人群,并探索如何更加有效地治疗疾病。

    如何理解高度相互作用的网络,这样的工作过去被认为是系统生物学的范畴。在内源或外源物质的作用下,“生物体”系统内的各个模块相互影响最终造成疾病。由于新一代测序能力的极大提高,人们现在可以对海量的数据进行分析,找出疾病队列中DNA、mRNA、microRNA及蛋白表达的不同,这样就可以找出疾病与健康的首要区别,以及在疾病状态下重要生物分子的活性改变。此外,通过对高维度数据的分析,还可以帮助我们找到疾病的分子网络;在此基础上,疾病诊断、区分疾病亚型、明确疾病进展等问题就可以得到解决。

#p#副标题#e#

统计学习理论

    当面对复杂的高通量数据时,传统的生物医学研究模式已不合时宜。在这一领域内取得突破性进展的是所谓的“统计学习理论”。它的提出是基于以下考虑:生物医学中面对的数据量和数据库都是规模很大的,而相对的目标函数却一般难以给出明确的定义。这种困难,可以描述成问题规模的巨大以及问题定义的病态性之间的矛盾。在分子网络的环境中,研究某一物质的功能要结合与之相关的各种分子的性质,患病与非患病状态下的某一生物大分子浓度的鉴别同样不能仅关注这一蛋白的浓度与疾病的相关性,也要关注与之相关的蛋白在作用网络中的性质,这样便形成了多变量概率分布。

    在基因组数据分析的统计学习方法中,知识的提取主要体现在高维度数据转化为生物标记物上。在计算医学的尺度下,生物标记物所指的是基于一种分子网络状态下的测量,这种测量可以识别或者确定疾病在分子水平的表现形式。例如异常广泛参与相互作用的生物大分子,或基因-蛋白互作模式的差别就可以区别出疾病和健康状态。

    但是从一些表面上互不相关的生物大分子数据过渡到疾病的性质需要某种预测的原则。例如,比较某一观测值X是在健康情况还是在疾病情况将给出一个数值,这个数值将有利于其他诊断数值从分子网络中直接计算出来。有少量的分子标记物已经被FDA批准,例如三种分子水平的乳腺癌早期的诊断。其中一种诊断叫做 MammaPrint,这种诊断技术来源于基因芯片技术,通过对70种基因表达水平的测量,它可以对雌激素受体阳性及阴性的患者5年乳腺癌复发率进行预测。

    尽管计算医学方法开局顺利,但是目前基于这种方法所给出的数据往往不够精确,而且有些结果不能重复以至于无法得到临床应用。制约统计学习理论在计算医学上应用的因素主要有三个:技术上的、数学上的、转化上的。首先,分子层面的统计分析要求有足够大且能够代表群体的样本量,在此基础上还需要从这些样本中获得足够高质量的数据。在目前的许多研究中,样本量实际上并不足以体现疾病模式;而且,在很多时候,实验室的检测水平或方法不稳定常常会导致生物样品检测数据质量不高。提高数据的数量和质量可以克服这一障碍。

    第二,数学挑战。极高维度数据库现在属于生物医学与工程学的共同敌人,这样高维度及广泛互作的数据造成统计学习方法无法对出现的模式或特征进行归纳。例如我们通常需要一种疾病的状态作为数据分析的原形例子,通过对这种状态的归纳推广到n×d这样的空间中,这里n指的是不同的实验对象,d指的是不同种可能的生物标记物。在理想状态下n需要远远大于d,但在实际研究中n往往基本上等于d,甚至小于d。现在唯一的解决办法似乎只有通过积累先前的实验数据或经验给出限制条件。

    最后,尽管有足够的高质量的数据,从数据中提取关于生物医学的知识也是相当困难的,也就无从给出一个可检测的生物学假说。在目前已有的统计学习方法中,随机森林和支持向量机占有主导地位,而这两种方法的开发目的是计算机发音与图像识别,与计算医学完全不同。即便能从千百个计算公式中找出了可能的参与变量,但如何从这些变量中找出一定的生物学理论或假说,甚至比上面的公式还要复杂。针对比较容易理解的关系,如基因与蛋白或蛋白功能与疾病之间的关系,通常是克服数据质量的必要手段。

    许多疾病的起病原因与信号传导异常有关,这已经被统计学习方法所“适应”。一些机器学习理论,诸如神经网络、随机森林和支持向量机方法,在这一过程中已经得到了初步应用,但是这些方法往往缺少先验的知识,给出的决策方法也往往包括多种参数或基因。传统的研究一般要求基因或基因产物的监测数量不应过多,这样就必然要求检测参数要易用易懂。基于传统方法的观察的好处是,尽管可监测的基因不多,但其特异性及敏感性与复杂模型相同。目前已有若干例子在胃癌压型区分、乳腺癌治疗方法、胰腺癌分期等几方面得到应用。

#p#副标题#e#

计算生理学:微分方程的多尺度内涵

    计算生理学起步于20世纪90年代,至今已进入“后基因组时代”。目前在这一领域的研究人员均呈普遍乐观态度。但事实上,该领域的前景是否真的如研究人员所“描绘”的那般美好呢?

    在回答这个问题之前,我们不妨回顾一下早期人工智能的发展史,在1960年左右,科学家们曾相信不出十年,人类即可像完成登月一样完成对人的模拟,造出一个与人智能行为完全相同的机器人。但迄今为止,这一预言的实现仍然遥遥无期。尽管人工智能研究得到的成果已经渗入到各个领域,但对人的思维行为的了解远未完全明了。

    如果说统计学习方法的核心是比较患病或健康人中某种蛋白的表达,那么相应机制模型就是描述这种蛋白与何种分子有关、彼此浓度的变化及转换程度的一种方法。在数学上它往往表示为若干个微分方程。偏微分反应方程模型及主体模型可视为这种方法在时间与空间上的拓展。这种机制模型近年来的发展主要是提出所谓的多水平建模(multiscale modeling),几乎所有的生命现象都是涵盖多水平的各个要素(图1)。这种模型一旦建立后便可以直接对生命现象进行分析和模拟。但是由于这种研究仅有少量的参数可以进入到模型当中,所以较低的通量是限制其应用的主要障碍。

    癌症的建模是典型的多尺度建模,目前大致可以分为三层:分子层次、细胞层次和组织层次(图2)。分子层次包括基因转录和蛋白表达、信号通路的信号传递等,随着理论的发展,现在这些水平的模型正呈现着融合的趋势。目前的肿瘤模型倾向于多层次、多维度的仿真建模,这种模型有利于整合更多的底层信息,并且在结果显示上也更为清晰和直观。在微观方面,数学模型可以将蛋白组信息、基因组信息等整合起来,作为模型仿真的依据和底层的控制机制;而在宏观方面,将细胞与细胞之间、细胞与环境之间的相互作用,融入数学模型中,通过计算机仿真,不仅能体现肿瘤在空间上的形状和大小,还能对其中各种成分的相对位置进行分析。这样的多尺度模型能很好地将分子生物学家与临床医生的工作联系起来,在理论分析与实际应用方面都具有很好的发展前景。一些研究小组最近正在将这些模型用于每个个体的原位乳腺癌模拟,应用这些模型,研究者们发现原位癌的大小可以被活检结果所判定。这些结果可能对医生的下一步治疗具有指导作用。

#p#副标题#e#

    虚拟条件下的药物筛选也可以通过细胞信号网络实现。在最近的研究中,有研究者开发出一套针对ErbB的乳腺癌信号传导仿真工具,并以ErbB3蛋白为靶点进行药物的开发。在这一工具的帮助下,一种新的人源化单克隆抗体MM-121被开发出来。现在MM-121正在进行I期及II期临床研究。

    综上所述,计算模型正在不断改变癌症的诊断和治疗。但是在临床广泛应用这些工具之前,还存在一些挑战需要攻克。比如,我们需要建立一种更加数字化、涵盖更多内容(从基因到影像学)、可以汇总各个时间段个体数据的癌症诊断方法;此外,这一领域还需要依照生物体不同尺度上的数据进一步改进建模算法;最后,这些数据应该演化为可用于行动的、以治疗为指向的临床决策(图3)。

计算解剖

    计算医学的另一个发展方向是与影像学结合紧密的计算解剖学。计算解剖学技术涉及图像处理、数字几何处理、数学建模和专家知识等技术,其主要的推动力是融合知识的解剖结构信息在人体生物建模、手术计划、神经功能等众多领域的应用和研究价值。今天的解剖学已经不是探讨图形是否高质量的时代了,现在科学家们已经在讨论不同个体间的解剖学差异是否影响到健康,一些研究者形象地把这一现象称为疾病形状的研究。从早期的癌细胞-血管-微环境的探讨开始,人们正在不断加深这一领域的研究。在计算解剖学研究中,首先确定标准形状模型(或称模板),随后所有的模型与这个模型进行比照,以确定器官形态的变化。

    Csernansky等人研究了老年痴呆患者海马的结构,研究人员将未发生痴呆(临床痴呆评定量表Clinical Dementia Rating scale,CDRS=0)老年人的海马与发生痴呆(CDRS=0.5)的老年人的海马进行比对,预测失智症的疾病进展。McEvoy等人将健康人及阿尔茨海默病(AD)患者区分开来,实现了83%的准确率和93%的特异性。有器质性表现的AD患者在1年后表现出更加明显的认知能力下降。研究人员认为该项检测与生物标记物同样重要。但是与之相应的是:人们如何解释这种形态上的变化?应用这些现象的时候需要如何判定它们的应用范围?另外,核磁设备产生的大量无法理解的数据已经成为这一技术的瓶颈。

    尽管面临诸多挑战,计算解剖学方法目前已经在不同的疾病治疗领域得到重视。除此以外,计算解剖学算法现在已经通过ipad程序直接应用于临床。鉴于影像学技术和计算能力的日益发展,计算解剖学模型的预测能力理应会得到较快的发展。计算医学为生物医学研究提供了新颖、定量的方法来理解、检测及治疗疾病,我们有理由相信,未来计算医学必将会成为一个快速发展的学科。(作者:李秋实、刘荣军)

参考文献:《Science Translation Medicine》2012;4:1-11

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5