华盛顿大学医学院的科学家们通过检测12种主要的癌症类型,鉴别出了127个似乎驱动了机体众多肿瘤发生与发展的多次突变基因。对肿瘤的分子畸变及其功能作用的分析,为设计出新的诊断工具及更个体化的癌症治疗方案创造了条件。该研究是“癌症基因组图谱”之泛癌症项目的一部分。
癌症基因组图谱计划
癌症基因组图谱(the cancer genome atlas,TCGA)计划是由美国国家癌症研究所和美国国家人类基因组研究所于2005年提出的一项系统工程,旨在联合全球科学家通过网络研究找到所有癌症基因与普通基因的微小变异,这些差异可以为癌症检测提供新的方法,帮助我们了解癌细胞发生、发展的机制,并在此基础上取得新的治疗方法,最后勾画出一个全新而完整的“预防癌症的策略”。
在TCGA中,科研人员可以共享研究获得的数据资料,包括某一特殊基因的突变、染色体重组、转位缺陷等。
绘制癌症基因图谱有助于把研究人员从目前逐个追踪基因的大量劳动中解放出来,便于迅速设计和找到针对性的抗癌药物。美国国家癌症研究所副所长安娜•巴克认为,这项计划“是生物医学研究中的一大转折点,也是药物治疗的一大转折点”。
绘制癌症基因图谱计划的实施,将有助于癌症生物学、基因组学、生物样本库和生物信息学领域的最新成果在共享平台上得到协调发展和最佳应用。
跨肿瘤类型的分析
癌症是一种基因组疾病,这已是不争的事实。在早期,科研人员通过功能分析方法已经识别了很多原癌基因,通过杂合子缺失方法识别了一系列抑癌基因。系统的癌症基因组项目,包括TCGA,运用新兴技术来对特定的肿瘤类型进行分析。这种以特定疾病为出发点的分析方法已经确定了新的致癌驱动因子和促进功能改变的基因,建立了分子亚型的定义,并在基因组、转录组、蛋白质组和表观基因改变的基础上发现了新的生物标志物,其中一些标志物具有临床意义。
肿瘤样本数量的增加提高了我们检测和分析肿瘤驱动分子的能力。例如,我们可以通过缩小区域从而达到对驱动基因更精准的定位。通过大样本筛查,科学家能够利用DNA测序发现一系列经常发生的基因组畸变(突变、扩增、缺失、易位、融合和其他结构改变)。但是,上述肿瘤样本的基因组畸变也存在着“long tails”(长尾)分布的现象。事实上,即便是同一种肿瘤,样本与样本之间也存在着不同的突变。
尽管每个肿瘤在这方面都具有明显的独特性,但这一系列畸变通常存在于一类肿瘤共享的生物信号通路中。在其他情况下,跨肿瘤类型中高频出现的罕见体细胞突变也可被认为是导致肿瘤发生的驱动因子,例如,编码特定蛋白质结构域的DNA片段的热点突变,往往能够促使我们找到潜在的药物靶点。
要想确定某一罕见突变究竟是驱动子,还是仅仅为一个不能发挥作用的产物,以及它们在临床上是否有意义,还需要进行进一步的功能评估。对更多驱动性畸变的识别以及对个体肿瘤缺陷株的获得,对肿瘤的个性化治疗具有重要意义。而对“长尾”中成千上万的畸变,寻求“特异性”的个性化治疗则更具挑战性。
在几十年的研究中,研究人员虽然发现了一些重要的规律,但直到最近,大多数科学家对癌症的分子、病理及临床性质的研究仍然依据肿瘤类型而“各自为政”。在任何一个有一定规模的肿瘤中心,你只需看一下肿瘤部门的清单就可以发现:大多数情况下,医生还是根据器官的起源来对疾病进行分类。这种分类一直以来好像很有道理,但分子层面的研究结果对这一观点提出了质疑:不同器官的癌症有许多共同的特点,相反,同一器官的癌症往往大相径庭。
目前研究人员已经确定了一些来自不同器官的肿瘤亚型具有重要的相似之处。例如,TP53突变能够引起高度恶性的浆液性卵巢癌、浆液性子宫内膜癌和基底样乳腺癌,它们都有一个共同的转录特征,这些转录变化涉及了类似的致癌途径的激活。同样,在胶质母细胞瘤、胃癌、浆液性子宫内膜癌、膀胱癌和肺癌中,都出现了ERBB2-HER2突变和/扩增。至少在某些情况下, 靶向HER-2的治疗能够起到效果。其他不同肿瘤的共性包括:在两种浆液性卵巢癌、基底细胞样乳腺癌、大肠癌以及子宫内膜肿瘤中,BRCA1-BRCA2信号通路发生突变;最近发现的由POLE-介导的突变表型,同时存在于结肠癌和子宫内膜癌中。
值得注意的是,有时同一基因的畸变会产生不同的影响,这取决于其发生的器官。一个典型的例子是Notch基因家族,它在肺、头颈部、皮肤和子宫颈的一些鳞状细胞癌中是失活的,但在白血病中却是激活的。
这些例子向我们阐明了对不同肿瘤进行全面理解的重要性,而不能仅仅依赖于组织病理学诊断。重要的是,对数据的整体理解将会帮助我们理解为何某些突变基因在不同组织中会产生不同的结果。相对罕见的癌症,如儿童恶性肿瘤,更能从这些分析中获益。
与几年前相比,目前我们知道了更多关于癌症的分子信息。对组织学、器官部位和转移灶位置等数据的整合是否将有助于改善病人的治疗结果,还需要时间来验证,但起码我们已经看到了一些端倪。
泛癌症项目
2012年10月26日~27日,TCGA在加利福尼亚州圣克鲁斯举行的会议上推出了泛癌症的分析项目。泛癌症项目是一个协调的倡议,其目标是整合出不同肿瘤的协调一致的TCGA数据,然后对这些数据进行分析和解释。在项目启动的2个月内,研究者对第一批12个肿瘤类型的数据进行了质控、统计分析和解释,大部分研究者来自TCGA研究网络。
泛癌症项目为分析过程提供了一个框架,在未来,它将包括新的肿瘤类型、TCGA以及其他企业获得的数据。目前主要的研究包括儿科癌症和成人癌症以及由世界各地的研究团队开展的规模较小的项目。大量的研究正在为泛癌症手稿贡献力量。以下是这些研究当中所碰到的问题。
(1)统计力量的增加能够帮助我们从背景突变数据中区分出新的癌症驱动突变吗?
其实,重组的泛癌症数据启用了新的基因驱动识别模式。新的计算方法目前能够识别出常见突变,同时能够消除许多假阳性和假阴性信号。此外,对阳性选择中多重信号的识别能力能够提高我们区别驱动性畸变和无意义突变的能力。
(2)当综合跨组织样本得来的所有突变事件时,哪种方法是可行的?
大型染色体片段结构变异分析方法的提高使得我们识别基因组和表观遗传学调节基因的能力增强。组织相关模式目前已经建立。当许多组织中的突变事件被认为是一个整体时,哪个信号通路会脱颖而出呢?新类突变作为驱动基因被识别,如染色质重塑,并且只能通过以下手段被识别:①收集低频事件;②整合事件类型,如基因突变、拷贝数变化和表观遗传沉默;③结合多种算法,确定预测的驱动基因;④利用基因网络和信号途径最后确定目标基因。
(3)分子亚型的划定是否能够帮助我们更好地理解组织特异性?
表观基因组、转录组和蛋白质组的分析表明组织对肿瘤细胞中信号通路的改变具有很强的影响力。例如,基因表达的分析强化了肿瘤中变化信号途径的组织依赖性。同时使用所有类型肿瘤的数据能够将任一特异性信号从数据库中剔除。有趣的是,从DNA微阵列基因表达数据库剔除组织特异性信号能够识别超越肿瘤类型界限的免疫基质影响的特征。另外,在跨谱系中常见的事件在跨肿瘤分析中也变得显而易见。例如,乳腺癌、卵巢癌和子宫内膜癌的激素依赖性以及头颈癌、肺癌、子宫颈癌症和膀胱癌共同的“鳞状细胞癌”特征。
跨肿瘤类型分析的局限性
目前,一些数据整合的挑战已经给跨肿瘤分析带来了不可避免的局限性。一个关键的挑战是,对不同平台或同一平台更新的数据进行整合。例如,在泛癌症研究中,出现了很多转变:如更高密度的DNA甲基化阵列、不同的外显子捕获技术、以微阵列为基础的RNA鉴定技术等。一系列分析方法已被用来评估系统和平台特异性的误差。
不同类型的肿瘤,其临床数据的性质和质量有很大不同。这些数据的差异限制了我们建立通用型解决方案的能力。例如,泛癌症存活率数据中有关粘液性卵巢癌的相对较多,而关于乳腺癌和子宫内膜癌的却不太多。只有当某些数据元素与疾病相关时才会被定期地收集(例如,肺癌、膀胱癌和头颈癌患者的吸烟史)。病毒感染在几个实体肿瘤类型中已被确定与肿瘤的发生有关,包括头颈癌、子宫颈癌、卡波济氏肉瘤和肝细胞癌。然而,其他癌症的感染性病因的泛癌症分析目前还未实施。此外,肿瘤分期、分级在不同类型的肿瘤中并不具有可比性,因为每个肿瘤类型都有自己的系统。目前,跨肿瘤分析所面临的最大的挑战是:临床实践中根据组织或器官进行肿瘤分类。
从统计学上来讲,必须保证一定的样本量,以避免假阴性率或假阳性率的增加。肿瘤谱系在共畸变以及基因表达谱上发挥重要作用。同样地,准确探测跨肿瘤发展趋势的新方法需要考虑到不同组织在突变率、拷贝数改变以及其他遗传和表观遗传背景下发生相同事件的差异。
尽管存在这些挑战,泛癌症数据的收集仍然可以被视作从分子水平上理解肿瘤生物学特征的一个里程碑。随着时间的推移,数据库的广泛使用以及更深一步的合作,用于对比不同肿瘤的分子水平差异的技术也会进一步提高。
未来的发展方向
泛癌症项目意味着一定要汇集多方努力来协调对整个癌症体系分子蓝图的分析。进一步增加每个肿瘤类型的样本数和不同肿瘤类型的数目将会提高我们检测异质肿瘤样本中罕见驱动基因的能力。但真正的动力将来自详细的跨肿瘤类型分析,这将需要高质量的临床结果和临床试验来检测可能出现的假设。可以预见的是,组蛋白分析以及基于质谱的蛋白质分析技术,以及通过单细胞测序识别肿瘤异质性的技术会为我们提供很多重要信息。
对肿瘤祖细胞识别的持续努力将使得我们从狭隘的特征中总结出共性。克隆级别以及其他类型的研究或许可以识别出肿瘤类型中更多的相关性。对于原发性肿瘤来说,当期转移至远处部位时,其特征可能发生显著变化,特别是骨和脑。因此,跨肿瘤类型转移的分析将更加有益。
随着单个肿瘤细胞分析技术的提高,我们对跨肿瘤分析的能力也会提高。目前,基因组测序的价格已经降低,接下来的泛癌症项目将能够分析大量跨类型肿瘤的全基因组序列。通过分析基因组的非编码部分可以对当前的研究进行补充。这项扩展的分析会将焦点集中在启动子和增强子位点的紊乱和非编码RNA的畸变上。全基因组测序创建了一个背景,在这个背景下,全基因组关联研究可以将遗传倾向与特定癌症联系起来。以相关信号通路和网络为基础,以系统为导向的方法将增加治疗的机会。
(作者:贺利军、刘荣军)
参考文献:《Nature Genetics》2013;45:1113-1118