医学前沿
2018年11月号
医学进展

基因调控元件的寻找之旅

作者:张书仁

全基因组测序技术的出现使更多响基因组调控序列的突变被鉴定出来,从而为研究遗传性疾病病理以及新发突变的影响提供了工具。虽然因此导致相关的研究正在逐渐增多,但是仍然还是差强人意;全基因组测序在基础研究和临床上的使用积累了大量的数据,但是现在还难以在海量的数据中准确鉴定出基因的功能性调控序列(增强子、启动子、非翻译序列等)。人们对于调控序列对基因组或者单个基因的调控作用的认识越来越多,但是到目前为止,还没有一种实验或计算方法能够一致、可靠地预测或者鉴定某个特定基因的顺式调控元件。因此,在人类基因组研究中面临两个重要的课题:首先需要积累足够多的单个序列,以便能够从众多的噪音数据中筛选出某个特定基因顺式调控元件的候选突变,其次是需要进一步的研究来区分这些突变发挥的功能以及发挥功能的优先排序。

物种间的系统发育比较(Phylogenetic comparisons)或是打破这一僵局的手段,但是这一方法也会有一定的限制:那些有着重要功能的序列往往是人类所特有的。如果利用这种比较方法来研究人类和大猩猩基因的序列,可能会因为大猩猩参考基因的变异性,而产生误差。由于序列覆盖度和质量不均一,在利用人类序列进行基因组比对(genome alignments)和基因注释(gene calling)时,会进一步加剧局限性。实际上,由于技术的偏差,大猩猩基因组的调控元件序列有时更像人类。

为了解决这个问题,Evan Eichler团队最近发表了他们对于黑猩猩和猩猩序列的研究,在这项研究中没有使用人类基因组框架。这项研究以及他们之前对于大猩猩基因组的研究,使得Evan Eichler团队可以对这些灵长类动物基因组的关键差异进行描述。研究者利用诱导多能干细胞(induced pluripotent stem cells,iPSCs)长读长测序建立了新的基因模型和大脑类器官,从而模拟研究黑猩猩和人的大脑发育的差异。他们的研究发现,结构变异(structural variations,SVs)能够影响某些预测的调控区域,比如:超级增强子,而且其影响基因表达的能力要比预想的更大。他们还通过转录产生的RNA的不同,去发现这些差异,比如研究人员发现了人类和大猩猩关键神经元细胞类型有显著的不同,这与人特异性SVs相一致。这些最新发现的人特异性变异,有着非常重要的意义,研究者们可以进一步研究它们发挥作用的机制以及与疾病发生的相关性。

基因变异如何影响疾病表型相关的调控序列,是一个存在已久的老问题。在不同的疾病背景下,由于缺乏足够的序列号,这类研究的进展非常缓慢,很难在复杂的背景噪音中分辨出可信的稀有突变。相比较而言,结构变异比单核苷酸变异的鉴定更为容易。Jonathan Sebat团队在大规模自闭症人群中对顺势调控元件的结构变异进行了鉴定,他们的评估方法依赖于从一般人群中得出的有害突变数据。之前的研究从对功能丧失(loss-of-function,LOF)突变的耐受和非耐受角度出发,发现了自闭症患者携带的编码突变主要集中在1000个对于LOF突变非耐受的基因中。将此作为比较点,如果序列表现出一般人群负选择SVs但患者队列携带SVs,可优先检查这类序列。在检查这些序列后,研究者将序列分为顺式调控区、编码区和非编码区,之后可叠加对LOF突变不耐受的信息。意外的是,他们报道了非耐受基因的顺式调控SVs是父系遗传,这与之前的认为母系遗传是主要的先天性突变的理念相冲突。因此,先天性的父本顺式调控结构变异是父系遗传的研究结论,迫使研究者去重新建立自闭症患者的研究模型。

研究调控序列的SVs如何影响功能基因的表达,需要构建一个调控序列的已知库。Matthew Hurles和他的同事在研究个体的未诊断的神经发育障碍时,采取了这种方法。他们的研究发现,在“解密发育障碍”研究中,约有超过50%的个体缺少蛋白编码基因的可分类变异。为了研究致病的顺式调控元件的作用,研究人员着眼于进化保守的非编码元件(non-coding elements,CNEs)、实验验证的增强子,以及假定的心脏特异性增强子(因为心血管疾病是最主要的非神经系统临床表型)。CNEs的新生突变,与许多组织的DNA酶超敏位点相关,可供鉴定高可能性的功能性候选突变。在CNEs中,这些新发突变表现出一定程度的富集性,而在已验证的增强子中却没有,这意味着这些CNEs序列可能发挥着明显的调控功能。研究随后专注于研究胎儿的大脑,该脑组织中存在着大量的新生突变。尽管大量的突变被Hi-C测序技术证明与胎儿大脑的早期发育(而不是发育障碍)有关,但是最终没有证据证实它们与特定调控变异的因果关系。有趣的是,研究还提到了某些CNEs和保守增强子的频发突变的发生,也为进一步研究这些突变奠定了基础。

以上三项研究在研究基因调控区域和确定调控区域结构突变优先排序方面都取得了非常重大的进展。这两类信息对于理解顺式调控元件中的变异是否导致人类遗传疾病,非常必要。神经发育以及自闭症研究提供了非常重要的见解。在神经发育的研究中,只有0.15%预测的突变被认为可能是跟病理相关的,这使得突变的影响看似非常有限,相似的是,在自闭症群体的研究中,遗传性顺式调节元件SVs也只有0.77%。在这两个案例中,这些效应值都远小于编码变异所观察到的值,这就使人们对上述变异的重要性产生怀疑。回答对这些变异的功能意义的质疑,最终还是需要通过多种技术,把测序信息以及调控序列与特定的基因联系起来。一些低级联赛的球员,如果在顶级联赛有机会出场他也有可能成为比赛的主宰者,这就像人类基因中存在的先天或者后天的突变;虽然看似不起眼,但就是因为这些突变的存在,才使得每一个人都是独一无二的个体。

(作者:张书仁)

参考文献:Cell 2018;174:247-249

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5