随着与人类疾病相关lncRNAs数目的增多,目前的研究工作集中在它们的调控机制。对lncRNA相互作用分子的识别以及lncRNA结构确定的新技术,使我们对lncRNAs的功能及其所参与的疾病发生有了更加深入的了解。反过来,lncRNAs可能成为治疗的新靶点或生物技术的新工具。
简介
目前认为RNA是生物系统的重要调节者。虽然其主要序列能够编码蛋白质,但它也可以折叠成非蛋白编码结构域从而发挥催化功能,或结合小分子,或成为蛋白骨架的一部分。非编码RNA能够条件性控制基因表达,并且可能调节着人类60%以上的编码基因。随着越来越多的调节RNA被识别,以RNA为基础的调控系统被应用于解决微生物和哺乳动物生物技术方面的难题。基因网络已被用来识别与癌症相关的miRNA表达谱,基于shRNA基因开关或许能够支持基因治疗的应用。
尽管我们在RNA的调节机制以及与RNA相关的生物技术方面取得了显著进步,然而绝大多数转录因子的功能目前我们还不是很清楚。在人类基因组中,只有不到1.5%的基因能够编码蛋白质,但绝大多数能够编码RNA。一些研究表明, 90%以上的人类基因组都会被转录,尽管有理论认为是人工技术或生物噪音造成了如此普遍的转录。越来越敏感的RNA测序方法正在帮助我们解决这一争议,并已证实有许多新的转录子存在。
目前的工作都集中在对这些假定的非编码转录子进行分类,其中重点是对长非编码RNA(lncRNAs)的研究。lncRNAs与短非编码RNA不同,其长度大于200个核苷酸。先前的研究已经对8000多个lncRNAs进行了分类,而有关lncRNAs与疾病联系的论文数量也在逐年增加。
越来越多的文献都在讨论lncRNAs在与人类健康相关的基因网络中发挥转录以及转录后水平调控,包括肿瘤抑制和发育。在各个水平的调控上,本文讨论了lncRNA的调节机制及其在人类疾病中的作用。最后,本文也讨论了有关lncRNA的新技术,以便对其功能有更加深入的了解。
#p#副标题#e#
表观遗传学调控
尽管同一个体不同类型的细胞拥有相同的基因组,但它们的基因表达方式是独特且可遗传的。可遗传突变除了与DNA序列本身有关外,还会被一些特征分子所编码。这些表观遗传学特征可能在染色质上表现出来。染色质为遗传信息的载体,由组蛋白八聚体环绕DNA组成。DNA中胞嘧啶的甲基化以及转录后组蛋白修饰能够决定染色质所处的状态,从而激活或沉默转录。在哺乳动物系统中,染色质重塑元件通常缺乏能够定位DNA的结构域,因此需要依赖一些辅助因子进行精确定位。LncRNAs可以作为这些因子,募集染色质重塑元件到它们合成的位点上。顺式以及反式lncRNAs在多种细胞进程中发挥表观遗传学调控,包括肿瘤抑制与发育。
细胞周期调控和肿瘤抑制:细胞衰老是细胞周期停滞所处的状态,细胞周期停滞能够避免细胞无限增殖和肿瘤发展。对染色体9p21的42kb区域进行检测后发现,INK4b(p15)-ARF(p14)-INK4a(p16)位点对细胞衰老起着重要调控作用,因为它编码了三个重要的肿瘤抑制因子:p14,p15,p16。p14能够增加p53信号通路活性;p15和p16通过增强pRB功能以及抑制周期蛋白激酶活性而促进细胞周期停滞。PRC-2对这一位点起着协同调节作用,它能够对组蛋白H3上的27位赖氨酸(H3K27)进行三甲基化从而沉默异染色质化。而PRC-1将甲基化的H3K27看做是维持异染色质化的信号。顺式以及反式IncRNAs能够募集这些复合物从而帮助形成异染色质。
ANRIL是一个表达p14、 p15反义链的lncRNA,它能够结合PRC-2的一个亚基(SUZ12)以及PRC-1的一个亚基(CBX7),从而将PRC-1/2复合物募集到特定位点。ANRIL的低表达或者缺失能够导致p15以及p16的上调。ANRIL表达的改变能够影响位点基因的转录水平。在前列腺癌中ANRIL的表达升高。
反式作用lncRNAs也可以通过对这一位点的调节从而发挥肿瘤抑制功能。通过对肝癌中表达升高lncRNAs的筛选发现,高表达的IncRNAs(HEIH)能够与PRC-2甲基转移酶亚单位EZH2相结合。HEIH低表达能够抑制PCR-2的靶基因,包括p16;HEIH的过表达能够在p16启动子的区域增强H3K27的水平。这揭示了一个反式作用模型:HEIH募集PRC-2从而沉默p16以及其他与细胞周期调控有关的基因。结果说明HEIH对PRC-2的募集可能促进肝癌发生。
发育。与在INK4b-ARF-INK4a中的调节作用相似,lncRNAs也参与HOX基因的表观遗传学修饰。HOX有39个转录因子,控制着躯干以及沿解剖轴前后器官的发育。lncRNAs HOTAIR由HOXC位点基因编码,它通过募集PRC-2和LSD1从而对HOXD产生转录抑制。PRC-2和LSD1复合物能够去除染色质修饰(H3K4me2)。HEIH、HOTAIR过表达则能够促进乳腺癌与结肠直肠癌的转移。
与PRC-1/2复合物转录抑制相反,TrXG蛋白对组蛋白H3四位赖氨酸(H3K4)的三甲基化能够保持HOX基因转录活性。LncRNAs能够募集TrXG蛋白(如MLL-1复合物)从而激活特定HOX基因。LncRNA HOTTIP结合WDR5(MLL-1的适应蛋白),从而将MLL-1/WDR5复合物募集到HOXA基因的5' 端。如果HOTTIP表达降低,将看不到这种相互作用。Mira是另一个与HOXA位点转录相关的lncRNA,其低表达能够显著抑制HOXA6/7。与HOTTIP不同,Mira能够直接与MLL-1结合,并且募集复合物到HOXA6/7的启动子上。在小鼠胚胎干细胞分化早期,Mira通过激活HOXA6/7从而间接激发15胚层标记基因的表达,这进一步强调了lncRNAs在HOX调节发育中的重要作用。
#p#副标题#e#
虽然HOX簇为我们了解lncRNAs介导的抑制与激活基因表达提供了一个好模型,但lncRNAs在表观遗传学中调节范围似乎更为广泛。最新研究发现,能够影响小鼠胚胎干细胞基因表达的lncRNAs有137个,这也证明lncRNAs在早期发育以及胚胎细胞生物学方面发挥着重要作用。其中大约有30%的lncRNAs与染色质修饰蛋白相互作用,并且对那些维持ES细胞多能性以及抑制特异性分化基因产生影响。除了早期发育,lncRNAs对维持一些特定组织的发育也发挥着重要作用,如视网膜。尽管被lncRNA调控的靶基因多种多样,但还有很多问题有待进一步探索,如:确认与染色质重塑元件发生相互作用的RNA基本序列;发现lncRNA将靶复合物带到染色质特殊位点的机制。除此之外,在裂殖酵母中的一项最新研究发现,蛋白编码mRNA和它们的降解因子一起,在特定位点对发育信号做出反应,促进核中异染色质的形成。更重要的是,探讨lncRNA与蛋白编码转录因子在表观遗传学方面的调控是否有相似的机制,将是一件特别有意义的事情。
转录以及共转录调控
表观遗传学调控涉及了对染色质重塑元件的募集,而转录水平的调控往往是对RNA聚合酶II(PolII)、转录因子以及特定基因启动子区域共调节子的募集。正如lncRNAs募集染色质修饰蛋白一样,它们也在不同的信号通路下入核组装转录因子,这包括:在P53信号通路中lncRNA介导的对靶基因的抑制以及在核受体信号通路中lncRNA的共激活。lncRNA对转录的调控不仅仅作为支架,因为lncRNAs也能够通过与启动子DNA形成三级螺旋从而结合并抑制转录因子或者靶基因的活性。虽然目前我们对lncRNAs转录调节的机制及其与疾病的联系已有一定了解,但最近的研究更加深入地剖析了lncRNAs介导的转录调控机制以及这些通路与疾病的相关性。
细胞周期调控。细胞周期进程与特定lncRNAs的表达密切相关。已有研究证明,一些lncRNAs大量定位在核小体,这能够使一些与转录激活或抑制相关的蛋白因子归巢。最新的一项研究表明,lncRNAs通过募集特定基因到核小体从而对细胞周期调控发挥重要作用,最后导致转录激活或抑制。LncRNAs TUG1和NEAT2分别与PcG小体以及ICGs有关,并且作为一些蛋白因子的支架。这两个lncRNAs也可以结合Pc2,Pc2与细胞周期调节基因的启动子相关,并且包含一个结合组蛋白修饰的结构域。TUG1结合Pc2的甲基化形式,募集蛋白到PcG小体,从而抑制异染色质。相反,NEAT2结合Pc2的非甲基化形式,将其募集到ICGs,增强染色质活性。结果显示,Pc2甲基化和去甲基化调控着细胞周期的进程以及细胞周期调节基因的转录。
压力反应。对PolII的直接抑制是转录调控的另一种形式。Alu lncRNAs是由polIII转录形成的大约300bp的产物。压力如热休克和肿瘤,能够促进这些lncRNAs的表达。在热休克诱导的肾细胞中,Alu基因的低表达能够导致四个基因的表达降低,这引发了对Alu结合PolII特定区域的研究。结果发现,Alu lncRNAs通过阻断polII与DNA启动子的结合从而抑制基因表达。对那些限制Alu对特定基因抑制的调节因子的识别仍然是研究的重点领域,并且对这一通路的调节可能有一定的临床意义。
最近的一项研究揭示了Alu与视神经萎缩(GE)之间的复杂联系。GE是黄斑变性的形式,也是造成失明的常见原因。GE患者视网膜的Dicer1表达降低。Dicer1是切割长双链RNA的酶,它也是小RNA基因沉默的核心组分。意外的是,涉及miRNA加工过程所需其他酶的降低并不会导致GE表型,而Dicer1的低表达能够导致Alu lncRNAs的积累。视网膜组织中Alu lncRNAs的过表达能够导致GE的发生,这一过程能够通过增加Dicer 1的表达而逆转。Dicer1是剪切毒性长双链RNA Alu转录子所必须的,若无法产生短的Alu产物可能也会促进GE。剪切过的Alu产物在视网膜中是否发挥功能以及在其他疾病组织如肿瘤中下调Dicer1是否会改变Alu的表达,都将是研究的重点内容。此外,用反义核苷酸链来降低毒性Alu lncRNAs水平或许是将来治疗GE的一种有效方法。
转录后调控
lncRNAs表观遗传学调控与转录调控有着相似的地方: lncRNA-蛋白质相互作用以及lncRNA-DNA/染色质相互作用在转录激活或抑制蛋白(如转录因子或染色质重塑组件)与这些蛋白被募集的基因位点之间建立了很多不同的联系。虽然目前的研究重点还在这两个领域,但lncRNAs在转录后基因调控网络中的作用也日趋明显。发挥转录后调控的lncRNAs属于竞争性内源RNA(ceRNAs),它们含有miRNA的结合位点(miRNA作用元件;MRES)并且能够降低那些靶作用于mRNA的miRNA水平。miRNAs调节着成千上万种人类基因,并且每一个miRNA可能有很多靶点。因此,ceRNA调节的范围可能很广,最近的研究也强调了ceRNAs在发育以及肿瘤抑制方面的作用。
细胞周期调控与肿瘤抑制。一项对PTEN的研究证明,lncRNAs可以作为ceRNAs发挥作用。PTEN是一种肿瘤抑制基因,它的改变与肿瘤易感性相关。之所以选择PTEN作为研究对象,在一定程度上是因为它能够被miRNA所调控,并且含有一个非编码基因PTEN P1,PTEN P1含有一个3' UTR区。PTEN P1 3' UTR的过表达反式作用调节PTEN,但这一调节只发生在Dicer酶存在的情况下。PTEN P1通过控制PTEN靶基因miR19b和miR20a从而发挥肿瘤抑制功能。PTEN P1是一个肿瘤抑制子,其拷贝数在所有结肠癌细胞中丢失。同样的研究显示,KRAS与KRAS P1有着类似的关系。最近两项研究对此进行了深入探讨,结果显示PTEN也会被编码ceRNAs所影响,包括黑色素瘤中的Zeb2转录子以及神经胶质瘤中的RB1。综上所述,对ceRNAs的研究使我们对lncRNAs作为转录后调节者所建立的信号网络有了更加深入的了解。在miRNA池中,探讨ceRNA大量出现而引起的变化将是一件非常有意义的事情。
发育。最新一项关于肌肉细胞分化的研究进一步证明了lncRNAs作为ceRNA的重要性。肌细胞分化被miRNAs所调控,而在一些疾病如心肌梗死以及杜氏肌营养不良(DMD)中,其miRNAs调控出现紊乱。LncRNA lincMD1在骨骼肌中表达,它具有miR133以及miR135作用的MREs。这两种miRNAs调节着涉及肌原分化以及肌细胞完整性的转录因子,包括MEF2C和MAML1。LincMD1的低表达能够导致系统中这两个肌原标记物的减少,相反,过表达能够增加其蛋白水平。虽然lincMD1的水平,就像MEF2C和MAML1的水平一样,在DMD中显著下降,但lincMD1的过表达能够恢复MEF2C和MAML1的合成。重要的是,ceRNAs在那些分化异常的组织如DMD中,其调节也是紊乱的。因此,恢复紊乱的ceRNA信号网络可能成为潜在的治疗方法。
#p#副标题#e#
未来展望
除了在此讨论的一些例子,最近RNA测序技术的进步使我们发现:在一些疾病如前列腺癌、肺癌、肝细胞癌中,有成千上万个lncRNAs表达升高。虽然我们对与疾病相关lncRNAs的识别远远快于对其机制方面的研究,但测序技术能够帮助我们减少这种差距。lncRNAs主要通过分子相互作用发挥调节功能,而如今的测序技术已经可以对lncRNAs的相互作用组进行高通量筛选。RNA免疫沉淀技术识别了成千上万种与PRC-2相关的顺式或反式lncRNAs,并且RNA-蛋白质相互作用的交联技术可能会成为提高检测蛋白质-RNA相互作用组的有效方法。这些方法是以蛋白为中心,而RNA纯化技术分离染色体是以RNA为中心, 通过交联技术能够将lncRNAs从染色体池中分离出来,从而得到相关的DNA序列和蛋白。对转录子组范围内RNA结构确认的技术提供了相关的补充信息,使得研究者将应答的结构域与RNA结构联系起来。总之,这些方法应该能够帮助我们识别与其他蛋白以及染色质相关的lncRNAs特异性结构域。或许不久就能够通过吗啉寡聚核苷酸特异性抑制lncRNAs的结构域,从而在模式生物如斑马鱼中看到这些相互作用的表型。这些研究或许可以帮助我们确认lncRNAs发挥作用是否是通过分子间的相互作用实现的。
对lncRNAs相互作用子的进一步确认以及后续的功能研究至少具有两方面的临床意义。一方面,lncRNAs可能作为临床治疗的靶点。虽然lncRNAs可能作为乳腺癌、肝癌、前列腺癌和肺癌的生物标记物,但如果它们出现异常时能够引起相关疾病或者罕见发育,那么它们就能够作为治疗靶点。反义核苷酸疗法能够降低毒性lncRNAs的过表达,如在视网膜中Alu的毒性。Xist是一种研究比较清楚的lncRNA,它能够导致一条X染色体的表观遗传学沉默。用siRNA对Xist进行干扰能够增加胚胎克隆的能力。除了它们在人类生殖技术中的潜力以外, lncRNAs的低表达还能够有效治疗那些因为其过表达而导致的疾病。
另一方面,lncRNAs也可以作为生物技术的工具从而指导临床应用。在基因调节网络中,对lncRNAs相互作用子的确证将会揭示大量基因之间的相互联系。鉴于表观遗传学在肿瘤发生、干细胞维持以及衰老方面的作用,用lncRNAs来调控染色质修饰将会是一件有趣并且可以实现的事情。能够将染色质重塑元件带到特异位点的lncRNAs,或许可以成为控制干细胞水平的一个有用工具,因为已有研究报道lncRNAs在维持干细胞的多能性以及促分化过程中发挥重要作用。此外,再生医学的一个挑战就是将年老的组织恢复到年轻的状态,而并不对胚胎或者其后天的发育分化进行重排。随着现代技术的发展,将能够对年老组织的遗传学特征进行改变从而使组织能够返老还童。合成的lncRNAs或许能够通过对遗传修饰的特殊位点进行重排从而为现代方法提供一种补充。
对lncRNAs发挥功能的分子机制进行更加深入的了解可以使得我们对疾病的诊断和治疗更加有利,如在干细胞疗法以及再生医学中。
(作者:贺利军、李秋实)
参考文献:《Journal of Clinical Investigation》2012;122:1589-1595