医学前沿
2019年06月号
现代观点

值得关注的五大生命科学技术

作者:白蕊

从高分辨率成像到从零开始合成DNA分子,这些生命科学技术将给我们带来惊喜。

显微镜分辨率的提高

超分辨显微技术在理论上获得证实仅有一二十年的时间,但今天这项技术对生物学家而言已经相当普遍,容易获得,这带来了知识的繁荣。

这项技术特别令人兴奋的一个研究领域是用于确定基因组的3D结构和组织排列。因为越来越多的证据表明,基因组的3D结构在调节基因表达方面扮演着重要角色。

哈佛大学化学和生化教授Xiaowei Zhuang(庄小威)看好这一技术。2018年,庄教授的团队对染色质进行了纳米级精度的成像,并将之与数千种不同类型细胞的序列信息关联了起来。这种空间分辨率比他们以前所做的成像高1~2个数量级(即10倍~100倍),能够观察到单个细胞里染色质组装成结构域的过程,让我们可以更好地理解染色质调节机制。

庄教授团队的实验所采用的分辨率大多在几十纳米,看似很小,但其实跟被成像的分子一比就没那么小了,这点在研究分子之间相互作用的时候尤其凸出。据庄教授预测,在超分辨成像领域,空间分辨率将迎来巨大改善,未来1纳米分辨率将成为常规。

与此同时,时间分辨率也在不断改善。目前,研究人员必须在空间分辨率和成像速度间折中、平衡,要想速度快,就无法要求很高的空间分辨率。但随着更好的成像方法、更快速的图像获得,这些限制将逐渐被克服。

成千上万的基因和各种分子共同塑造了细胞的行为,如果能够在基因尺度上同时看到运行中的这些分子,将为成像创造巨大的机会。

脑连接图谱

每个细胞之间以及不同类型的细胞间均存在着极其复杂的联系,因此,想要彻底理解的话,从整体上或群体上来描绘这种联系显然是不够的。于是,科学家们开始基于细胞类型,在单个细胞水平上描绘这种联系。美国华盛顿艾伦脑科学研究所的Hongkui Zeng(曾红葵)就是其中一员。
曾红葵的团队采用了“顺行”、“逆行”追踪来研究神经细胞上发出的特殊结构——轴突的投射,所谓顺行追踪就是从胞体到末梢,看胞体发出的投射到哪儿,逆行追踪正好相反,是从末梢到胞体,看末梢来自于哪儿。当然,他们还用了其他方法,以单个神经元的形态学为基础,看各个神经元投射的起止点。

美国霍华德•休斯医学研究院的研究人员正在绘制果蝇每个神经元和突触的图谱。

脑连接图谱研究离不开成像技术、样品处理技术,以及计算机技术的进步。艾伦脑科学研究所就正在机器学习算法的帮助下,准备构建小鼠大脑神经连接的虚拟图谱。

脑连接中蕴含着海量的特异性,如果不了解这种特异性,我们对人体行为、功能的理解就只能是基于“黑匣子”,因为我们缺乏生理学基础来理解神经元的活性和行为。以脑连接图谱为代表的“连接组学”将填补我们所缺失的基础信息。

合成基因组

如果人类能够从零开始构建出完整的基因组,那将为基因组功能带来全新的见解。

科研人员现在已经能够合成简单的细菌和酵母基因组,但对于更高级生物的完整基因组,尤其是哺乳动物基因组的合成目前仍面临技术挑战。
现在已经有技术可以降低DNA合成的费用,但还没有上市。目前,大多数的DNA合成采用的是亚磷酰胺化学法。这种化学合成DNA的方法发明于1987年,发明人是美国科罗拉多大学博尔德分校的马文•H•卡拉瑟斯(Marvin H. Caruthers)。亚磷酰胺法所利用的是DNA自身的化学性质:DNA由4种核苷酸组成,每种核苷酸中含有一个相应的碱基,分别是腺嘌呤(adenine,A)、胞嘧啶(cytosine,C)、鸟嘌呤(guanine,G)和胸腺嘧啶(thymine,T),它们之间的亲和力形成了A-T、G-C这样的配对组合。卡拉瑟斯所发明的方法是:以一个单核苷酸为合成起点,当有新加入的核苷酸,两者间就会形成化学键,随着核苷酸的不断加入,反应会一直进行,核苷酸链持续延长。但这种方法并不完美,因为其所产生的核苷酸聚合物无论从最大长度来说还是从精确度来说都很有限。

一些公司和实验室正在尝试另一种方法——酶促DNA合成,比化学合成法更准确、成本更低。然而市场上目前还没有公司提供这样的分子,好消息是,2018年一家名为DNA Script的法国公司声称他们已经合成出了150个碱基的寡核苷酸,几乎是DNA化学合成法能达到的极限了。

基因编辑迭代

如今,蛋白质工程对基因工程的驱动作用愈加明显。

第一代的CRISPR基因编辑系统使用的是核酸酶Cas9,这种酶能在特定位点切断DNA。CRISPR-Cas9被广泛采用,但新的CRISPR体系也在不断出现,它们用新的酶比如XCas9、SpCas9-NG取代了天然核酸酶。它们拓展了可被编辑的基因区域,有些还拥有比第一代酶更高的特异性,能够将降低甚至避免脱靶效应。

去年,研究人员报道了CRISPR基因组编辑技术的一些缺陷,正是这些阻碍了其临床应用。比如p53基因的活化,带来了癌症风险;“打靶效应”过度,引发大规模基因删除;CRISPR系统的免疫原性引发免疫攻击。基因组编辑要想走上临床,必须要先解决这些问题。有些问题是由DNA双链断裂引起的,但并不是所有基因编辑酶都会造成双链断裂,例如近两年新发展起来的基因编辑工具——碱基编辑器,它整合了碱基脱氨酶的活性和CRISPR的靶向性,催化特定位点的碱基发生脱氨基效应,将DNA上的碱基直接转换为另一个。与传统的基因编辑相比,碱基编辑更简洁、更高效。去年,瑞士研究人员用碱基编辑纠正了小鼠体内导致苯丙酮尿症的一种基因突变,避免了毒性蛋白的产生。

尽管有优点,但碱基编辑的缺点也很突出,比如它所编辑的序列受限于前间隔序列邻近基序(protospacer adjacent motif,PAM)。而蛋白质工程能够重新设计、改善现有的碱基编辑元件,甚至可能创造出新的编辑工具,例如将重组酶和失活的Cas9聚合起来。重组酶并不会诱导双链断裂,但能在使用者指定的区域插入想要的序列。RNA引导的重组酶必定会将基因编辑拓展到新的维度。

基因编辑技术要成为临床常规应用的手段还要等几年,但新一代编辑工具却可能在未来的一两年就能出现。新的问题仍会出现,但新的解决方案也一样。

AI和深度学习应用于生命科学

生命科学家们现在都成了利用深度学习软件以及人工智能来建立预测模型的高手,这些模型像魔法师手中的水晶球,能指引我们找到答案,比如到哪儿去找基因调节元素的结合域。而且我们的期望越来越高,现在我们渴望开发出能挖掘到更深层答案的模型,比如基因调节的细节、为什么有些遗传特征很重要。

今年我们可以期待的是计算方法变得更强大,强大到足以被用来处理海量的基因数据,而要想做到这点需要一种技术——迁移学习(transfer learning)。利用这种方法,可以先用与问题没什么相关性的数据集来学习问题特征,然后把算法所学到的用于分析你所关心的数据集。

在去年的一篇研究论文中,美国宾夕法尼亚大学佩雷尔曼医学院的助理教授Casey Greene等介绍了他们用迁移学习训练模型的经验。他们想要用抗中性粒细胞胞浆抗体相关性血管炎的数据训练模型,但由于这种病较为罕见,因此数据不够。所以,他们从其他1400多个研究中获取了RNA测序数据,用来训练模型,随后把训练好的模型用到了想要研究的这种罕见病中,由此揭示出了与该病免疫和代谢功能有关的基因网络。由此可见,迁移模型是可以挖掘出科学新知的。

Casey Greene希望,所有这些计算方法不要仅仅只是提供某个情境下的预测模型、或者某个问题的答案,而是要进一步去揭示生物学上正在发生的事情。

再过5年,那时的生命科学领域在AI和深度学习的渗透下将大变样。(编译:白蕊)

参考文献:Nature 2019;565:521-523

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5