医学进展
2016年12月号
医学进展

大规模的蛋白编码基因变异分析意义重大

作者:马驰

美国麻省总医院的Monkol Lek 对人类外显子组整合数据库(Exome Aggregation Consortium,ExAc)开展了一项深度分析并提供了最全面的基因变异记录, 有助于从临床中发现与人类疾病相关的基因变异。
这项发表在《自然》杂志上的研究分析了全球基因变异模式,达到了此前无法实现的分析规模,意义重大。
近5年,高通量DNA测序技术的大范围应用已经可以对人类基因组或成千上万的外显子进行测序。理论上,这些数据所呈现的全球人类基因变异模式是非常重要的信息资源,但是事实上,由于操作和伦理等原因而难以获得。目前能公开获得的人类DNA序列变异数据仅是所有测序样本的一小部分。基因变异数据库对研究人员了解人类历史和生物学是非常重要的。
美国麻省理工等多个研究中心的研究人员分析了来自6万余名被测序者的外显子组测序数据。该项目被称为人类外显子组整合数据库(ExAC)项目。这些被测序者来自于不同地区的人口系谱,包括欧洲、非洲、南亚、东亚和拉美人口。在外显子组整合数据库(ExAC)中研究人员确认了近1020万个候选序列变异,最终明确了近740万个高质量变异,包括近31万个插入或缺失。在外显子平均每八个碱基对就会出现一个变异。蛋白质编码序列变异的密度揭示了很多人类基因变异的特性,这些人类基因变异在小规模数据集中是无法发现的。例如有7.9%的高质量位点是多重变异的,即在同一个位点存在多重不同的序列变异。ExAC项目的规模让直接观察频发突变成为可能,即同一突变独立发生在多个时间。研究人员用人类遗传多样性目录来计算序列变异致病的客观指标;确认基因经过了多类突变的强选择;确认了3230个基因几近完全缺失蛋白质截短变异,其中72%的基因尚未建立人类疾病基因型。最后研究人员证明这些数据可以用于有效筛选候选疾病的致病变异,也可用于发现人类蛋白编码基因的敲除变异。 (作者:马驰)
参考文献:Nature 2016;536:285-297

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5