Belbin等提出了一种新的方法,用于对遗传祖先进行精细绘制,将生物样本库中的人群按祖先亚群进行分类,并展示如何将其应用于推进生物医学研究和精准医学。
长期以来,在生物医学研究中,种族和民族(race and ethnicity, R/E)以及遗传祖先一直被混为一谈。用R/E代替遗传祖先,将生物风险与来自环境、经济状况、其他社会经济因素和种族主义的风险混为一谈,从而阻碍了精准医学的发展。因此,与基因组数据库和电子健康记录(electronic health records, EHR)相连接的大型机构生物样本库(biobanks)的出现,有望将社会和文化因素从祖先中分离出来。发表在《细胞》杂志的一篇文章中,西奈山伊坎医学院基因组健康研究所的Gillian M.Belbin等开始利用精细遗传祖先图谱来研究疾病风险。
Belbin等提出了一种新的方法,用于对遗传祖先进行精细绘制,将生物样本库中的人群按祖先亚群进行分类,并展示如何将其应用于推进生物医学研究和精准医学。在此过程中,研究人员表明使用R/E作为遗传学研究的局限性,并揭示美国纽约市之前未被认可的创始人群体(founder populations)的存在。他们还发现了次大陆人群中多基因风险评分(polygenic risk score, PRS)的表现不平等。
研究使用了两个R/E数据源:在BioMe生物样本库注册期间提供的数据和临床中报告的数据。作者发现这两个来源本身只有65%~72%的一致性。更值得注意的是,他们还发现报告相同R/E的患者的遗传祖先存在高度差异;这种差异在那些自认为是西班牙裔/拉丁裔的人群中最为极端。
精细祖先图谱绘制方法结合了无血缘关系的人群中具有相同血统(identical by descent, IBD)的成对共享遗传区域,并结合网络分析来识别集群。使用这种方法新发现了17个不同群体,涵盖了96%的生物样本库成员。总的来说,该研究证实,使用共享IBD遗传区域比当前最佳做法更能识别最近的遗传祖先。此外,使用共享IBD遗传区域来识别遗传祖先群的策略是一种创新的、新颖的方法学,对于其他希望重复这种分析的生物样本库将是有用的。
这项研究的一个特别有趣的发现是识别了以前未发现的创始人群体。正如预期的那样,IBD群体检测方法能够识别生物样本库中存在的德系犹太人(Ashkenazi Jewish, AJ)和芬兰(Finnish)创始人群体。然而,有证据表明,在拉丁美洲还有5个祖先不同的创始人群体。随着这些创始人群体的确定,可能会对疾病风险评估和医疗决策产生影响。
鉴于发现这些创始人群体,自我报告R/E数据的局限性对生物医学和精准医学提出了挑战。例如,每40名AJ女性中就有1名携带BRCA1或BRCA2突变,这显著增加了她们一生患乳腺癌的风险,临床实践指南强烈建议对这一人群进行筛查。然而,Belbin等在AJ创始人群体中发现的946名患者中,只有不到37%的人自认为是犹太人,这可能导致该群体的筛查率比指南建议的要低得多。
电子健康记录已成为生物医学研究的重要资源,但在实际应用方面有挑战。电子健康记录是零散的患者护理记录,受医疗流程的影响很大,并且表现了医疗实践中的偏见。Belbin等利用这些数据进行了一项全表型(phenome-wide)研究,研究了7个已确定的群体与1 764个表型中存在的诊断收费代码之间的关联。很大一部分(24%)疾病与这些群体有关。未来有机会将这些祖先绘制工具与电子健康记录捕获的数据更深入、更系统地结合起来,围绕创始人群体的临床效应和医疗实践差异的量化提出新的假设。
与多基因风险评分(polygenic risk score,PRS)相关的紧要问题是这些分数如何按血统分层。PRS是一种准确而稳健地量化疾病风险的复合模型。尽管PRS越来越普及,但人们担心其在不同祖先群体中的应用,以及它们可能会加剧医疗差距。
Belbin等通过对欧洲人群中的PRS进行评估,将其分为AJ和非AJ亚群,补充了这一证据体系。所有5种PRS模型在亚组间的得分均存在显著差异,这些观察结果与疾病的临床记录一致。
精准医学进入临床和遗传祖先的知识将有助于临床决策,有多种伦理因素需要考虑,包括代表患者确认遗传祖先的同意书,并将结果返回给患者。这项工作是将生物临床指标从社会和文化临床指标中分离出来的第一步,最终将带来符合伦理的患者护理。
参考文献:Nicholas P. Tatonetti and Noémie Elhadad. Fine-scale genetic ancestry as a potential new tool for precision medicine[J]. Nature Genetics,2021,27:1152-1153.