医学前沿
2019年08月号

人工智能在心电图中的应用

作者:贾盛崧

人工智能(artificial intelligence,AI)通过其在计算机算法基础上的优化过程和决策的能力,有望彻底改变社会的诸多方面。医疗创新是AI应用的重要领域,将给社会经济带来巨大影响。在过去15年里,有两项重大进展为AI在医疗创新的蓬勃发展奠定了基础。首先,数据库和电子健康记录已经开始系统地收集大量患者和健康人群的综合数字化医疗数据。其次,由于硬件的改进,特别是图形处理单元的改进,已经可以使用基于高性能计算和云计算的强大计算平台。

机器学习是AI的一个领域,它基于计算统计算法,允许计算机直接从数据中学习,而无需明确编程。因此,机器学习技术具有自动识别患者数据关键特征(即疾病与健康的最重要区别)的潜力。机器学习在医疗卫生领域的应用前景非常广阔,包括筛查、疾病检测和分类、患者风险分层和最佳治疗方案选择。最近,两项研究证明了机器学习在心脏病学领域的应用潜力。这两项研究都描述了深度学习算法在心电图(electrocardiograms,ECGs)大数据集中的应用,ECG是临床应用最广泛、可能也是最简单的记录,这两项研究表明机器学习可以用于识别心律异常和机械功能障碍。

深度学习是机器学习的一种,它的出现受大脑连接和工作方式的启发,它基于算法,或者说模型,由排列在网络布局中的相互连接的节点(被称为神经元)组成。深度学习网络中的神经元随着数据输入而被激活,这些输入在最近这两项研究中是ECGs。它们的激活在网络中传播,通过“经验学习”的过程,训练学习输入和输出数据(如患者或节律分类)之间关系的能力。一旦神经网络完成训练,它将在一个不用于训练的独立数据集中评估其性能,并计算敏感性、特异性和准确性等统计学指标。

在近期的其中一项研究中,Hannun等人在53877例患者的91232次单导联动态心电图大数据集基础上建立了深度神经网络,试图对心律进行分类。研究者的目的是从心电图数据中识别出12类心律。该算法在识别个体的心律类别方面表现极其优异。作者使用接受者操作特征曲线下面积(area under the receiver operating characteristic curve, AUC)来评估结果的准确性,完美心律分类为1,随机心律分类为0.5, 结果令人惊讶的是每类心律的AUC都超过0.91。该算法优于所有用肉眼分类的心脏病专家。

随着可穿戴设备的出现,心律的自动检测变得越来越普遍。可穿戴设备可以进行连续的个人监测,由此需要对心电信号进行给力、快速、实时的分析,以避免存储大量数据。比如搭载在智能手机上的APP软件,已经有软件基于机器学习来从ECG中发现房颤的发生。但这些技术同时也带来了技术、伦理和临床挑战。

心律分类以前也是机器学习研究的重点,此前研究用到的技术包括线性和二次判别法、支持向量机、随机森林和神经网络。这些研究大多依赖于从心电图提取出的特征(这些特征能够对不同的心跳类型进行分类),同时也依赖于特征选择等技术,以此来获得更好的性能。而Hannun等所用到的深度学习方法的一个明显优势是,不需要提取心电图特征,因为这些特征是作为算法训练的一部分从数据中学习的。而且,即使我们假设以前的研究在心律分类方面的准确性与Hannun等人的研究相当,但这些以前的研究使用的数据集都比较小、心律种类也少。只有少数研究像Hannun等一样尝试使用深度学习来对ECG进行分类。例如,在一项研究中,使用MIT-BIH心律失常数据库对算法进行训练和测试时,室性室上性异位搏动的平均检测准确率超过97%,但这组数据仅来自47个不同的个体。

近期的另一项研究是Attia等人开展的,研究旨在使用卷积神经网络这种深度学习方法来识别出左心室收缩功能受损的患者[射血分数(ejection fraction, EF)<35%,用来评价心脏每次收缩时泵出的血量],研究数据来自大型12导联ECG数据库。作者希望利用心电图作为一种廉价且广泛使用的检测手段来识别无症状左室功能障碍的患者,这种疾病很常见,诊断后是可以治疗的。研究人员从44959名患者中获得了12导联ECG和超声心动图来训练该网络,然后再用52870多名患者的数据对其进行测试。结果显示,根据心电图数据诊断心脏机械功能障碍的AUC为0.93,与当前的血液检测B型钠尿肽(AUC为0.79~0.89)相比有明显改善。然而,算法将1335名患者归为心脏泵血功能异常,但实际上他们的EF是正常的。作者认为,这些假阳性可能代表了早期发现异常,但在这些患者中,EF异常的5年发生率仅为9.5%。

这两项研究表明,深度学习算法是一种强大而准确的患者筛选工具,展示了利用基于人口的信息改善患者分层的潜力。目前机器学习一个广为人知的局限是,其结果背后的原理较为复杂难懂。算法无法解释分类结果的病理生理基础,因为它们无法揭示输入的数据和分类结果之间的依赖关系。为此,心脏病学家通常使用众所周知的心电特性信息,如QRS波宽度、QT间期或T波形态,因为这些直接与心脏的收缩和舒张有关,并已经过基于人的计算模型和模拟研究。然而,ECG生物标志物的提取需要对ECG的描述,也就是说尽管深度学习的尝试正在展示出潜力,但目前专家系统仍是从ECG波形中识别关键点的最佳技术。与深度学习用于图像识别领域的成功相比,深度学习用于ECG仍然是一个挑战。因此,深度学习分析的一个局限性是,无法从其所分析的大数据集中自动生成可靠的、具有生理意义的关键ECG生物标记物。

与其他深度学习的应用一样,心电图分析的主要挑战不一定是计算上的,而是有没有注释了必要信息的数字化大型数据集。专家对注释取得共识也是关键,因为不同心脏病学家之间的注释往往不同。除了计算科学家和临床医生之间的合作外,免费数据库的可获得性也是人工智能和数据科学在医疗创新方面取得进展的重要催化剂。

(编译:贾盛崧)

参考文献:Nature Medicine 2019;25:20-23

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5