医学进展
2019年08月号

把大脑活动翻译成语言

作者:李伟

最近,加州大学旧金山分校的研究人员在《自然》杂志上撰文,描述了一个系统,该系统通过记录说话或模仿说话时的大脑活动来合成可理解的语言。研究人员说,虽然他们的研究对象是没有语言障碍的人,但这项技术可以作为垫脚石,帮助脑卒中、肌萎缩侧索硬化症或其他妨碍说话的神经障碍患者恢复沟通。

研究人员使用高密度的颅内电极阵列,记录了加州大学旧金山分校癫痫中心的5名志愿者在说话过程中控制唇、舌头、喉和下颌运动的大脑区域的神经活动模式。人工神经网络将这些模式转换成参试者声道运动的计算机模拟,然后解码生成合成语音。

另一组志愿者从包含目标词和随机词的25或50个单词中进行选择,转录出合成的句子。拼出的句子中,错误率中位值在短句中为31%,长句中为53%。该系统还能够把没发声只有口型的句子合成出来,尽管模仿的表现较差,但这表明“解码语音的重要频谱特征是可能的,而这些特征是不出声的、听不到的”,作者写道。

这项概念验证工作是脑-机接口这一广泛领域的一部分,旨在恢复瘫痪患者的沟通和运动。这些令人信服的概念验证证明了不能说话的个体也能实现语音合成,结合脑机接口在上肢瘫痪患者中的快速进展,研究人员认为应该大力考虑对言语障碍患者的临床研究。随着不断的进步,希望更多有语言障碍的人能够重新获得自由表达思想的能力,并重新与周围的世界连接起来。有理由相信,随着人类对语言活动神经机制的深入理解、脑电信号采集精度的不断提升,以及信号处理技术的蓬勃发展,连接想象语言与合成语音的桥梁在可预见的将来会成为现实。(编译:李伟) 

参考文献:Nature 2019;568:493-498

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5