杜克大学的一个研究小组发明了一种语言假肢,可以将大脑信号转化为语言,帮助患有神经系统疾病的人。虽然仍然比自然语言慢,但在先进的大脑传感器和正在进行的研究的支持下,这项技术显示出增强沟通能力的巨大潜力。(艺术家概念图)来源:sciitechdaily.com
来自杜克大学的神经科学家、神经外科医生和工程师团队开发了一种语音假肢,可以将大脑信号转换为口语。
最近发表在《自然通讯》(Nature Communications)杂志上的一篇论文详细介绍了这项新技术,它为患有语言障碍的神经系统疾病的患者带来了希望,有可能使他们通过脑机接口进行交流。
解决神经系统疾病中的沟通挑战
杜克大学医学院神经学教授格雷戈里·科根博士是该项目的主要研究人员之一,他说:“有许多患者患有使人衰弱的运动障碍,比如肌萎缩性侧索硬化症(ALS)或闭锁综合征,这些疾病会损害他们的说话能力。”“但目前可供他们交流的工具通常非常缓慢和繁琐。”
一个比邮票还小的装置(白色带内的虚线部分)包含128个微型传感器,可以将脑细胞活动转化为某人想说的话。资料来源:Dan Vahaba/杜克大学
想象一下,用半速听有声书。这是目前可用的最佳语音解码速率,每分钟可解码约78个单词。然而,人每分钟大约说150个单词。
说话速率和解码速率之间的滞后部分是由于相对较少的大脑活动传感器,这些传感器可以融合到大脑表面上薄薄的一块材料上。较少的传感器提供较少的可解码信息。
增强脑信号解码
为了改进过去的局限性,科根与杜克大学脑科学研究所的教授乔纳森·维文蒂博士合作,他的生物医学工程实验室专门制造高密度、超薄和柔性的大脑传感器。
与目前有128个电极的语音假肢(左)相比,杜克大学的工程师们开发了一种新设备,它可以在更小的占地面积上容纳两倍的传感器。资料来源:Dan Vahaba/杜克大学
在这个项目中,Viventi和他的团队将256个令人印象深刻的微型大脑传感器装在一张邮票大小的柔性医用级塑料上。只有一粒沙子的神经元在协调语言时可能有截然不同的活动模式,因此有必要区分来自邻近脑细胞的信号,以帮助准确预测预期的语言。
临床试验和未来发展
在制造出新的植入物后,Cogan和Viventi与杜克大学医院的几位神经外科医生合作,包括Derek Southwell医学博士、Nandan Lad医学博士和Allan Friedman医学博士,他们帮助招募了四名患者来测试植入物。该实验要求研究人员将该装置暂时放置在因其他疾病(如治疗帕金森病或切除肿瘤)而接受脑部手术的患者身上。科根和他的团队在手术室里测试他们的设备的时间有限。
“我喜欢把它比作纳斯卡的维修队,”科根说。“我们不想在手术过程中增加任何额外的时间,所以我们必须在15分钟内进出。当外科医生和医疗小组说“开始!”’我们立即采取行动,病人完成了任务。”
这项任务是一个简单的听和重复活动。参与者听到一系列无意义的单词,如“ava”、“kug”或“vip”,然后大声说出每个单词。该设备记录了每个病人的语言运动皮层的活动,因为它协调了近100块运动嘴唇、舌头、下巴和喉部的肌肉。
随后,这篇新报告的第一作者、杜克大学生物医学工程研究生Suseendrakumar Duraivel从手术室中提取了神经和语音数据,并将其输入机器学习算法,看看它能多准确地根据大脑活动记录预测发出的声音。
在实验室里,杜克大学博士候选人库马尔·杜拉伊维尔(Kumar Duraivel)分析了一系列丰富多彩的脑电波数据。每一种独特的色调和线条都代表了256个传感器中的一个的活动,这些传感器都是在手术室里从病人的大脑实时记录下来的。资料来源:Dan Vahaba/杜克大学
对于一些声音和参与者,比如单词“gak”中的/g/,当它是组成一个给定无意义单词的三个字符串中的第一个声音时,解码器的正确率为84%。
然而,当解码器解析出一个无意义单词的中间或结尾的声音时,准确率下降了。如果两个音相似,比如/p/和/b/,它也会遇到困难。
总的来说,解码器的准确率为40%。这似乎是一个不起眼的测试分数,但考虑到类似的脑转语音技术需要数小时或数天的数据来提取,这是相当令人印象深刻的。然而,Duraivel使用的语音解码算法只能处理15分钟测试中90秒的语音数据。
Duraivel和他的导师们对利用美国国立卫生研究院(National Institutes of Health)最近提供的240万美元资金制造出一种无绳版本的设备感到兴奋。
“我们现在正在开发同样的录音设备,但没有任何电线,”科根说。“你可以四处走动,而不必被绑在电源插座上,这真的很令人兴奋。”
虽然他们的工作令人鼓舞,但要想让维文蒂和科根的语音假肢很快上市,还有很长的路要走。
维文蒂最近在《杜克杂志》(Duke Magazine)上发表了一篇关于这项技术的文章,他说:“我们现在所处的位置仍然比自然语音慢得多,但你可以看到,你可能会到达那里的轨迹。”
参考文献:“高分辨率神经记录提高语音解码的准确性”,作者:Suseendrakumar Duraivel、Shervin Rahimpour、Chia-Han Chiang、Michael Trumpis、Charles Wang、Katrina Barth、Stephen C. Harward、Shivanand P. Lad、Allan H. Friedman、Derek G. Southwell、Saurabh R. Sinha、Jonathan Viventi和Gregory B. Cogan, 2023年11月6日,Nature Communications。DOI: 10.1038 / s41467 - 023 - 42555 - 1
这项工作得到了美国国立卫生研究院(R01DC019498, UL1TR002553),国防部(w81xwh21 -0538), Klingenstein-Simons基金会和杜克大学脑科学研究所孵化器奖的资助。
分享
推特
电子邮件
分享
以前的文章
更多关于sciitechdaily
健康
生物学
技术
生物学
健康
健康
科学
健康