历史上的今天
返回首页

历史上的今天

今天是:2025年01月14日(星期二)

正在发生

2019年01月14日 | AI读心术: 计算机如何还原脑电波?

2019-01-14 来源:亿欧网

“我的身体沉重如潜水钟,内心却渴望像蝴蝶般自由飞翔。”

这句来自电影《潜水钟与蝴蝶》的台词,也是前《ELLE》杂志主编、记者让·多米尼克的真实经历。

让·多米尼克中风瘫痪后,身体的语言和运动功能都丧失了,他不能说话,不能自主呼吸,只剩下一只眼睛和意识可以自由活动。在这种情况下,他还是“写”出了一部散文集。

书是这样完成的:助手把一个个字母依次念给让·多米尼克,直到他眨一下眼,就把那个字母记下来……如此循环进行,直到字母形成单词、句子、片段,最终付梓成册。

显然,这个还原思维的过程十分艰辛且原始,但至少给他的灵魂留下了一丝自由遨游的可能。

而对于更多缺乏发声能力的普通人(比如中风患者、植物人等)来说,无法与正常人交流的他们,生命已然停滞。

技术能帮助他们“言其所不能言”,提高生活质量吗?

答案是肯定的。科学家们正试图让看不见摸不着的思维活动自动“显形”。

通过计算机,将大脑中的所思所想转换成语音说出来,这种“读心术”距离现实究竟还有多远?

《潜水钟与蝴蝶》(2007)剧照

AI读心术:计算机是如何还原脑电波的?

先来泼一盆冷水,那就是想要将人想象中的单词和句子转换成语音,目前的计算机还做不到如此鬼斧神工的地步。

不过,已经有研究人员成功利用AI复原了人听到或超小声说话时的句子。

技术的实现原理也并不复杂。人类的发声运动是靠大脑神经元电信号刺激下颌、嘴唇、声带等部位形成的。

因此,只要将相关脑区的神经运动信号输送给AI系统,深度学习网络就会根据信号与相对应的语言文字或嘴部运动进行层层匹配,推断出具体说了什么,再由语音合成器将这些信号转换成能被听到的语音。

那么,这项技术的靠谱程度如何呢?

哥伦比亚大学计算机科学家Nima Mesgarani做了一项实验,让听众“收听”一组与故事和数字有关的听觉皮层数据,有75%的人能够正确识别出该数字。

类似的实验在加州大学旧金山分校的研究组也成功了。癫痫患者大声朗读句子时的大脑活动被记录下来,借助深度学习网络重建为书面语句。结果显示,AI重现的句子有80%都是正确的。

既然神经信号转译为书面语言被证明是可行的,下一步就是要走出实验室,真正帮助失声人群“说出心里话”了。

麻省理工学院的研发人员就开发了一种植入型智能增强设备,由可穿戴装置和相关计算系统构成。

设备中的电极可以截取由内部语言所触发的下颌和面部肌肉运动信号,被反馈到机器学习系统,再由该系统将神经信号与特定的文字相关联。

使用者还可以通过骨传导耳机,在不中端对话的前提下通过面部振动,将外部信息传递到内耳。

目前,根据听众自身定制的这种可穿戴设备,平均转录识别准确率已经达到92%以上!

如果说前面还属于辅助医疗范畴,到这里就有点开挂的苗头了。比如在国际象棋比赛中,选手要是戴上这样一副耳机,不就可以不被察觉地“听”到计算机给支招吗?

麻省理工学院媒体实验室Fluid Interfaces小组的研究员Arnav Kapur演示了AlterEgo项目

会“读心”的脑机:脑脑交流能成为现实吗?

利用AI读懂脑电波,这个技术不仅仅看起来很酷,更重要的是应用空间非常巨大。

从理论层面上来说,可以不依赖于生物发声器官来实现交流的目的,这就给医疗、工业、刑侦等领域的带来了新的交互可能性。比如:

1。为失声患者提供声音。人类一旦不幸遇到中风、脑外伤、脊髓损伤或ASL运动神经细胞病(史蒂芬霍金就是ASL患者),大脑无法直接刺激言语产生,患者只能在沉默中走向死亡。如果未来大脑语音合成器被应用,帮助失声患者找回语言功能,对于他们的治疗和生活将起到极大帮助。

2。特殊环境的工作协助。并不是所有工作环境都能保障正常分贝下的语言交流,比如飞机场内的喷射噪音、航空母舰的驾驶舱、发电厂或印刷厂车间,以及穿着防护装备的实验室等等,不是过分嘈杂就是过分沉默,很容易错过关键信息。这种特殊环境中,大脑语音转录技术就能够有效解决交流不畅的问题,聋哑残疾员工也可以与他人无障碍交流。

3。从重建听觉到重建视觉。除了转录文本和语音,类似的AI神经网络还可以被训练来恢复模糊的图像,比如还原记忆中的面孔,应用在刑侦破案有奇效。

4。用思维操作假肢。佩戴上语音转录设备之后,截肢/截瘫患者只需要通过思考,就能自由控制假肢设备,这显然比让他们下达语音指令容易接受多了。

5。高度自动化的智能助理。这种BCI设备的更大作用,在于可以根据人们内心的想法直接完成多种任务,比如控制灯光、做阅读笔记、下达VR游戏指令,甚至可以用来控制车辆。

日产汽车已经推出了类似的耳机,来监控司机的脑电波。例如,一旦检测到司机打算踩刹车,设备会在司机做出刹车动作之前就开始刹车,反应时间比人工操作快了多达半秒。甚至Facebook也推出了一个读心术项目,研究让用户如何用脑电波发送Facebook Messenger信息。

总而言之,这个极具想象力的技术,解决了一个长久以来的难题:如何化无形的意识为有形的信号,让人类可以从身体这个“潜水钟”的重重限制中透口气。

不过实事求是的说,尽管技术正在慢慢走向成熟,但华美的理想要照进现实,还有很长一段路要走。

不能停歇的科技之翼

尽管学界和商业界都对这个“读心术”趋之若鹜,但在实际应用中,这种语言转录的脑机接口还有很多隐患需要一一解决。

1。植入难度过大。技术推广最直接的障碍就是,为了获取精确的实验数据,受试者必须通过开颅手术将电极植入大脑中的相关区域。侵入式的解决方案大大缩小了参与实验的积极性,在实际应用中也会给植入者带来排异、感染等不可预测的风险。

2。词汇数据量不足。脑电波-语音的转录效果依赖于大规模的词汇表,但每个参与者对同一语言到神经元的映射都各有不同,因此AI系统学习和推断到的结果很难被通用。只能为不同的参与者特别定制属独属于他们的思维语料库,才能保证转录的准确性,难以大规模普及。

3。商业化难题。设备的植入难度与系统的定制化所带来的大量门槛,决定了它只能在极为小众的应用群体中发挥价值,比如少部分重症患者和一些狂热极客。

4。伦理困境。即使补全了设备和系统的缺陷,想必也很少有人愿意在公众场合戴上这样一套设备,而别人也很难不觉得被冒犯。

这有点像Googleglass刚问世的时候,只有设备,却没有形成相对应的行为规范,导致很多人担心和质疑其侵犯隐私。同样的,脑电波“读心术”是否会带来隐私或另一种不公平呢,恐怕还需要大量的社会学研究来支撑。

总而言之,尽管“AI读心术”很容易就让人感受到它的社会价值和商业潜力,但应用度上显然还存在不少问题,想要靠脑交流,少说还有几十年的路要走。

它带给我们更多的,可能是作为一种高度可行性的解题思路,如果人类的肉身注定要像潜水钟一样缓慢地沉入深海,至少可以让“思维”这只蝴蝶,多拥有一刻自由。

推荐阅读

史海拾趣

Akahane Electronics Ind Corp公司的发展小趣事

Akahane深知人才是企业发展的核心动力。因此,公司一直注重人才培养和引进。通过建立健全的培训机制和激励机制,Akahane吸引了一批批优秀的研发人才和管理人才。这些人才为公司的技术创新和市场拓展提供了有力支撑。同时,公司还积极与高校和研究机构合作,共同培养电子行业的后备力量。

Fischer Elektronik公司的发展小趣事

在追求业务增长的同时,Fischer Elektronik也始终关注可持续发展和环保问题。公司积极采用环保材料和生产工艺,努力减少对环境的影响。此外,Fischer Elektronik还致力于推动绿色能源的应用,通过研发高效节能的产品,帮助客户降低能耗和减少碳排放。这种负责任的企业形象,不仅提升了公司的社会声誉,也为其在未来的发展中赢得了更多的支持和机遇。

Afero公司的发展小趣事

随着Afero物联网平台的逐渐成熟,公司开始积极寻求与各行各业的合作伙伴建立合作关系。他们与多家知名的电子设备制造商、软件开发商和服务提供商签订了战略合作协议,共同开发基于Afero平台的物联网解决方案。这些合作不仅帮助Afero拓展了业务领域,还提升了其在行业内的知名度和影响力。

Changzhou Galaxy Century Microelectronics Co.,Ltd公司的发展小趣事

在发展过程中,银河微电积极寻求与行业内外的合作伙伴建立战略合作关系。通过与晶通半导体(深圳)有限公司等企业的合作,银河微电在技术研发、市场拓展等方面取得了显著成效。这些战略合作不仅提升了公司的综合实力,还为公司的未来发展奠定了坚实的基础。

DAYA公司的发展小趣事

在快速变化的电子市场中,大雅智能始终保持敏锐的市场洞察力。通过深入研究市场需求和消费者行为,大雅智能准确把握市场趋势,及时调整产品策略。例如,在智能家居市场兴起之际,大雅智能迅速推出了一系列智能家居产品,成功抢占了市场先机。这种对市场趋势的敏锐洞察和快速响应能力,让大雅智能在电子行业中不断取得新的突破。

Cree(科瑞)公司的发展小趣事

2015年初,Cree曾计划将其射频产品线独立出来,并以近3.5亿美金卖给英飞凌。然而,由于某些限制原因,收购计划最终终止。面对这一变故,Cree不得不重新建立射频微波器件团队,并创立了新的品牌wolfspeed。这一举措不仅彰显了Cree的应变能力和创新精神,也为其在射频领域的发展注入了新的活力。

问答坊 | AI 解惑

有谁认识熟”红外框”(触摸屏)的电子工程师

招聘熟”红外框”(触摸屏)的电子工程师 我公司想招一个电子工程师,要求:对”红外手写” (也叫触摸屏)非常熟悉的,专职和兼职都可以.工作地点:杭州.(也可在深圳),薪金优 ,有意者可联系我,或把简历发至公司邮箱:bearbear-bear@163.com电话:0755-82132 ...…

查看全部问答>

[笔记].Nios II 软核性能基准.[Nios II]

一些表格 表1 Nios II处理器系统的最大时钟频率(tMAX)(MHz)     表2 Nios II处理器系统的MIPS(每秒钟一百万个指令)       表3 在不同设备家族上的Nios II处理器系统的MIPS/MHz比     表4 Ni ...…

查看全部问答>

如何在wince5.0拔GPRS,打电话,发送接收短信

最近一家公司要求我把我原来在MOBILE的程序移植到他们的设备上,现主要是这三个方面不大清楚怎么移植,没做过wince5.0,不知是否要向他们要除了设备之外的材料?怎么实现…

查看全部问答>

TMS320F240用哪个软件烧写?

知道的说下,找了好长时间了,有的说是CC4.1,有的又说不是,到底哪个软件可以呢 先谢…

查看全部问答>

【MSP430共享】基于蓝牙的高压线电流自动化检测系统设计

在高压危险场所,为提高操作人员的人身安全,使用隔空测量数据是非常需要的,因此采用蓝牙通信系统实现了对远离危险场所进行测量和记录所需数据。本系统使用超低功耗性能优秀的MSP430系列单片机作为核心控制器件,由蓝牙PDA接收信号并对其进行相应 ...…

查看全部问答>

原来ARM7上的ucosii系统要移植到cortex-m3的板子上,求指教

现在主要问题是这个系统原来跑在ARM7的平台上,现在因为某些原因要转移到STM32的平台上。   新的开发平台有现成的ucosii系统+UCGUI,我应该不用再移植了吧, 但是 原来系统里的控制任务要移植过来,不知道一般是怎么移植的,大家都是直接移 ...…

查看全部问答>

陶瓷贴片电容知识

通常大家所说的贴片电容是指片式多层陶瓷电容 (Multilayer Ceramic Capacitors),简称MLCC。它是在若干片陶瓷薄膜坯上被覆以电极桨材料,叠合后一次烧结成一块不可分割的整体,外面再用树脂包封而成的。具有 小体积、大容量、Q值高、高可靠和耐高温 ...…

查看全部问答>

EK-LM4F120 launchpad 之软件安装

我的CCS5是在官网下的就是速度慢     这个是在一个论坛里找到的           http://pan.baidu.com/s/1orfAu     主要这几个选项            剩下的默认就 ...…

查看全部问答>

蓝牙无线传输UUID

怎么通过UUID获取蓝牙传输相应的数据包…

查看全部问答>

MSP430G2553串口问题求助

在编写串口程序之前,小红板子上的32768hz的晶振要不要焊接。…

查看全部问答>