脑机接口最近很火。这要拜科技狂人马斯克入局所赐,当然 Facebook 的参加也让这把火越烧越旺。
学术界有不少发展。《天然-通讯》在 7 月 30 日宣布了来自加州大学旧金山分校神经外科教授 Edward Chang 的研讨成果,他们完成了实时地解码大脑信号,将“听到”和“说出”的对话转变成言语文字,而且精确率可达 76% 和 61%。
比较马斯克的高调,Edward Chang 这个研讨是可以落地的。他们的战略是,当受试者履行“听到”和“说出”使命时,研讨人员经过从高密度皮层脑电图阵列记载神经活动(掩盖听觉和感觉运动皮质区域),然后解码这些大脑信号的内容。
至此想必许多人会有疑问:大脑言语信号解码研讨的实际含义有多大?言语信号解码能完成到什么程度?脑机革新要来了吗?科幻片里的认识沟通会完成吗?本文期望讨论这些问题。
言语解码的一大步
图 | 大脑的言语功用区、嘴唇运动操控区和听觉皮层是 Edward Chang 研讨的要点。Broca 失语症患者会发生言语表达缺点,但其了解才干相对正常,而 Wernicke 失语症患者言语表达很流通但了解却很差,他会表达出明晰的言辞但却无含义。Broca 失语症的脑损伤部位是额叶运动联合皮层,而 Wernicke 失语症的脑损伤部位在颞叶后部。有观点称,Broca 区就在操控嘴巴、唇运动的皮层邻近。(来历:神经科学——探究脑,高等教育出版社,2004)
Edward Chang 这项研讨有一些不得不说的细节。在本年 4 月 Edward Chang 宣布的《天然》研讨中,使用神经信号与人声道咬合部位运动的映射联系进行解码,也便是使用操控嘴唇、舌头、喉部和下颌运动的神经信号来组成语音,这是一个比较共同的解码途径。
这好像可以类比以视觉信号替代听觉信号的读唇术。不过多位学者以为,假如用人工智能来练习读唇术的话,其精确率比解码脑电信号要精确得多,究竟前者是确认的视觉信号,而人在说话时的脑电信号有太多不知道和不确认,究竟人工智能更拿手以确认的数据来核算出成果。
关于听觉脑电信号的解码,Edward Chang 则是使用植入于大脑皮层的电极实时获取大脑皮层活动信号,这现已与声道部位的咬合无关,而是直接解码人听到言语后发生的脑电信号。
这本来是无比杂乱的研讨,Edward Chang 将这个研讨简化了许多。他只是对触及4组简略问答的脑电信号进行了解码。受试者得到的信号都是相对简略的,比方问“你最喜爱哪种乐器”“你最不喜爱哪种乐器”“从 0 到 10,你的美好指数有多少”“你期望我多久来看你”等。正是这些简略问题的练习,让研讨者得到了相对简单判别的信号。
这仍是一项了不得的前进。华南师范大学脑科学与恢复医学研讨院教授翁旭初点评说,这项语音解码研讨在神经科学上的打破并不大,但在临床上的含义更大。由于使用了更大都目的侵入式电极,可以实时解码相对精确的言语信号,而此前的言语解码研讨更多是关于书面文字或图片的脑电信号解码,对错侵入式的,解码速度不够快。
疑问仍存。比方,为何现在只能完成百分之六七十的精确率,有哪些影响言语解码精确率的要素?美国西北大膏火恩柏格医学院 Marc W. Slutzky 博士对 DeepTech 解说说,虽然这项研讨用了 256 个电极,但检测的脑电信号或许仍是太少,由于皮层下区域也或许触及言语功用。别的,这个研讨是针对很少样本得出的成果,现已是相对不错的了,要知道,苹果公司的 Siri 经过数百万小时的练习依然会犯错误。
应战在后面
人的言语是一个极具创造性的体系,其使用在语法规矩外没有任何约束。也便是说,进化数百万年来,咱们实际中的对话现已是一个调集了声响、符号、手势、表情在内的老练的沟通体系,而且这个体系依然在一日千里的不断完善中,而只是依靠脑电波信号一种维度来解码这个杂乱体系,其难度可想而知。
图 | 感知和言语的正电子发射核算机断层扫描成像(PET)。色彩表明相对脑血流量。赤色表明血流量最大,橘黄、黄、绿和蓝色别离表明血流量从大到小顺次递减。(来历:神经科学——探究脑,高等教育出版社,2004)
人脑是一个一直在运转的器官,其脑电信号是继续不止的,尤其是在实际中,人脑常常是在履行传闻功用的一起,还在进行触觉、视觉、味觉、嗅觉以及运动等多种功用的运转,咱们并不清楚不同功用脑区彼此搅扰的状况是怎样的。在这个脑电信号巨大噪音布景下,Edward Chang 们每个细小的前进都是不简单的。
那么问题来了,咱们需求多么精确地了解这些功用的脑电信号才干真实完成杂乱的言语解码?
到现在为止,咱们只是知道人的言语功用与大脑分区有关,并不知道数百亿神经元中的映射概况。
一种或许的研讨战略是,经过对大脑神经活动的空间和时间信号进行高分辩率的数据收集,并合作人工智能的机器学习算法(如深度神经网络),将各种感感觉、运动、言语等高档认知功用所对应的神经信号相互别离出来。这样做还具有重要的临床价值。例如,在脑损伤植物人的集体中,有一部分患者会呈现运动功用和高档认知功用的别离。换句话说,这些患者虽然不具备任何行为上的沟通才干,但却保留着高档的思想才干(如运动和空间幻想)。在药物诱导的麻醉状况,也存在相似的现象。密西根大学医学院麻醉系的黄梓芮博士就在测验让受试者进入麻醉状况进行脑活动解码。可是,由于人类思想和认识内容的丰富性,精确勘探大脑高档认知功用、解码乃至复原相对笼统的言语内容,依然面对巨大的应战。
言语解码还有许多应战。言语的解码不只限于传闻带来的声波信号,每个词汇和语句还会给人一种语义,而这个语义就会对每个人的反响不相同。比方全国际有上万种言语和方言,那么关于同一个语义,不同言语和方言对应脑电信号都或许有差异,乃至关于不同环境生长的同一言语人群以及同一个人在不同年龄段和不同心情状况下的脑电信号都或许不同。还有,关于同一时间的同一个人,同一个词汇或许都会引起不同影响程度的脑电信号。
所以多位业内人士的观点是,受试者的布景越挨近,这种言语解码的普适性才会更高。当然,严格说来,即便关于同一个人做上无数次解码练习,都或许做不到 100% 的解码精确,由于他的言语思想体系一直在更新。
图 | 一个言语加工模型,标示了书面和白话单词复述使命的各个处理阶段。每个阶段下面表明晰由PET成像所观察到的与上述使命特异性相关的皮层区域。(来历:神经科学——探究脑,高等教育出版社,2004)
别的,文字阅览也是一种言语有关的脑电活动,这明显与白话引发的脑电活动不同。不同言语的文字引发的脑电信号也会不相同,象形文字如汉字引发的脑电信号与拉丁字母引发的脑电信号明显会不同,读手语与读唇语明显也会引发不同的脑电信号。以汉语为例,包含翁旭初在内的认知心理学专家以为,汉字是一种二维文字,相关于拼音文字,汉字阅览加工的脑区散布就有自身特色。
也有相对达观的观点。这类观点以为,假如数据运算满足先进,加上科学分类以及对不确认性要素的操控,是有或许得到相对普适性的脑电解码成果的。
认识对话?
事实上,真实的脑机接口应战在于认识。在 4 月份 Edward Chang 的《天然》论文宣布时,同期杂志引述华盛顿大学 Amy Orsborn 博士观点称,当一个人没有动嘴时,它能否了解其想说的话呢?
这是一个好问题。“想要说话”的脑电信号是否能被解码,也便是人的认识能否解码的问题。究竟说出来的言语和听到的言语有声波的物理性质,这些物理信号是确认的影响信号,而认识则具有较大的含糊不确认性。Edward Chang 没有接这个球,他对媒体回应称,解码或人揭露企图说的话满足困难,而且提取他们心里的主意几乎是不或许的。“我没有爱好开发一种技能来发现人们在想什么,即便它是或许的”。
不过,这并非彻底不能完成。曾在美国多年从事恢复研讨的林方博士以为,假如给受试者一个预告,那么是有或许检测到相应的脑电信号的。比方当正告受试者或许有重物落下的时分,受试者会立刻做出防备重物落下的应激反响,这时分的脑电信号就有或许被检测到并分辩出来。德国科学家在本年 4 月《神经科学》(Journal of Neuroscience)宣布了一项对大鼠的研讨,他们解码了大鼠头部预期运动的信号。
其实 Amy Orsborn 这个问题的进一步延伸便是,人们之间能不能完成无言语的认识对话,或许说是魂灵对话。这现已挨近科幻了,就像奇幻电影里的 X 教授,戴上一个头盔就可以进入其他人的认识国际。
可是,假如不是应激激动的反响,那么就不简单解码。比方每个人在赏识《蒙娜丽莎》画作时的感触不同,那么怎么让一个没有艺术鉴赏才干的我国山村娃娃与一个意大利画家对这幅画作进行认识对话?实际中,这都要跨过言语、艺术、日子履历的距离,在这种“认识对话”中,咱们的核算机需求多么强壮才干解码跨过了这么多距离的认识沟通呢?
当然,这概率虽然满足小,但也不是等于零。清华大学生物医学工程系脑机接口研讨组高小榕教授以为,前述山村娃娃和意大利画家相当于一个地球人和外星人的对话,只需有满足多的练习,也未尝不或许完成。
咱们再把这个思想延伸一下,假如脑电解码才干满足强壮,是否意味着人类认识可以像电脑数据相同储存在硬盘上呢?
关于这个科幻式的问题,许多学术界人士给出的答案是让人绝望的。那些解码数据只是是物理信号,并非人脑认识的脑电活动,它难以发生新的信息,也不能进行思想加工。
脑机接口的实际
今日的神经科学并没有一日千里的日新月异,而是人工智能的飞速发展给脑机接口带来了空前的机会。虽然如此,麻省理工学院大脑与认知科学系讲席教授冯国平以为,脑机接口实际的考量是在物理性或确认性更强的功用上完成,但难以碰触深一层的认识。
相对老练的脑机接口研讨是关于人体运动机能。犹他大学生物医学工程团队研发了一款高科技假肢,可以完成认识操控有触觉,可以履行轻松摘葡萄等动作。这个体系由 100 个微电极和导线组成,这个假肢手臂接入了佩带者的神经体系,完成大脑向机械手臂发送动作信号。在机械手臂上安装了向神经发送信号的传感器,以仿照手抓东西时的感觉。
林方对这类恢复设备很看好。她以为,脑机接口的实际含义在于作为辅助工具,协助那些有言语障碍或许运动障碍的人完成正常的器官功用。比方,一个运动障碍患者自身只要 40% 的某器官运动功用,假如这个脑机接口设备可以协助患者把功用提高到 80%,那么这不只是患者的福音,医疗保险公司也会对此乐见其成,由于这会削减医疗资源的投入。
但脑机接口研讨需求落地才行。虽然马斯克 Neuralink 的脑机接口项目最为高调,但除了他的设备可以完成电极数目更多、电极更柔软以及设备微型化,但并没有本质上对脑电信号解码的打破。《麻省理工科技谈论》引述 Google DeepMind 神经科学理论学家 Adam Marblestone 的观点,将 Neuralink 比作装备精良的登山队,但那座大山仍在那里,“真实需求的应该是一架直升机”。
大都业内人士观点是,如马斯克这类侵入式的脑机接口只能用于病情严重的植物人或中风患者身上,而不能用于普通人,究竟侵入的设备存在简单带来感染、电池等资料替换等问题,究竟大脑对自我维护的要求很高。
而关于 Facebook 使用近红外光的可穿戴设备来解码脑电信号的做法,大都人也不认可。由于非侵入式设备的精确性有限,难以完成杂乱脑电信号的解码。
实际的做法如 Edward Chang,他们只针对瘫痪而失语的患者,这样可以选用开颅手术后用侵入式设备来解码有限词汇。由于在许多状况下,这些患者的大脑中依然存在着发生流利言语所需的信息,而现在需求经过新的技能让他们表达出来,那么即便是少量词汇的表达,关于他们的日子质量都是巨大的改进。
Marc W. Slutzky 也持这类观点,关于肌萎缩侧索硬化(ALS)患者或中风患者,假如能完成 200 个词汇信息的承受和表达,只需能到达像 Siri 这类语音识别体系挨近 90% 精确率的话,就现已是巨大前进。
-End-
本文的编撰还得到了以下人士的协助,特此称谢:华南理工大学脑机接口与脑信息处理研讨中心主任李远清教授,上海交通大学智能核算与智能体系要点实验室张丽清教授,华中师范大学生理学和神经生物学陈其才教授,解放军总医院第七医学中心隶属八一脑科医院功用神经外科何江弘主任,福建医科大学隶属泉州榜首医院神经外科副主任医师何雪阳。
参阅:
https://www.jneurosci.org/content/39/15/2847.abstract
重视 DeepTech
发现改动国际的新式科技
(微信号:deeptechchina)