麻省理工AI放王炸!无需说话、秒懂你的想法,外挂AI大脑来了

AIGC动态11小时前发布 AIGCOPEN
67 0 0
麻省理工AI放王炸!无需说话、秒懂你的想法,外挂AI大脑来了

 

文章摘要


【关 键 词】 Alterego无声交互信号处理语音识别助残设备

麻省理工学院分享的突破性研究Alterego,是一款非侵入式可穿戴无声语音交互AI设备,核心是捕捉神经肌肉信号实现无声沟通。

当用户内心发声时,大脑向发声系统发送神经信号,引发相关肌肉产生微弱肌电信号,Alterego会捕捉这些信号。之后对信号进行处理,先以250Hz采样并24倍放大,用偏置信号抵消60Hz线路干扰,再经1.3 – 50Hz Butterworth滤波、60Hz陷波滤波去除噪声,通过独立成分分析消除运动伪影,最后整流、归一化,转化为梅尔频率倒谱系数特征。这些特征输入1D卷积神经网络,经多轮处理实现单词分类,中位数词准确率达92%,输出端用骨传导耳机将AI处理结果以声音反馈给用户,形成双向闭环交互且不影响听觉。

网友对此看法不一,有人担心真实意图泄露,呼吁建立防护机制;有人认为这会改变世界,是21世纪重大硬件发布;也有人猜测大部分是人与电脑间交流。还有人提出疑问,如设备是否会对脑子里同时闪过的想法生成概率分布来判断优先级。也有人期待将其与DNA架构融合,实现与所有生命形态沟通。

Alterego在硬件层面类似耳机,佩戴在头部和面部,有多个高精度电极传感器放置在面部和颈部关键区域,采用金镀银电极和导电膏降低接触阻抗,配备外部触发器标记无声话语起止。信号处理模块采用多种先进技术去除噪声、增强信号质量,特征提取采用梅尔频率倒谱系数方法。无声语音识别模型采用卷积神经网络架构,训练用Adam优化算法,加入50% Dropout正则化,用交叉熵损失函数评估误差。应用与反馈模块可实现用户与设备无声交互,调用不同应用程序,将结果通过骨传导耳机反馈,设计了从数字识别到智能家居控制等多种应用场景。此外,Alterego对残疾人帮助巨大,能让失去发声能力的人轻松交流。

原文和模型


【原文链接】 阅读原文 [ 1697字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...