语音识别 | 学习AIGC

麻省理工AI放王炸！无需说话、秒懂你的想法，外挂AI大脑来了

麻省理工学院分享的突破性研究Alterego，是一款非侵入式可穿戴无声语音交互AI设备，核心是捕捉神经肌肉信号实现无声沟通。当用户内心发声时，大脑向发声系统...

AIGC动态

3天前

一张小卡片敢卖999？原来是智能体AI硬件

在硬件方面，TicNote配备了470mAh大电池，支持1.5小时快充，待机续航时间达20天，支持20+小时连续录音，并内置64GB eMMC存储，无需网络也能记录。其轻巧的设...

AI-Agent

3个月前

全球首个AI眼镜支付技术落地，Rokid称明年量产目标100万台

全球首个AI眼镜支付技术正式落地，标志着智能眼镜产业进入支付时代。Rokid与支付宝合作推出的Rokid Glasses内置了“看一下支付”功能，用户只需通过语音指令结...

AIGC动态

3个月前

13年死磕一个真理，这家中国AI黑马冲刺IPO

深圳地铁20号线上，一位老人用方言对着售票机说出目的地后，机器仅用1.5秒就准确出票，而传统方式需要15秒。这一场景背后是云知声数万小时方言训练的成果，展...

AIGC动态

3个月前

OpenAI深夜发布3个全新的语音模型，一手实测都在这了。

OpenAI近期发布了一系列新的语音和文本处理模型，包括两个语音转文本（STT）模型和一个文本生成语音（TTS）模型。这些模型通过API提供接入方式，旨在提升语音...

AIGC动态

6个月前

微软Phi-4家族新增两位成员，5.6B多模态单任务超GPT-4o，3.8B小模型媲美千问7B

微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员，标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...

AIGC动态

7个月前

阶跃星辰再拿多模态榜首，全方位升级发布六款模型

随着春节的临近，2025年初大模型领域迎来了新一轮的竞争高潮。OpenAI的ChatGPT推出了新功能“Tasks”，而国内厂商如月之暗面、MiniMax、生数科技等也纷纷发布了...

AIGC动态

8个月前

小米语音首席科学家 Daniel Povey：语音识别卷完了，下一个机会在哪里？| 智者访谈

Daniel Povey博士，Kaldi项目的创始人和小米集团语音首席科学家，在访谈中分享了他对AI发展、语音识别技术以及多模态能力融合的深刻见解。Povey博士认为，尽...

AIGC动态

8个月前

刚刚，OpenAI发布Windows版ChatGPT，高级语音能用了

OpenAI于今日凌晨向Windows用户全面开放了桌面版ChatGPT，该版本具备拍照识别和高级语音两大特色功能。用户可以通过拍摄山水画等图片，基于图片内容进行提问...

AIGC动态

10个月前

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

近年来，人工智能在自然语言处理领域取得了显著进展，但同声传译（Simultaneous Interpretation, SI）依然是一个挑战。传统的同声传译软件通常采用级联模型，...

AI-Agent

1年前 (2024)

标签：语音识别

麻省理工AI放王炸！无需说话、秒懂你的想法，外挂AI大脑来了

一张小卡片敢卖999？原来是智能体AI硬件

全球首个AI眼镜支付技术落地，Rokid称明年量产目标100万台

13年死磕一个真理，这家中国AI黑马冲刺IPO

OpenAI深夜发布3个全新的语音模型，一手实测都在这了。

微软Phi-4家族新增两位成员，5.6B多模态单任务超GPT-4o，3.8B小模型媲美千问7B

阶跃星辰再拿多模态榜首，全方位升级发布六款模型

小米语音首席科学家 Daniel Povey：语音识别卷完了，下一个机会在哪里？| 智者访谈

刚刚，OpenAI发布Windows版ChatGPT，高级语音能用了

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

热门网址

标签：语音识别

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址