“语音”的搜索结果

刚刚,OpenAI开放ChatGPT高级语音模式,会50多种语言!
OpenAI最近宣布了对ChatGPT Plus和Team用户的高级语音模式的开放。这一模式不仅保留了原有的功能,还引入了多项新特性,包括自定义指令...
车圈最大AI「黑马」吉利:自研语音大模型登顶,性能超SOTA 10%
吉利汽车在语音合成技术领域取得了显著进展,其自研的HAM-TTS大模型在发音准确性、自然度和说话人相似度上超越了此前的SOTA成果VALL-E。...
MiniMax不藏了,大秀视频/语音/文本全模态模型家族,“每天与世界交互30亿次”
MiniMax公司首次公开展示了其强大的模型和产品战绩,包括全模态模型家族,涵盖文本、语音和视频。公司每天处理的交互量达到30亿次,生成...
阿里开源新语音模型,比OpenAI的Whisper更好!
阿里巴巴公司在Qwen-Audio的基础上推出了新一代的开源语音模型Qwen2-Audio,该模型在多个方面进行了显著的优化和改进。Qwen2-Audio模型...
超强实体ChatGPT机器人:语音推理、视觉识别,“终结者”来啦!
Figure.AI联合创始人Brett Adcock发布了新一代实体机器人Figure 02,该机器人在前一代01的基础上进行了软硬件的大量更新。Figure 02搭载...
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI公司aiOla在其官网开源了一款名为Whisper-Medusa的语音模型,该模型在推理效率上相较于OpenAI的Whisper模型提升了50%。Whisper-...
终于来了,OpenAI测试GPT-4o高级语音模式!
OpenAI正在对GPT-4o的高级语音模式进行测试,目前仅向部分ChatGPT Plus用户开放。测试的目的是收集关于安全性和功能方面的反馈,以便在8...
GPT-4o 最关键功能本周上线,语音交互的时代终于要来了
Voice Agent作为下一代人机交互界面,以其与人类自然沟通方式的一致性,提供了一种直观且低能耗的交互体验。与传统文本交互相比,语音交...
香港理工大学 MIND 实验室招收进化计算/类脑计算/语音信号处理等方向全奖博士生/博士后
香港理工大学是一所享有国际声誉的公立综合性研究型大学,位于中国香港九龙红磡湾。在2024-25年度,该校在QS、US News和THE世界大学排名...
炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
科大讯飞的讯飞星火4.0版本在语音识别和多模态能力方面取得了显著进步。在强干扰环境下,如多人同时说话和背景音乐,讯飞星火4.0能够准...
1 2 3 4 43