标签:语音识别

刚刚,OpenAI发布Windows版ChatGPT,高级语音能用了

OpenAI于今日凌晨向Windows用户全面开放了桌面版ChatGPT,该版本具备拍照识别和高级语音两大特色功能。用户可以通过拍摄山水画等图片,基于图片内容进行提问...

字节大模型同传智能体,一出手就是媲美人类的同声传译水平

近年来,人工智能在自然语言处理领域取得了显著进展,但同声传译(Simultaneous Interpretation, SI)依然是一个挑战。传统的同声传译软件通常采用级联模型,...

炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流

科大讯飞的讯飞星火4.0版本在语音识别和多模态能力方面取得了显著进步。在强干扰环境下,如多人同时说话和背景音乐,讯飞星火4.0能够准确识别并转化为文字,...

讯飞星火V4.0正式发布,全面对标GPT-4 Turbo,8个国际主流测试集测评第一

科大讯飞于6月27日在北京发布了讯飞星火大模型V4.0及其相关应用。该模型在七大核心能力上进行了全面提升,与GPT-4 Turbo全面对标,并在8个国际主流测试集中取...

最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

中国电信人工智能研究院发布了一款能够识别和理解多达30种方言的语音大模型——“星辰语音大模型”。这一模型的核心功能主要体现在语音识别上,能够突破单一模型...

换了30多种方言,我们竟然没能考倒中国电信的语音大模型

中国电信人工智能研究院近日推出了业内首个支持30种方言自由混说的语音识别大模型,这是国内支持最多方言的语音识别大模型。该模型可以准确识别和理解粤语、...

MiniMax不声不响出了款让人惊喜的生产力产品:「海螺AI」大测评

摘要:MiniMax,一家中国领先的通用人工智能创业公司,最近推出了一款名为'海螺AI'的生产力产品,该产品基于其自研的万亿参数大模型abab 6.5。abab 6.5在知识...

讯飞星火大模型重磅升级,对标GPT-4 Turbo!星火语音大模型发布,37个主流语种识别超OpenAI!

1月30日,科大讯飞发布了讯飞星火认知大模型V3.5,这是一个全面对标国际先进水平的全民开放大模型。它基于全国产算力平台“飞星一号”训练,实现了文本生成、语...