标签:语音识别
刚刚,OpenAI发布Windows版ChatGPT,高级语音能用了
OpenAI于今日凌晨向Windows用户全面开放了桌面版ChatGPT,该版本具备拍照识别和高级语音两大特色功能。用户可以通过拍摄山水画等图片,基于图片内容进行提问...
字节大模型同传智能体,一出手就是媲美人类的同声传译水平
近年来,人工智能在自然语言处理领域取得了显著进展,但同声传译(Simultaneous Interpretation, SI)依然是一个挑战。传统的同声传译软件通常采用级联模型,...
炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
科大讯飞的讯飞星火4.0版本在语音识别和多模态能力方面取得了显著进步。在强干扰环境下,如多人同时说话和背景音乐,讯飞星火4.0能够准确识别并转化为文字,...
讯飞星火V4.0正式发布,全面对标GPT-4 Turbo,8个国际主流测试集测评第一
科大讯飞于6月27日在北京发布了讯飞星火大模型V4.0及其相关应用。该模型在七大核心能力上进行了全面提升,与GPT-4 Turbo全面对标,并在8个国际主流测试集中取...
最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊
中国电信人工智能研究院发布了一款能够识别和理解多达30种方言的语音大模型——“星辰语音大模型”。这一模型的核心功能主要体现在语音识别上,能够突破单一模型...
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
中国电信人工智能研究院近日推出了业内首个支持30种方言自由混说的语音识别大模型,这是国内支持最多方言的语音识别大模型。该模型可以准确识别和理解粤语、...
MiniMax不声不响出了款让人惊喜的生产力产品:「海螺AI」大测评
摘要:MiniMax,一家中国领先的通用人工智能创业公司,最近推出了一款名为'海螺AI'的生产力产品,该产品基于其自研的万亿参数大模型abab 6.5。abab 6.5在知识...
讯飞星火大模型重磅升级,对标GPT-4 Turbo!星火语音大模型发布,37个主流语种识别超OpenAI!
1月30日,科大讯飞发布了讯飞星火认知大模型V3.5,这是一个全面对标国际先进水平的全民开放大模型。它基于全国产算力平台“飞星一号”训练,实现了文本生成、语...