换了30多种方言,我们竟然没能考倒中国电信的语音大模型
文章摘要
【关 键 词】 人工智能、语音识别、方言支持、模型研发、算力优势
中国电信人工智能研究院近日推出了业内首个支持30种方言自由混说的语音识别大模型,这是国内支持最多方言的语音识别大模型。该模型可以准确识别和理解粤语、上海话、四川话等多种方言,提高了语音识别准确率。中国电信在语音领域积累了大量高质量方言数据库,并自主研发了语音识别大模型。该模型采用“蒸馏+膨胀”联合训练算法,成功实现了单一模型支持30种方言的识别。在多项基准测试中,该模型表现出色,如国际语音顶会竞赛冠军。中国电信利用自身算力优势,在多个领域试点应用了该语音识别大模型,实现了方言语音输入的准确识别和转录,提高了服务效率。该模型还具有保护和传承方言文化的意义,助力濒危方言的记录和保护。中国电信在大模型领域进行了积极布局,推动了语音、语义、视觉等多模态大模型的发展。
原文和模型
【原文链接】 阅读原文 [ 4244字 | 17分钟 ]
【原文作者】 机器之心
【摘要模型】 glm-4
【摘要评分】 ★☆☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...