“语音合成”的搜索结果

耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘
字节跳动豆包大模型团队近期发布了名为Seed-TTS的语音生成大模型,该模型在生成与真人相似度极高的语音方面取得了显著成果。Seed-TTS能...
微软NaturalSpeech语音合成推出第三代,网友惊呼:超自然!实至名归
微软NaturalSpeech项目介绍微软NaturalSpeech项目介绍本文介绍了微软在文本到语音合成(TTS)领域的研究项目NaturalSpeech,该项目旨在...
趣丸科技联合港中大(深圳)开源首个语音大模型
趣丸科技与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”已在Amphion系统中开源,供全球用户使用。该模型采用掩码生成模型与语音...
我的耳机竟然成了最懂我的人?用了就再也离不开了!
字节豆包推出了一款名为Ola Friend的开放智能体耳机,这款耳机集成了大语言模型,使用户能够通过纯语音与AI智能体进行对话。它利用豆包...
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
字节跳动在AI视频生成领域取得重大进展,发布了基于DiT(扩散Transformer)架构的豆包视频生成模型PixelDance和Seaweed,以及音乐和同声...
车圈最大AI「黑马」吉利:自研语音大模型登顶,性能超SOTA 10%
吉利汽车在语音合成技术领域取得了显著进展,其自研的HAM-TTS大模型在发音准确性、自然度和说话人相似度上超越了此前的SOTA成果VALL-E。...
GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉
OpenAI的GPT-4o模型在经过一系列安全测试后,其语音功能因存在潜在风险而迟迟未能上线。该模型在高背景噪声环境下可能模仿用户声音,且...
完蛋,我被数字同事包围了!小冰AI数字员工再升级,零样本定制,即时上岗
小冰公司最新推出了一项名为“零样本”数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)的技术创新,该技术基于超千亿大模型基座...
ChatTTS 深度体验:AI能精准表达人类的七情六欲了?| AI鲜测
ChatTTS,一个专为对话场景设计的文本生成语音模型,近日在GitHub上备受关注,仅用6天时间便获得了18.9千个星标。该模型支持多种语言,...
a16z 发布 AI 语音 Agent 图谱:重塑通话的时机到了
AI语音助手的机遇: - AI语音助手通过重新定义电话,为企业节省成本,降低风险,为消费者提供低成本服务。 - 成功的语音助手需要关...
1 2 3