音频生成

音频,audio

CVPR 2024 | 面部+肢体动画,一个框架搞定从音频生成数字人表情与动作

近年来,随着虚拟现实、虚拟直播和游戏NPC等领域的发展,AI数字人的面部与肢体驱动算法成为了研究的热点。这些算法能够根据语音生成相应的面部表情和肢体动作...

OpenAI藏了1年多的技术正式公开!15秒素材克隆声音,HeyGen也在用

OpenAI最近正式揭幕了一款新的语音合成引擎Voice Engine,这项技术令人瞩目的特点在于,它能够仅凭15秒的语音样本克隆出一个人的声音,并且能够跨越不同语言...

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

  文章摘要 【关 键 词】 谷歌研究、VLOGGER模型、视频生成、音频驱动、数据集MENTOR 谷歌的研究人员近期发布了一种名为VLOGGER的多模态扩散模型,...

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...

46秒AI生成真人视频爆火,遭在线打假「换口型、声音」

近期,一段声称由人工智能(AI)生成的视频在社交媒体上引发了热议。这段不到50秒的视频由AI工具Arcads生成,但其真实性遭到了网友们的质疑。这段视频的上传...

Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会

随着AI技术的发展,人工智能生成的内容越来越逼真,其中最近发布的文本转视频工具Sora模型更是让人惊叹。然而,这种技术的发展也带来了被滥用的风险,可能会...

索尼又给车载音频加了一点黑科技

本文主要讨论了智能汽车行业中车载音响的发展趋势和技术进步。文章指出,随着汽车不再仅被视为从A点到B点的交通工具,而是被视为第二生活空间,车载音响的重...

从短剧、音频到二次元社区,大模型创业者如何用AI改造内容生产模式?

在2024全球开发者先锋大会上,四位创业者分享了他们在过去一年内AI创业的得与失,以及对AI如何影响内容创作者、如何改造不同内容的生产流程,甚至如何满足小...

Adobe推出20多个,企业版生成式AI定制、微调服务

全球多媒体领导者Adobe在其“Summit 2024”大会上推出了Firefly Services,这是一款提供了20多个生成式AI和创意API服务的产品。Firefly Services支持企业使用自...

人人都能当周杰伦!Suno作曲,ChatGPT写词,网友用Transformer造出神曲!

近日,人工智能初创企业Suno发布了其音乐生成器Suno模型V3版本,并在官网提供免费试用。Suno模型能够根据用户输入的文本描述,生成包括歌词、人声和配器在内...
1 18 19 20 21 22 27