音频生成

音频,audio

即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

上个月,彭博社报道了苹果公司正在与谷歌进行谈判,希望将谷歌的AI系统Gemini集成到iPhone中,以增强iPhone的AI功能。这一消息引起了业界的广泛关注,因为苹...

Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话

腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标,显示出其受...

免费AI“神器”系列第11弹:苹果版ChatGPT超越GPT-4;腾讯版Sora已获3000星|钛媒体AGI

生成式人工智能(AIGC)领域最近推出了多款新应用,钛媒体AGI整理了五款免费AI“神器”,每款都在其领域内展现了创新和潜力。苹果ReALM:这是一款由苹果研究团...

​Stability AI发布table Audio 2.0,可生成3分钟44.1kHz立体声音乐

Stability AI 最近推出了 Stable Audio 2.0,这是一款在 AI 音频生成领域具有划时代意义的产品。Stable Audio 2.0 在前一版本的基础上进行了显著升级,引入了...

音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车

Stability AI最近发布了Stable Audio 2.0,一款能够创作长达3分钟的音乐作品的AI音乐工具。这个工具可以通过简单的自然语言指令或音频输入,生成高质量、结构...

国内首个音乐版「ChatGPT」来了!Sora同款架构,唱作技巧全面发展,还剧透了全新MoE大模型

昆仑万维近期宣布了其AI音乐生成大模型「天工SkyMusic」的开放邀测,这一模型基于公司的「天工3.0」超级大模型构建。这个模型的亮点在于其情感表达能力,特别...

还得是抖音,字节推出竖屏视频理解数据集,入选CVPR2024

随着短视频在社交媒体的流行,竖屏视频成为了主流的视频格式。然而,传统视频处理技术主要集中在横屏视频上,忽视了竖屏视频的独特性。为了弥补这一研究空白...

15 秒音频即可“复制”原声!但OpenAI 担心新语音模型被滥用而限制发行

OpenAI近期展示了其新型语音生成模型“Voice Engine”,这一技术能够通过文本输入和短短15秒的音频样本,生成与原始说话者声音高度相似的自然语言语音。这项技...

音乐ChatGPT时刻来临!「天工SkyMusic」音乐大模型今日启动邀测

机器之心编辑部宣布,昆仑万维的AI音乐生成大模型「天工 SkyMusic」现已对外开放免费邀测,提供1000个名额给行业媒体、专家和音乐从业者。申请者可通过扫描二...

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径

新智元最近报道了一项有趣的研究,一位博士研究人员利用「离散扩散」模型解决了图像表示迷宫中的最短路径问题。这项实验通过反复添加水平和垂直墙生成迷宫,...
1 13 14 15 16 17 24