“Diffusion Transformer”的搜索结果

2023年10月，快手公司重新启动了名为“噗叽”的项目，这是一个利用AI技术将静态图片转换成2秒GIF表情包的工具。尽管最初并未引起广泛关注...

AIGC动态

2个月前

2024年，AIGC领域特别是文生视频赛道呈现出显著的发展趋势，其中智象未来（HiDream.ai）作为国内专注于构建视觉多模态基础模型及应用的...

AIGC动态

2个月前

快手AI团队最新发布的大模型“可灵”引人瞩目，该模型具备文本生成视频的能力，能够创作出2分钟长、1080P分辨率、每秒30帧的超长视频。在...

AIGC动态

3个月前

本文报道了基于Diffusion Transformer（DiT）的新模型Flag-DiT，该模型由上海AI Lab、港中文和英伟达的研究者联合推出，旨在通过流（Flo...

AIGC动态

4个月前

2023年以来，多模态视频生成技术取得了显著的进展，其中OpenAI旗下视频生成模型Sora在2024年2月发布后迅速成为全球焦点。Sora在视频生成...

AIGC动态

5个月前

本文介绍了由智子引擎团队研发的多模态大模型Awaker 1.0，该模型在多模态任务中表现出色，特别是在数据生成和模型自主更新方面具有创新...

AIGC动态

5个月前

文章摘要【关键词】 VAR、图像生成、自回归模型、扩散模型、Scaling Laws 机器之心最近发布了一篇关于新一代视觉生成范...

AIGC动态

5个月前

国内首个音乐ChatGPT，「天工SkyMusic」，已经开启内测，引起了编辑部的极大关注。这款AI音乐生成大模型以其高质量的音乐品质和逼真的人...

AIGC动态

5个月前

Scaling Law 又一次性感了吗？

专题解读事件：Sora 的出现被认为是 Scaling Law 的又一次成功，这也引起了社区中更多对 Scaling Law 的讨论。自 OpenAI 发布 Sora，业...

AIGC动态

5个月前

Stability AI最近发布了Stable Audio 2.0，一款能够创作长达3分钟的音乐作品的AI音乐工具。这个工具可以通过简单的自然语言指令或音频输...

AIGC动态

6个月前