“Diffusion Transformer”的搜索结果

揭秘“中国版Sora”可灵:程一笑督战,20人团队三个月完成的快手版“大力出奇迹”
2023年10月,快手公司重新启动了名为“噗叽”的项目,这是一个利用AI技术将静态图片转换成2秒GIF表情包的工具。尽管最初并未引起广泛关注...
更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅
2024年,AIGC领域特别是文生视频赛道呈现出显著的发展趋势,其中智象未来(HiDream.ai)作为国内专注于构建视觉多模态基础模型及应用的...
媲美Sora,最长2分钟!快手发布文生视频大模型-可灵
快手AI团队最新发布的大模型“可灵”引人瞩目,该模型具备文本生成视频的能力,能够创作出2分钟长、1080P分辨率、每秒30帧的超长视频。在...
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
本文报道了基于Diffusion Transformer(DiT)的新模型Flag-DiT,该模型由上海AI Lab、港中文和英伟达的研究者联合推出,旨在通过流(Flo...
GPT-3水平的Sora 就强大到不敢给普通人用?可我也不知道把它用在哪儿
2023年以来,多模态视频生成技术取得了显著的进展,其中OpenAI旗下视频生成模型Sora在2024年2月发布后迅速成为全球焦点。Sora在视频生成...
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
本文介绍了由智子引擎团队研发的多模态大模型Awaker 1.0,该模型在多模态任务中表现出色,特别是在数据生成和模型自主更新方面具有创新...
GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
  文章摘要 【关 键 词】 VAR、图像生成、自回归模型、扩散模型、Scaling Laws 机器之心最近发布了一篇关于新一代视觉生成范...
国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳
国内首个音乐ChatGPT,「天工SkyMusic」,已经开启内测,引起了编辑部的极大关注。这款AI音乐生成大模型以其高质量的音乐品质和逼真的人...
Scaling Law 又一次性感了吗?
专题解读事件:Sora 的出现被认为是 Scaling Law 的又一次成功,这也引起了社区中更多对 Scaling Law 的讨论。自 OpenAI 发布 Sora,业...
音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车
Stability AI最近发布了Stable Audio 2.0,一款能够创作长达3分钟的音乐作品的AI音乐工具。这个工具可以通过简单的自然语言指令或音频输...
1 2 3 4 5 9