“Diffusion Transformer”的搜索结果

超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文
计算机视觉领域的顶级会议CVPR 2024在美国西雅图成功举行,会议规模和参与人数均创历史新高,现场参会人数超过一万两千人。本次会议共接...
钛媒体AGI独家|“中国版Sora”视频大模型Vidu重大更新:时长延至32秒,首次支持音视频合成
中国自研视频大模型Vidu取得显著进展,完成了三个重大技术迭代,标志着国产视频生成技术的一大步跨越。首先,Vidu已能够一键生成长达32...
AlphaFold 3一夜预测地球所有生物分子,谷歌DeepMind颠覆生物学登Nature头版!
谷歌DeepMind的AlphaFold 3是该公司在生物分子结构预测领域的最新突破。这项技术利用AI革命的核心架构——Transformer+Diffusion,以原子...
7262篇提交,ICLR 2024爆火,两篇国内论文获杰出论文提名
本文是对国际学习表征会议(ICLR 2024)的杰出论文奖和荣誉提名奖的总结。ICLR 是深度学习领域的顶级学术会议,由 Yoshua Bengio 和 Yan...
钛媒体AGI独家|智谱AI正研发对标Sora的国产文生视频模型,预计最快年内发布
智谱AI是国内AI领域的独角兽企业,估值超过200亿元人民币。公司正在研发一款对标美国Sora的高质量文生视频模型,预计最快年内发布。智谱...
一键生成 16 秒 1080P 视频,国产 Sora 的秘密,藏在这个清华系大模型团队中
在2024年,Sora技术因其在长视频生成领域的革命性突破而受到全球关注。Sora技术采用Diffusion加Transformer架构,克服了传统Stable Diff...
中国首个Sora级大模型:文本生成16秒,1080p高清视频
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技发布了中国首个长时间、高一致性、高动态性视频大模型——Vidu...
钛媒体AGI沙龙第一期:“中国版Sora”刚刚诞生,文生视频模型的未来究竟在哪里?
在2024年2月16日,美国OpenAI公司发布了Sora视频生成模型,这是AI首次生成长达1分钟的多镜头视频,输入简短的文字描述即可生成具有电影...
清华团队国产“Sora”火了!画面效果对标OpenAI,长度可达16秒,还能读懂物理规律
Vidu模型的发布:「Vidu」能够一键生成长达16秒、分辨率达1080p的高清视频内容,其画面效果非常接近Sora,表现出色在多镜头语言、时间和...
当前最强国产Sora!清华团队突破16秒长视频,懂多镜头语言,会模拟物理规律
本文介绍了由生数科技联合清华大学最新发布的视频大模型「Vidu」,该模型在视频生成领域取得了显著的技术突破。以下是对文章内容的详细...
1 5 6 7 8 9 10