标签:扩散模型
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
香港大学与华为诺亚方舟实验室合作开发的扩散推理模型 Dream 7B,在开源扩散语言模型领域取得了新的突破,成为当前性能最佳的模型。该模型在通用能力、数学推...
爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 | ICLR 2025
块离散去噪扩散语言模型(BD3-LMs)结合了自回归模型和扩散模型的优势,解决了现有扩散模型在生成长度受限、推理效率低和生成质量低等方面的问题。通过块状扩...
视频可以精准控制了!一句话给熊戴眼镜的那种,扩散模型立功,浙大悉尼科技大学出品 | ICLR 2025
随着视频生成技术的快速发展,视频编辑作为其中的一个重要方向,逐渐成为研究热点。然而,传统的视频编辑方法通常局限于风格转换或单一目标的编辑,难以满足...
逐字生成非最优?试试逐「块」生成!Block Diffusion打通了自回归与扩散
扩散模型在生成图像和视频方面取得了显著进展,并在处理离散数据(如文本或生物序列)方面展现出潜力。与自回归模型相比,扩散模型具有加速生成和提高输出可...
MIT 最新扩散模型课程:从微分方程探索 AIGC 的边界
MIT计算机系教授Peter Holderrieth和Ezra Erives在其最新课程系列“Generative AI with Stochastic Differential Equations”中,深入探讨了生成式人工智能(AI...
英伟达发布天气模型CorrDiff,预测效率大涨
在全球极端天气事件频发的背景下,精准气象预测对保障社会安全与经济发展至关重要。英伟达研发的CorrDiff天气预测模型通过创新技术将大气数据分辨率从25公里...
不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果
Inception Labs推出了首个商业级扩散大型语言模型Mercury,标志着Transformer与扩散模型的融合进入实际应用阶段。该模型在英伟达H100上实现每秒超过1000个tok...
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
由中国人民大学高瓴人工智能研究院与蚂蚁集团联合研发的LLaDA模型,通过创新性引入扩散模型架构,为破解大语言模型的逆诅咒难题提供了全新解决方案。该模型在...
文本生成无限长视频,无需任何训练
韩国首尔国立大学研究团队开发的FIFO-Diffusion模型,通过创新技术解决了传统文生视频模型在生成长视频时存在的质量下降与连贯性不足问题。传统模型因训练时...
谢赛宁新作爆火,扩散模型新赛道诞生!测试时计算带飞,性能飙到天花板
来自纽约大学(NYU)、麻省理工学院(MIT)和谷歌的研究团队提出了一种创新方法,旨在通过测试时计算提升扩散模型(DM)的性能。该研究的核心在于设计一个通...