“扩散模型”的搜索结果

贾扬清十年经典之作获时间检验奖!ICML 2024十篇最佳论文开奖,爆火SD3、谷歌Genie在列
2024年国际机器学习会议(ICML)在奥地利维也纳举行,期间颁发了多个奖项,包括十篇最佳论文奖和一篇时间检验奖。其中,图像生成模型SD3...
哈工深聂礼强:多模态大模型是具身智能发展的关键动力丨具身智能十人谈
具身智能技术,将智能系统与物理实体结合,使机器人能够感知环境、进行决策并执行动作。其核心在于“具身”,即通过物理形态与世界交互。...
字节跳动、浙大推出Coin3D:用几何代理,控制3D模型生成
由字节跳动和浙江大学研究人员联合开发的创新模型Coin3D,通过引入几何代理的方式,实现了对3D模型生成过程的交互式控制和指导。该模型...
不玩“期货”的快手接棒Stability AI,国产之光可图大模型Kolors领跑开源生态
快手公司开发的文生图大模型——可图(Kolors)近日宣布开源,迅速在社交媒体上引起广泛关注。该模型不仅能够绘制万物,还能书写汉字,展...
ECCV 2024揭榜,录用率或创新低!2395篇论文中选,网友晒出成绩单
欧洲计算机视觉国际会议(ECCV)2024年的录用结果已公布,共有2395篇论文被录用。据网友估算,今年的总提交量约为12600篇,使得录用率仅...
从零开始,用英伟达T4、A10训练小型文生视频模型,几小时搞定
文本生成视频模型是2024年AI领域的热门趋势之一,继大语言模型之后备受关注。本文作者Fareed Khan介绍了如何构建一个小型的文本生成视频...
2024 H1 「中国最具价值 AGI 创新机构 TOP 50」 发布
在人工智能领域,大模型技术正迅速发展,其应用不仅限于算法天才,更深入到各个行业和实际需求场景中。今年的AGI Playground 2024大会上...
旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
旷视科技近期推出了一款名为MegActor的开源AI人像视频生成框架,该框架允许用户通过输入一张静态肖像图片和一段视频,生成表情丰富、动...
耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘
字节跳动豆包大模型团队近期发布了名为Seed-TTS的语音生成大模型,该模型在生成与真人相似度极高的语音方面取得了显著成果。Seed-TTS能...
快手开源 I2V-Adapter,即插即用、轻量级模块让静态图像秒变动态视频
快手大模型团队开发了一种名为I2V-Adapter的新技术,该技术是一种轻量级适配模块,基于Stable Diffusion的文生视频扩散模型。I2V-Adapte...
1 2 3 4 5 6 16