“扩散模型”的搜索结果

钛媒体AGI沙龙第一期:“中国版Sora”刚刚诞生,文生视频模型的未来究竟在哪里?
在2024年2月16日,美国OpenAI公司发布了Sora视频生成模型,这是AI首次生成长达1分钟的多镜头视频,输入简短的文字描述即可生成具有电影...
一键换装,让奥特曼、黄仁勋穿上机器之心的文化衫
这篇文章介绍了一种虚拟试衣技术,由韩国科学技术院(KAIST)和OMNIOUS.AI共同开发,名为IDM-VTON。该技术利用一种新型扩散模型,能够高...
Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率
国产视频生成模型Open-Sora在开源社区中进行了更新,现在支持长达16秒的视频生成,分辨率最高可达720p,并能处理任何宽高比的文本到图像...
Open-Sora全面开源升级:支持16s视频生成和720p分辨率
Open-Sora,一个开源社区项目,近期进行了一次重大更新。这次更新带来了一系列新功能和改进,使得Open-Sora在视频生成方面更加强大和灵...
端侧 AI 新篇章!商汤科技发布「速度最快」的端侧模型
商汤科技最近发布了新一代的端侧模型,名为日日新5.0大模型体系,其中SenseChat-Lite端侧模型表现尤为突出。该模型不仅在性能上全面领先...
「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架
近年来,基于文本的图像生成技术取得了显著进展,特别是在生成个性化内容方面。个性化内容生成指的是用户提供一组最小概念图像集,然后...
大模型一定就比小模型好?谷歌的这项研究说不一定
Google Research的一个团队近期对隐扩散模型(LDM)进行了大量实验研究,发现在预算有限的情况下,更大的模型并不总是更好。他们的研究...
微软推出VASA-1:可生成会说话的,动态人物视频
本文介绍了微软亚洲研究院推出的VASA-1,这是一个能够通过输入一张图片和一段音频生成表情丰富、细节逼真的动态人物视频的模型。根据演...
CVPR 2024|文本或图像提示精准编辑 3D 场景,美图&信工所&北航&中大联合提出 3D 编辑方法 CustomNeRF
美图影像研究院(MT Lab)联合中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了一种名为CustomNeRF的3D场景编辑方法。...
Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式
这篇文章介绍了生成式AI领域中的两个主导模型:自回归模型和扩散模型。自回归模型专注于处理离散数据,如文本,通过预测下一个token来生...
1 6 7 8 9 10 16