“多模态研究”的搜索结果

视觉 AI 的「Foundation Model」,已经发展到哪一步?丨CVPR 2024 现场直击
视觉Foundation Model成为会议的核心主题之一。两篇最佳论文均颁给了AIGC,图像和视频合成与生成领域的论文数量达到329篇,位居榜首。上...
ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天
在2024年世界经济论坛上,图灵奖得主Yann LeCun提出了视频模型应该在抽象表征空间中进行预测的观点。本文研究者基于最优传输理论,提出...