“实例分割”的搜索结果

苹果开源视觉模型界的“瑞士军刀”,能执行数十种任务
苹果和瑞士洛桑联邦理工学院的研究人员共同开发了4M-21,一个大规模多模态视觉模型,并于近日开源。该模型以其30亿参数量却能提供包括图...
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
最近,多模态大模型(LMM)在视觉-语言任务上取得了显著的进展,尤其是在视觉场景下的应用。然而,将LMM应用于计算机视觉任务,特别是图...
CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步
物体姿态估计在现实世界应用中具有重要意义,如具身智能、机器人灵巧操作和增强现实等。在这一领域,研究热点从实例级别6D姿态估计转向...
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
文章介绍了来自华中科技大学和字节跳动的研究团队提出的基础模型 GLEE,该模型能够一次性解决图像和视频中的几乎所有目标感知任务。GLEE...
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究
程博文是一位华人科学家,曾在特斯拉自动驾驶部门工作,最近宣布将加入OpenAI的后训练团队,专注于多模态模型的研究。他毕业于伊利诺伊...