标签:视频任务

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

文章介绍了来自华中科技大学和字节跳动的研究团队提出的基础模型 GLEE,该模型能够一次性解决图像和视频中的几乎所有目标感知任务。GLEE支持根据任意开放词表...