标签:视觉模型

苹果开源视觉模型界的“瑞士军刀”,能执行数十种任务

苹果和瑞士洛桑联邦理工学院的研究人员共同开发了4M-21,一个大规模多模态视觉模型,并于近日开源。该模型以其30亿参数量却能提供包括图像分类、目标检测、语...

视觉 AI 的「Foundation Model」,已经发展到哪一步?丨CVPR 2024 现场直击

视觉Foundation Model成为会议的核心主题之一。两篇最佳论文均颁给了AIGC,图像和视频合成与生成领域的论文数量达到329篇,位居榜首。上海人工智能实验室的Op...

超GPT-4o,代码能力超强!Claude 3.5 Sonnet正式发布

这是Claude 3.5系列中的首个模型,也是Anthropic目前最强的视觉模型。Sonnet的性能不仅超过了上一代Claude 3旗舰模型Opus,还大幅度超越了OpenAI的GPT-4o和谷...