标签:图像理解

刷爆多模态任务榜单!贾佳亚团队Mini-Gemini登热榜,代码、模型、数据全部开源

这篇文章介绍了由香港中文大学终身教授贾佳亚团队提出的多模态模型 Mini-Gemini,被称为绝绝子,相当于开源社区的 GPT4+DALLE3 的王炸组合。Mini-Gemini提供...

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用,以及最新研究成果VisionLLaMA的进展。VisionLLaMA是一种旨在实...

超越GPT-4V: 浦语·灵笔2在13项多模态评测的领先之旅

浦语·灵笔2是一款基于书生·浦语2-7B模型研发的图文多模态大模型,具有强大的图文写作和图像理解能力。该模型在13项多模态评测中展现出卓越的性能,并在6项评...
1 2