图像理解 | 第 2 页

梗图理解“天花板”！港中文终身教授贾佳亚团队推出多模态模型：GPT-4+DALL-E 3，王炸组合刷爆榜单

近日，港中文终身教授贾佳亚团队推出了一款名为 Mini-Gemini 的多模态模型，包括 2B 小杯到 34B 的超大杯，一经发布便登上了 PaperWithCode 热榜。Mini-Gemin...

AIGC动态

1年前 (2024)

这篇文章介绍了贾佳亚团队提出的超强视觉语言模型Mini-Gemini，该模型在多模态任务中表现出色，被称为开源社区版的GPT-4+DALL-E组合。Mini-Gemini提供了2B小...

AIGC动态

1年前 (2024)

香港中文大学终身教授贾佳亚团队提出了一款名为Mini-Gemini的多模态模型，该模型结合了更高清图像的精确理解、更高质量的训练数据以及更强的图像解析推理能力...

AIGC动态

1年前 (2024)

这篇文章介绍了由香港中文大学终身教授贾佳亚团队提出的多模态模型 Mini-Gemini，被称为绝绝子，相当于开源社区的 GPT4+DALLE3 的王炸组合。Mini-Gemini提供...

AIGC动态

1年前 (2024)

机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用，以及最新研究成果VisionLLaMA的进展。VisionLLaMA是一种旨在实...

AIGC动态

2年前 (2024)

浦语·灵笔2是一款基于书生·浦语2-7B模型研发的图文多模态大模型，具有强大的图文写作和图像理解能力。该模型在13项多模态评测中展现出卓越的性能，并在6项评...

AIGC动态

2年前 (2024)