标签:多模态大模型

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

最近,多模态大模型(LMM)在视觉-语言任务上取得了显著的进展,尤其是在视觉场景下的应用。然而,将LMM应用于计算机视觉任务,特别是图像分割方面,仍面临挑...

钛媒体AGI沙龙报名|Sora爆火50天,中国如何发力多模态大模型?

Sora,美国OpenAI公司最新发布的人工智能视频生成大模型,已经在短时间内引起了广泛关注,并在社交媒体上取得了显著的成功。Sora的推出不仅在技术上超越了以...

提升生成式零样本学习能力,视觉增强动态语义原型方法入选CVPR 2024

华中科技大学研究生与阿里巴巴旗下银泰商业集团的技术专家提出了一种名为视觉增强的动态语义原型方法(VADS),以提高生成式零样本学习(GZSL)的性能。VADS...

人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文

金磊和衡宇从凹非寺发来的报道揭示了一个引人入胜的故事,关于一家位于中关村的创业公司——智子引擎,以及它与OpenAI技术上的“撞车”事件。这家公司凭借其在多...

性能超GPT-4!免费使用、支持中文,Claude 3正式发布

文章主要介绍了Anthropic公司在3月4日晚在其官网上正式发布了Claude 3系列的多模态大模型,包括Haiku、Sonnet和Opus三个版本。根据评测报告显示,Opus在多个...

能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了

摘要:2023年,多模态大语言模型(MLLM)在文本、代码、图像、视频等领域取得了显著进展。上海人工智能实验室联合多所大学发布了一份详尽的评测报告,对GPT-4...

“国家队”入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资

联汇科技近日宣布完成数亿元战略融资,投资方包括中国移动产业链发展基金中移和创投资等。本轮融资将用于多模态大模型及自主智能体的技术研发、产品创新及市...

安卓率先跑通多模态大模型,终端本地就能看图生成文本!高通:WiFi都会AI起来

在MWC 2024首日,高通展示了其在终端侧AI领域的最新进展。首先,高通成功将多模态大模型首次本地部署在安卓手机上,这意味着用户可以通过手机AI助手输入照片...

香港也有大模型公司了:天使轮估值一亿美金

Weitu AI,一家位于香港的多模态大模型初创公司,近日完成了天使轮融资,估值高达一亿美金。该公司由来自北美名校的毕业生和拥有海外大厂工作经验的成员组成...

深度 | 万模大战,杀出一匹黑马

文章总结:本文主要介绍了近期在多模态大模型领域的最新进展,包括LLaVA-NeXT、SPHINX-X、MobileVLM和CogCoM等多个模型。这些模型在性能、训练成本、多模态理...
1 2 3