标签:多模态大模型
荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布
这篇文章介绍了新一代人工智能技术的发展趋势和重要性,以及围绕多模态大模型的相关内容。2023年,人工智能技术如大语言模型、AIGC、世界模型等成为热门话题...
【最后一天报名】Sora爆火50天,中国如何发力多模态大模型?|钛媒体AGI沙龙
美国OpenAI公司于今年2月15日发布了一款名为Sora的人工智能视频生成大模型产品,它能够根据用户输入的文字提示生成一分钟内的视频,展现用户想象中的视觉场景...
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
最近,多模态大模型(LMM)在视觉-语言任务上取得了显著的进展,尤其是在视觉场景下的应用。然而,将LMM应用于计算机视觉任务,特别是图像分割方面,仍面临挑...
钛媒体AGI沙龙报名|Sora爆火50天,中国如何发力多模态大模型?
Sora,美国OpenAI公司最新发布的人工智能视频生成大模型,已经在短时间内引起了广泛关注,并在社交媒体上取得了显著的成功。Sora的推出不仅在技术上超越了以...
提升生成式零样本学习能力,视觉增强动态语义原型方法入选CVPR 2024
华中科技大学研究生与阿里巴巴旗下银泰商业集团的技术专家提出了一种名为视觉增强的动态语义原型方法(VADS),以提高生成式零样本学习(GZSL)的性能。VADS...
人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文
金磊和衡宇从凹非寺发来的报道揭示了一个引人入胜的故事,关于一家位于中关村的创业公司——智子引擎,以及它与OpenAI技术上的“撞车”事件。这家公司凭借其在多...
性能超GPT-4!免费使用、支持中文,Claude 3正式发布
文章主要介绍了Anthropic公司在3月4日晚在其官网上正式发布了Claude 3系列的多模态大模型,包括Haiku、Sonnet和Opus三个版本。根据评测报告显示,Opus在多个...
能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了
摘要:2023年,多模态大语言模型(MLLM)在文本、代码、图像、视频等领域取得了显著进展。上海人工智能实验室联合多所大学发布了一份详尽的评测报告,对GPT-4...
“国家队”入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资
联汇科技近日宣布完成数亿元战略融资,投资方包括中国移动产业链发展基金中移和创投资等。本轮融资将用于多模态大模型及自主智能体的技术研发、产品创新及市...
安卓率先跑通多模态大模型,终端本地就能看图生成文本!高通:WiFi都会AI起来
在MWC 2024首日,高通展示了其在终端侧AI领域的最新进展。首先,高通成功将多模态大模型首次本地部署在安卓手机上,这意味着用户可以通过手机AI助手输入照片...