多模态大模型 | 第 2 页

字节发布视觉基础模型ViTamin，多项任务实现SOTA，入选CVPR2024

文章介绍了字节跳动提出的新基础模型ViTamin，专为视觉语言时代设计。ViTamin在ImageNet零样本准确率上比ViT提高了2.0%，在多个基准任务上表现出色。ViTamin-...

AIGC动态

1年前 (2024)

荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布

这篇文章介绍了新一代人工智能技术的发展趋势和重要性，以及围绕多模态大模型的相关内容。2023年，人工智能技术如大语言模型、AIGC、世界模型等成为热门话题...

AIGC动态

1年前 (2024)

【最后一天报名】Sora爆火50天，中国如何发力多模态大模型？｜钛媒体AGI沙龙

美国OpenAI公司于今年2月15日发布了一款名为Sora的人工智能视频生成大模型产品，它能够根据用户输入的文字提示生成一分钟内的视频，展现用户想象中的视觉场景...

AIGC动态

1年前 (2024)

多模态大模型有了统一分割框架，华科PSALM多任务登顶，模型代码全开源

最近，多模态大模型（LMM）在视觉-语言任务上取得了显著的进展，尤其是在视觉场景下的应用。然而，将LMM应用于计算机视觉任务，特别是图像分割方面，仍面临挑...

AIGC动态

1年前 (2024)

钛媒体AGI沙龙报名｜Sora爆火50天，中国如何发力多模态大模型？

Sora，美国OpenAI公司最新发布的人工智能视频生成大模型，已经在短时间内引起了广泛关注，并在社交媒体上取得了显著的成功。Sora的推出不仅在技术上超越了以...

AIGC动态

1年前 (2024)

提升生成式零样本学习能力，视觉增强动态语义原型方法入选CVPR 2024

华中科技大学研究生与阿里巴巴旗下银泰商业集团的技术专家提出了一种名为视觉增强的动态语义原型方法（VADS），以提高生成式零样本学习（GZSL）的性能。VADS...

AIGC动态

2年前 (2024)

人大系初创与OpenAI三次“撞车”：类Sora架构一年前已发论文

金磊和衡宇从凹非寺发来的报道揭示了一个引人入胜的故事，关于一家位于中关村的创业公司——智子引擎，以及它与OpenAI技术上的“撞车”事件。这家公司凭借其在多...

AIGC动态

2年前 (2024)

性能超GPT-4！免费使用、支持中文，Claude 3正式发布

文章主要介绍了Anthropic公司在3月4日晚在其官网上正式发布了Claude 3系列的多模态大模型，包括Haiku、Sonnet和Opus三个版本。根据评测报告显示，Opus在多个...

AIGC动态

2年前 (2024)

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

摘要：2023年，多模态大语言模型（MLLM）在文本、代码、图像、视频等领域取得了显著进展。上海人工智能实验室联合多所大学发布了一份详尽的评测报告，对GPT-4...

AIGC动态

2年前 (2024)

“国家队”入局，多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资

联汇科技近日宣布完成数亿元战略融资，投资方包括中国移动产业链发展基金中移和创投资等。本轮融资将用于多模态大模型及自主智能体的技术研发、产品创新及市...

AIGC动态

2年前 (2024)

标签：多模态大模型

字节发布视觉基础模型ViTamin，多项任务实现SOTA，入选CVPR2024

荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布

【最后一天报名】Sora爆火50天，中国如何发力多模态大模型？｜钛媒体AGI沙龙

多模态大模型有了统一分割框架，华科PSALM多任务登顶，模型代码全开源

钛媒体AGI沙龙报名｜Sora爆火50天，中国如何发力多模态大模型？

提升生成式零样本学习能力，视觉增强动态语义原型方法入选CVPR 2024

人大系初创与OpenAI三次“撞车”：类Sora架构一年前已发论文

性能超GPT-4！免费使用、支持中文，Claude 3正式发布

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

“国家队”入局，多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资

热门网址

标签：多模态大模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址