视觉模型 | 学习AIGC

智谱AI、清华开源新视觉大模型：刷新41项纪录，同级别最强

智谱AI与清华大学联合开源最新视觉大模型GLM - 4.5V，其在多个领域表现卓越。测试数据显示，GLM - 4.5V在42项主流测试中创造41项新记录，尤其在视觉智能体方...

AIGC动态

4周前

Meta刚刚开源DINOv3，横扫60+任务，无标注封神！

今天凌晨，全球社交、科技巨头Meta开源了最新视觉大模型DINOv3，其主要创新在于使用自我监督学习，无需标注数据，能大幅降低训练所需时间和算力资源。- 模型...

AIGC动态

4周前

AI们数不清六根手指，这事没那么简单。

在Grok4发布后，作者在社交媒体上发现了一个有趣的帖子，内容涉及AI模型在识别图像时出现的错误。作者测试了多个多模态模型，包括OpenAI o3、o3 pro、豆包、k...

AIGC动态

2个月前

苹果开源通用视觉模型：创新训练方法，超1000颗星

苹果公司的研究团队最近发布了一款名为AIMv2的通用多模态视觉模型，该模型具有300M、600M、1.2B和2.7B四种参数规模，并且整体能耗低，使其能够适应手机、PC等...

AIGC动态

7个月前

官宣！阿里巴巴确定与苹果合作，为中国iPhone提供AI

技术落地层面，阿里巴巴的AI解决方案已渗透多个场景：Qwen2-Audio在电商客服、跨语言翻译、物流调度等领域验证了实用性；Qwen2.5-VL则拓展了智能终端的人机交...

AIGC动态

7个月前

一篇推文看一年！Jim Fan力荐2025必读清单：50篇论文，扫盲「全领域AI实战」

AI领域的发展日新月异，为了成为AI工程专家，更新论文清单至关重要。目前AI工程技术可分为十个领域，每个领域都有其代表作和相关工作。在前沿大模型领域，Ope...

AIGC动态

8个月前

百度又放大招！视觉生成模型 Hallo2 或将落地数字人等场景

百度与复旦大学联合发布了Hallo2，这是一个创新的视觉模型，能够生成长达数小时、分辨率高达4K的人物动画。Hallo2的发布在海外引起了广泛关注，其开源模型和...

AIGC动态

11个月前

苹果开源视觉模型界的“瑞士军刀”，能执行数十种任务

苹果和瑞士洛桑联邦理工学院的研究人员共同开发了4M-21，一个大规模多模态视觉模型，并于近日开源。该模型以其30亿参数量却能提供包括图像分类、目标检测、语...

AIGC动态

1年前 (2024)

视觉 AI 的「Foundation Model」，已经发展到哪一步？丨CVPR 2024 现场直击

视觉Foundation Model成为会议的核心主题之一。两篇最佳论文均颁给了AIGC，图像和视频合成与生成领域的论文数量达到329篇，位居榜首。上海人工智能实验室的Op...

AIGC动态

1年前 (2024)

超GPT-4o，代码能力超强！Claude 3.5 Sonnet正式发布

这是Claude 3.5系列中的首个模型，也是Anthropic目前最强的视觉模型。Sonnet的性能不仅超过了上一代Claude 3旗舰模型Opus，还大幅度超越了OpenAI的GPT-4o和谷...

AIGC动态

1年前 (2024)

标签：视觉模型

智谱AI、清华开源新视觉大模型：刷新41项纪录，同级别最强

Meta刚刚开源DINOv3，横扫60+任务，无标注封神！

AI们数不清六根手指，这事没那么简单。

苹果开源通用视觉模型：创新训练方法，超1000颗星

官宣！阿里巴巴确定与苹果合作，为中国iPhone提供AI

一篇推文看一年！Jim Fan力荐2025必读清单：50篇论文，扫盲「全领域AI实战」

百度又放大招！视觉生成模型 Hallo2 或将落地数字人等场景

苹果开源视觉模型界的“瑞士军刀”，能执行数十种任务

视觉 AI 的「Foundation Model」，已经发展到哪一步？丨CVPR 2024 现场直击

超GPT-4o，代码能力超强！Claude 3.5 Sonnet正式发布

热门网址

标签：视觉模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址