计算机视觉 | 学习AIGC

西湖大学修宇亮：数字人重建，慢慢都会变成基础模型的微调任务 | GAIR 2025

在第八届GAIR全球人工智能与机器人大会上，西湖大学助理教授修宇亮分享了远兮实验室在高精度数字人重建领域的三项突破性进展。UP2You技术将传统数字人建模时...

AIGC动态

4天前

浙江大学研究员彭思达：底层空间感知技术对训练机器人有何作用？丨GAIR 2025

浙江大学研究员彭思达在GAIR 2025论坛上提出，人类行为数据可作为训练人形机器人的重要资源，通过采集人类日常活动记录，结合空间感知技术解决具身智能领域的...

AIGC动态

5天前

统一视觉多模态与多任务！快手可灵与港科大团队发布视频生成模型，加速真实世界理解

统一多模态多任务的视频生成模型UnityVideo通过整合多种视觉模态，显著提升了模型对物理世界的理解能力和生成质量。该模型由港科大、港中文、清华大学和快手...

AIGC动态

6天前

何恺明NeurIPS 2025演讲盘点：视觉目标检测三十年

NeurIPS 2025会议上，由任少卿、何恺明、Ross Girshick和孙剑合著的《Faster R-CNN》论文荣获'时间检验奖'，这标志着该工作对计算机视觉领域长达十年的深远影...

AIGC动态

1周前

没有哪个 AI 顶会，比雷峰网 GAIR 更能承载「历史与传承」

GAIR全球人工智能与机器人大会通过一系列承前启后的对话，展现了人工智能领域代际传承的独特魅力。2020年的一场圆桌讨论中，沈向洋等人分享了计算机视觉领域...

AIGC动态

3周前

何恺明团队重磅新作：去掉VAE，无需Tokenizer，纯Transformer预测数据比预测噪声更高效

麻省理工学院何恺明团队发布了一项颠覆性研究，直指当前扩散生成模型的核心痛点。研究指出主流模型实际上并没有在做去噪工作，回归最原始的洁净数据预测才是...

AIGC动态

4周前

分割一切并不够，还要3D重建一切，SAM 3D来了

Meta近期发布了SAM 3D和SAM 3两项重大技术更新，标志着计算机视觉领域的新突破。其中，SAM 3D包含两个子模型：SAM 3D Objects专注于物体与场景的3D重建，SAM ...

AIGC动态

1个月前

打破显存墙：谢赛宁团队提出CLM，单卡RTX 4090「撬动」1亿高斯点

3D Gaussian Splatting (3DGS)是一种基于各向异性3D高斯体构建场景表示的新视角合成技术，能够通过带位姿的图像训练快速渲染未见视角，在渲染速度和图像质量...

AIGC动态

1个月前

3D重建的惊人进展：多所世界名校联合发布论文，告诉你AI在3D世界的研究现状

高质量的3D重建技术正经历从逐场景优化到前馈模型的革命性转变。传统方法如运动恢复结构（SfM）和神经辐射场（NeRF）需要针对每个新场景进行耗时数小时至数天...

AIGC动态

1个月前

字节用LLaVA + SAM-2抢先实现了SAM-3，用概念分割，无需位置标注

加州大学默塞德分校、字节跳动Seed团队、武汉大学和北京大学的研究人员成功将LLaVA和SAM-2两个AI模型整合，创造出名为Sa2VA的新型多模态系统。这一突破性成果...

AIGC动态

2个月前

标签：计算机视觉

西湖大学修宇亮：数字人重建，慢慢都会变成基础模型的微调任务 | GAIR 2025

浙江大学研究员彭思达：底层空间感知技术对训练机器人有何作用？丨GAIR 2025

统一视觉多模态与多任务！快手可灵与港科大团队发布视频生成模型，加速真实世界理解

何恺明NeurIPS 2025演讲盘点：视觉目标检测三十年

没有哪个 AI 顶会，比雷峰网 GAIR 更能承载「历史与传承」

何恺明团队重磅新作：去掉VAE，无需Tokenizer，纯Transformer预测数据比预测噪声更高效

分割一切并不够，还要3D重建一切，SAM 3D来了

打破显存墙：谢赛宁团队提出CLM，单卡RTX 4090「撬动」1亿高斯点

3D重建的惊人进展：多所世界名校联合发布论文，告诉你AI在3D世界的研究现状

字节用LLaVA + SAM-2抢先实现了SAM-3，用概念分割，无需位置标注

热门网址

标签：计算机视觉

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址