标签:计算机视觉

谢赛宁团队用RAE实现从8%到84%的飞跃,宣告VAE时代结束

谢赛宁团队提出的表征自编码器(RAE)架构在图像生成领域取得重大突破,将ImageNet图像生成的FID指标提升至1.13,标志着传统变分自编码器(VAE)时代的终结。...

ICLR 2026惊现SAM 3,分割一切的下一步:让模型理解「概念」

Meta的研究团队可能推出了「Segment Anything」系列的最新版本SAM 3,相关匿名论文已提交至ICLR 2026。该论文提出了「可提示概念分割」(PCS)任务,通过文本...

吞下17亿图片,Meta最强巨兽DINOv3开源!重新定义CV天花板

Meta训练出70亿参数的「视觉巨兽」DINOv3,通过自监督学习(SSL)训练可生成强大且高分辨率的图像特征,在多个密集预测任务中超越专用解决方案,重新定义计算...

仅需0.7秒单图像实时3D重建,开源扩散模型

单图像3D重建是计算机视觉领域的一项基础且极具挑战的难题,旨在从单一视角的二维图像中恢复出三维物体的形状和结构。学术界和工业界主要探索了两种技术路线...

李飞飞在YC创业学院:从ImageNet到空间智能,AGI的关键转折

李飞飞博士作为计算机视觉领域的先驱,正带领团队探索空间智能这一前沿课题,旨在突破视觉智能的二维限制,迈向理解和重建三维世界的未来。她认为,空间智能...

招生信息 | 英国莱斯特大学举雅琨老师招收博士生了!

举雅琨博士自2024年起任职于英国莱斯特大学计算机与数学科学学院,担任助理教授。他长期致力于计算机视觉与图像处理领域的研究,尤其在三维重建、光度立体、...

独家丨前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

胡瀚,前微软亚洲研究院视觉计算组首席研究员,已加入腾讯,接替刘威负责多模态大模型研发。胡瀚清华大学本科及博士学位,师从周杰教授,博士论文获2016年中...

中国首次!高文院士获得 IEEE 社会基础设施创新奖

中国工程院院士高文因其在高性能人工智能计算基础设施和高效视频编码领域的杰出贡献,荣获2025年度IEEE社会基础设施创新奖,成为首位获此殊荣的中国科学家。...

李飞飞:World Labs这样实现「空间智能」

斯坦福大学教授李飞飞因其在人工智能领域的贡献而广为人知,尤其是她对“空间智能”的提倡,这一概念正在成为AI发展的新方向。李飞飞在深度学习革命中扮演了关...

SIGGRAPH Asia 2024:传统与创新并存,3D 生成与具身智能热度上升

第十七届SIGGRAPH Asia大会在东京闭幕,主题为“Curious Minds”,创下注册人数和论文投稿数的历史新高。华人学者表现亮眼,计算机视觉学界分为新兴派和传统派...
1 2 3