李飞飞:World Labs这样实现「空间智能」
文章摘要
【关 键 词】 人工智能、空间智能、深度学习、计算机视觉、三维世界
斯坦福大学教授李飞飞因其在人工智能领域的贡献而广为人知,尤其是她对“空间智能”的提倡,这一概念正在成为AI发展的新方向。李飞飞在深度学习革命中扮演了关键角色,通过创建ImageNet数据集和竞赛推动了神经网络的发展。随着计算机视觉研究者从物体识别转向图像和视频生成,李飞飞与他人共同创办了斯坦福大学以人为本人工智能研究所(HAI),并在今年成立了初创公司World Labs,专注于为AI提供空间智能,即在三维世界中生成、推理和互动的能力。
在人工智能顶会NeurIPS上,李飞飞发表了主题演讲,分享了她对机器视觉的愿景,并在演讲前接受了IEEE Spectrum的采访。她将演讲命名为“提升视觉智能的阶梯”,强调智能的多层次复杂性,并受到Judea Pearl因果阶梯理论的启发。李飞飞认为,从看到到做到的转变是智能发展的关键,这与语言作为交流工具的智能模式相辅相成。
李飞飞进一步解释,感知的演变和动物智能的演变是深深交织在一起的,能够从环境中获取更多信息的能力推动了智能的发展。她认为,解决空间智能问题对于实现全面智能是一个基本且关键的步骤。World Labs的目标是构建3D世界,因为世界是三维的,而我们的物理智能体将生活在三维世界中。她强调,一旦遵循世界的3D特性,很多事情就会变得自然而然,例如在3D场景中,物体会根据物理规则正确地与环境互动。
李飞飞还提到,World Labs的技术挑战包括保持物体永久性并遵守物理定律,这需要大量的算力,是公共部门难以承担的。她倡导公共部门获得计算资源访问权,并强调知识发现需要资源支持。她希望联邦政府能提供资源,以支持公共部门的创新和知识发现。
最后,李飞飞展望了人工智能系统真正理解3D世界后可能带来的影响,包括释放人们的创造力和生产力,以及在医疗、机器人导航、虚拟世界和增强现实等领域的应用。她认为,这些技术进步将在我们这一代人的时间里实现。
原文和模型
【原文链接】 阅读原文 [ 2441字 | 10分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★