李飞飞的初创公司推出首个项目,可通过单张照片生成交互式3D场景
文章摘要
【关 键 词】 人工智能、3D场景、交互体验、物理模拟、风险投资
由人工智能领域的先驱李飞飞创立的初创公司World Labs推出了一款创新的人工智能系统,该系统能够将单张图片转换成可交互、可探索的3D场景。这一技术突破使得用户能够进入图片中的3D空间进行探索,所有生成的内容除了输入的图片外均为系统自动生成。World Labs的系统允许用户通过键盘和鼠标在浏览器中实时体验这些3D场景,场景具有可调节的模拟景深和可控制的相机,提供了一种新的互动方式。
World Labs的技术属于新兴的“世界模型”类别,这类模型能够模拟游戏和3D环境,但通常存在伪影和一致性问题。与此相比,World Labs的方法确保一旦场景生成,它将保持不变并遵循基本物理法则,从而提供坚实的感觉和深度感。此外,该系统还能够将交互式效果和动画应用于场景,如改变物体颜色和动态照明背景。
尽管大多数生成式AI工具制作的是2D内容,World Labs的3D生成技术提高了控制性和一致性,预示着这将改变制作电影、游戏、模拟器以及其他数字化物理世界的方式。尽管目前World Labs的场景探索范围有限,偶尔也会出现渲染错误,但公司表示这只是一个早期预览,并正在努力提升生成世界的规模和逼真度,同时探索新的互动方式。
World Labs已经从包括Andreessen Horowitz、Ashton Kutcher、英特尔资本、AMD Ventures和Eric Schmidt在内的投资者那里筹集了2.3亿美元的风险投资,公司估值超过10亿美元,并计划在2025年推出首款产品。除了互动场景,World Labs还计划开发对专业人士如艺术家、设计师、开发者、电影制作人和工程师有用的工具,目标客户包括视频游戏开发者和电影制作公司。联合创始人Justin Johnson强调,世界模型技术将使人们能够获得一个完全模拟的、生动的、互动的3D世界,而不仅仅是一张图片或一个片段。
原文和模型
【原文链接】 阅读原文 [ 982字 | 4分钟 ]
【原文作者】 AI大模型实验室
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆