只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型

AIGC动态4个月前发布 geekpark
734 0 0

模型信息


【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★★★

只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
 

文章摘要


【关 键 词】 机器人技术智能大脑多模态端到端AI投资

资深机器人专家Eric Jang曾预言,有智慧的机器人技术将像ChatGPT一样迅速出现。近日,OpenAI与机器人公司Figure的合作展示了这一预言的实现。Figure上传了一段人形机器人视频,展示了与人类流畅对话、理解意图、执行自然语言指令并解释原因的能力。这段视频展示了OpenAI为其配置的智能大脑,仅用13天时间就实现了这一成果。

Figure人形机器人的智能来自于端到端大语言-视觉模型,这是具身智能领域的前沿技术。与谷歌的机器人模型相比,Figure的机器人不仅能抓取物品,还能与人类对话并解释自己的行为。这一突破由OpenAIFigure共同完成,OpenAI负责视觉推理和语言理解,而Figure的神经网络提供快速、低水平、灵巧的机器人动作。机器人的所有行为都是基于已学习的能力,而非远程操作。

OpenAI的模型多模态能力使机器人能够与世界交互,例如描述周围环境、使用常识推理、将高级请求转化为具体行为等。机器人的双手动作由互联网预训练模型进行常识推理,形成高级计划,然后由大模型生成24-DOF动作。这种端到端的机器人控制使机器人速度显著提高,接近人类速度。

OpenAI曾在2021年夏天关闭机器人团队,但并未放弃对这一领域的关注。2023年3月,OpenAI投资了挪威机器人制造商1X Technologies,并在今年3月初参与了Figure的B轮融资。Figure的创始人Brett Adcock招募了多位硬核设计人才,并在电机、固件、热量等方面取得了进展。公司已与宝马签署商业协议,将AI和机器人技术整合到汽车生产中。

尽管OpenAIFigure的合作进展顺利,但OpenAI并未将全部精力投入一家机器人公司。最近,新成立的机器人AI公司Physical Intelligence也获得了OpenAI的融资。OpenAI在机器人领域的意图引人关注,智能人形机器人的未来将不仅限于马斯克的公司。

原文信息


【原文链接】 阅读原文
【阅读预估】 2482 / 10分钟
【原文作者】 极客公园
【作者简介】 用极客视角,追踪你最不可错过的科技圈。欢迎关注播客(小宇宙App)👉开始连接LinkStart

© 版权声明
讯飞星火大模型

相关文章

星火内容运营大师

暂无评论

暂无评论...