模型信息
【模型公司】 OpenAI
【模型名称】 gpt-3.5-turbo-0125
【摘要评分】 ★★★☆☆
文章摘要
【关 键 词】 机器人、动作表现、视觉语言、智能技术、自动化
这篇文章介绍了一款名为Figure 01的机器人,它是由OpenAI大模型加持的,具备听、说、动作灵活等功能。机器人可以描述眼前的场景并做出相应反应,比如听到人类说想吃东西就会递过去苹果。这款机器人展示了出色的动作表现,能够同时处理两种任务,而且所有动作都是原始速度,没有加速。Figure 01通过OpenAI提供的视觉语言大模型实现了快速、简单、灵巧的动作,具备规划动作、短期记忆、推理等能力。机器人的设计和控制涉及了多个方面,包括视觉语言模型、全身控制器、文本-语音大模型等。Figure公司在与OpenAI的合作中取得了重要进展,引发了外界的广泛关注和期待。该公司的愿景是将人形机器人带入生活,通过具身智能技术实现人类劳动的自动化。最新进展显示,Figure 01在短时间内通过训练学会了泡咖啡,展示了快速发展和持续创新的潜力。
原文信息
【原文链接】 阅读原文
【阅读预估】 1194 / 5分钟
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...