超强实体ChatGPT机器人:语音推理、视觉识别,“终结者”来啦!

AIGC动态4个月前发布 AIGCOPEN
935 0 0
超强实体ChatGPT机器人:语音推理、视觉识别,“终结者”来啦!

 

文章摘要


【关 键 词】 实体机器人多模态模型视觉识别人体骨骼手智能自动化

Figure.AI联合创始人Brett Adcock发布了新一代实体机器人Figure 02,该机器人在前一代01的基础上进行了软硬件的大量更新。Figure 02搭载了6个RGB摄像头、OpenAI的多模态大模型、第四代人体骨骼手、外骨骼结构、更智能的语音推理模式和VLM视觉识别等先进技术。

Figure 02的语音推理模式是其主要特色之一,通过板载麦克风、扬声器和OpenAI的多模态模型,实现了类似人类的多轮深度语音对话。这在仓储、家务等业务场景中具有很大的帮助,使机器人能够准确执行各种操作。随着用户与机器人互动的增加,Figure 02能够不断优化对话策略,学习用户的偏好和习惯,提供更加个性化的语音交流。

Figure 02的视觉模型充当了“眼睛”的作用,搭载了6个RGB摄像头,分别位于头部、前躯干和后躯干,实现了多角度视觉识别。摄像头捕获的图像数据会交给视觉模型进行实时分析,快速响应环境中的变化,如障碍物、路径变化和取货物体等。

第四代人体骨骼手是Figure 02的另一大亮点,每个手指和手腕都设计有多个关节,共提供了16个自由度。这使得手部能够执行复杂而精细的动作,模仿了人类手部的自然运动范围。Figure 02的手指可以牢固地抓住物体,同时避免损坏脆弱物品,在工业生产和服务领域具有广泛的应用前景。

为了提高机器人的耐用性和抗冲击能力,Figure 02采用了外骨骼结构。与第一代01版本相比,Figure 02的外骨骼在结构设计、材料选择和制造工艺等方面都进行了大量更新,具有更好的受力和缓解能力。

Figure 02还采用了集成布线技术,将电源线和数据线整合到单一的电缆中,减少了连接点的数量,降低了故障风险。同时,电线被隐藏在机器人的内部结构中,实现了布线的隐蔽性,保护了电线不受外部环境的影响。

在硬件方面,Figure 02使用了最新的AI芯片,算力和推理能力提升了3倍,使其能够自动完成更多复杂和困难的任务。为了充分发挥GPU和CPU的性能,Figure 02对其软件系统进行了深度优化,包括内存管理、任务调度和I/O处理等多个方面,确保了数据在CPU和GPU之间的高效传输和处理。

目前,宝马已经在实际制造业务中使用了Figure系列实体机器人。随着新一代Figure 02的推出,预计将有更多工厂采用这种多模态、高性能的机器人,以提高生产效率和降低人工成本。Figure 02的问世标志着实体机器人技术的又一重要突破,为未来的智能自动化和人工智能应用开辟了更广阔的前景。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2253字 | 10分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...