超强实体ChatGPT机器人：语音推理、视觉识别，“终结者”来啦！

AIGC动态1年前 (2024)发布 AIGCOPEN

2,579 0 0

文章摘要

Figure.AI联合创始人Brett Adcock发布了新一代实体机器人Figure 02，该机器人在前一代01的基础上进行了软硬件的大量更新。Figure 02搭载了6个RGB摄像头、OpenAI的多模态大模型、第四代人体骨骼手、外骨骼结构、更智能的语音推理模式和VLM视觉识别等先进技术。

Figure 02的语音推理模式是其主要特色之一，通过板载麦克风、扬声器和OpenAI的多模态模型，实现了类似人类的多轮深度语音对话。这在仓储、家务等业务场景中具有很大的帮助，使机器人能够准确执行各种操作。随着用户与机器人互动的增加，Figure 02能够不断优化对话策略，学习用户的偏好和习惯，提供更加个性化的语音交流。

Figure 02的视觉模型充当了“眼睛”的作用，搭载了6个RGB摄像头，分别位于头部、前躯干和后躯干，实现了多角度视觉识别。摄像头捕获的图像数据会交给视觉模型进行实时分析，快速响应环境中的变化，如障碍物、路径变化和取货物体等。

第四代人体骨骼手是Figure 02的另一大亮点，每个手指和手腕都设计有多个关节，共提供了16个自由度。这使得手部能够执行复杂而精细的动作，模仿了人类手部的自然运动范围。Figure 02的手指可以牢固地抓住物体，同时避免损坏脆弱物品，在工业生产和服务领域具有广泛的应用前景。

为了提高机器人的耐用性和抗冲击能力，Figure 02采用了外骨骼结构。与第一代01版本相比，Figure 02的外骨骼在结构设计、材料选择和制造工艺等方面都进行了大量更新，具有更好的受力和缓解能力。

Figure 02还采用了集成布线技术，将电源线和数据线整合到单一的电缆中，减少了连接点的数量，降低了故障风险。同时，电线被隐藏在机器人的内部结构中，实现了布线的隐蔽性，保护了电线不受外部环境的影响。

在硬件方面，Figure 02使用了最新的AI芯片，算力和推理能力提升了3倍，使其能够自动完成更多复杂和困难的任务。为了充分发挥GPU和CPU的性能，Figure 02对其软件系统进行了深度优化，包括内存管理、任务调度和I/O处理等多个方面，确保了数据在CPU和GPU之间的高效传输和处理。

目前，宝马已经在实际制造业务中使用了Figure系列实体机器人。随着新一代Figure 02的推出，预计将有更多工厂采用这种多模态、高性能的机器人，以提高生产效率和降低人工成本。Figure 02的问世标志着实体机器人技术的又一重要突破，为未来的智能自动化和人工智能应用开辟了更广阔的前景。