文章摘要
【关 键 词】 乒乓球赛、AI机器人、AlphaPong、技术突破、人机对抗
2024年巴黎奥运会上,中国乒乓球队再次展现了其卓越的实力,男团和女团均成功晋级决赛。与此同时,DeepMind的研究人员开发出了一款名为“AlphaPong”的AI机器人乒乓球手,它结合了ABB IRB 1100工业机械手臂和DeepMind的定制AI软件。尽管人类专业运动员在技术上仍然占据优势,但这款AI机器人在处理复杂物理任务时表现出了出色的瞬间决策和适应能力。
AlphaPong的研发团队由David B. D’Ambrosio、Saminda Abeyruwan和Laura Graesser等专家组成。在与不同技能水平的人类选手进行的一系列对抗赛中,AlphaPong取得了45%的胜率,显示出了扎实的业余水平球技。特别值得注意的是,它在与初学者的比赛中取得了100%的胜率,在与中级选手的比赛中胜率也达到了55%。然而,它在与高级选手的对抗中尚未准备好,每次都败下阵来。
AlphaPong的物理配置包括一台6自由度的IRB 1100机械臂,安装在两条线性轨道上,使其能够在2D平面上自由移动。高速摄像机用于跟踪球的位置,动作捕捉系统则观察人类对手的球拍动作。DeepMind研究人员开发了一种两级方法,使机器人能够执行特定的乒乓球战术,并根据每位对手的打法实时调整策略。这种适应性使其能够与任何业余级别的乒乓球选手比赛,无需针对不同球员接受特定训练。
AlphaPong的关键创新之一在于AI模型的具体训练方法。研究人员采用了一种混合方法,在模拟物理环境中使用强化学习,同时将现实世界的实例作为训练数据来源。这使得机器人能够从约1.75万种真实存在的乒乓球飞行轨迹中学习。研究人员还使用迭代过程来完善机器人的技能,从小批量人机对战数据集开始,然后让AI与真实对手较量。每场比赛都会生成关于小球飞行轨迹与人类策略的新数据,这些数据被反馈到模拟中以进行进一步训练。
尽管AlphaPong在模拟环境中能够准确地模拟乒乓球比赛的物理特性,但在现实世界中,它在处理速度极快的球、高球以及剧烈的球体旋转方面表现不佳,反手比赛中也较弱。然而,谷歌DeepMind研究团队正在优化解决这些不足之处,包括研究先进的控制算法和硬件优化,探索预测模型来预测球的轨迹,或在机器人的传感器和执行器之间实现更快的通信协议。
除了技术成就外,谷歌的研究还探索了人类与AI选手之间的对抗体验。令人惊讶的是,即使输给了乒乓球机器人智能体,人类选手仍然表示非常享受这种比赛体验。这种积极的反响表明,AI在体育训练和娱乐方面具有广阔的潜在应用空间。
谷歌DeepMind研究团队强调,随着成果的进一步完善,他们相信AlphaPong未来有望与高水平乒乓球运动员一较高下。此外,为该项目开发出的技术完全可以应用于各种需要快速反应并适应人类不可预测行为的机器人任务,包括制造业和医疗保健等领域。
原文和模型
【原文链接】 阅读原文 [ 3293字 | 14分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★