对话智源研究院院长：我们距离 AGI 还有多远

AI-Agent1年前 (2024)发布 geekpark

2,549 0 0

文章摘要

北京智源人工智能研究院在第六届北京智源大会上分享了关于通用人工智能（AGI）的最新进展和见解。智源研究院院长王仲远认为，基于大模型的人工智能技术实现AGI可能仅需四五年时间。他提出，自回归模型（auto regressive）相比DiT（决策转换）模型，是实现AGI的终极技术路线。未来，大模型将与智能硬件融合，形成数字智能体，进入物理世界，同时为科学研究提供新的知识表达方式，加速对微观物理世界规律的探索。

智源研究院在大会上发布了语言、多模态、具身、生物计算大模型的前沿探索和研究进展，以及大模型全栈开源技术基座的迭代升级与版图布局。王仲远在媒体访问中讨论了大模型价格战的影响，认为适度降价有利于开发者尝试和接入大模型，但过低的价格可能不利于大模型的持续迭代和优化。他强调，开发者应优先考虑模型的实际效果而非性价比。

王仲远预测，未来两三年内将出现大量应用，B端应用将覆盖所有行业，C端应用则需保持耐心，等待技术成熟。他特别提到智能体（Agent）可能成为C端应用的重要方向，成为真正意义上的智能助理。关于大模型在手机上的应用，他认为目前仍处于早期阶段，需要硬件和软件的进一步提升。

在具身智能和机器人领域，智源研究院发布了智能超声机器人和生物计算法模型，聚焦医疗领域。王仲远认为，具身智能将与世界模型相互促进，实现AGI。智源研究院将继续在具身智能领域进行技术突破和创新。

关于多模态大模型的技术路线，王仲远认为自回归模型在整合不同模态方面具有重要意义，是实现AGI的关键。智源研究院正在训练中的Emu 3模型旨在实现原生多模态世界模型。他强调，虽然这条技术路线非常困难，但智源研究院致力于探索多模态技术的终极路线。

王仲远还讨论了大模型的理解和推理能力，认为这是AGI的核心。他提到，大模型的Scaling Law（随着模型参数、训练数据和计算量的增加，模型性能显著提升）是近年来人工智能领域的重要突破。智源研究院期待大模型在推理能力上的持续提升，实现像人类一样的思考和理解。

总之，北京智源人工智能研究院在通用人工智能领域取得了显著进展，特别是在大模型技术、具身智能和多模态大模型方面。王仲远对AGI的实现持乐观态度，并强调了自回归模型在实现AGI中的关键作用。同时，他也提醒业界要保持理性，认识到技术发展需要时间，特别是在具身智能和C端应用领域。智源研究院将继续在这些领域进行技术创新和突破，推动人工智能技术的发展。