文章摘要
【关 键 词】 大模型、AI推理、多模合作、思维链、专家协同
OpenAI的o1模型引领了大模型发展的新趋势,即从训练阶段转向推理过程的投入,这一转变得到了英伟达AI科学家Jim Fan的认同。他引用了机器学习先驱Rich Sutton的观点,强调学习和搜索是AI计算潜能扩展的关键技术。在国内,360公司创始人周鸿祎提出了“慢思考”理念,并在技术架构和产品中实践,强调多模合作,推动国内模型追赶OpenAI。
o1模型的推理能力得益于思维链(Chain of Thought, CoT)的运用,它使模型能够识别并纠正错误,分解复杂步骤,并尝试不同方法。这一概念与诺贝尔经济学奖得主卡尼曼在《思考快与慢》中提出的“系统2”或“慢思考”系统相呼应。周鸿祎认为o1可能遵循的是“双系统理论”,即快慢系统的协同运作。
360公司通过“多系统协同”机制,实现了大模型从“快思考”到“慢思考”的转变,并推出了360AI搜索和360AI浏览器两款产品。360AI搜索通过多种模式提供深入回答,涉及多次大模型调用,形成工作链路,包括意图识别、任务路由和AI工作流构建。360AI浏览器则集成了多家厂商的大模型,具备多种传统浏览器不具备的能力,如快速总结英文学术论文、沉浸式翻译PDF文档等。
360的CoE(Collaboration-of-Experts,专家协同)架构是连接理念与产品的桥梁,它集合了更多的大模型和专家模型,通过思维链和多系统协同实现了快慢思考的结合。CoE架构的混合大模型在多项指标测试中超越了GPT-4o,展现了其强大的能力。
360的AI产品和CoE架构不仅提升了用户体验,也为大模型开发者提供了触达10亿用户的平台,促进了模型与AI应用的相互发展。模型竞技场为国产大模型提供了学习和竞争的平台,塑造了积极进取的氛围。
最后,360的AI发展愿景是实现AI的普惠,让大模型更加亲民,减少人工环节,实现自动化,从而“消灭”Prompt工程,使大模型更加易于普通用户使用。
原文和模型
【原文链接】 阅读原文 [ 2560字 | 11分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★