让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻

AIGC动态3个月前发布 AIera
608 0 0
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻

 

文章摘要


【关 键 词】 人工智能CoE架构推理能力思维链多模型协作

新智元报道了一项在人工智能领域的重要进展,即360公司采用的CoE(Collaboration of Experts)架构与OpenAI的o1模型在技术上的相似之处。o1模型以其卓越的推理能力在人工智能领域引起了广泛关注,尤其在代码生成和STEM学科问题解决方面表现出色。o1的成功归功于其背后的思维链(Chain-of-Thought,CoT)技术,这是一种通过逐步推理来解决问题的方法。

360公司的CoE架构与o1的思维链模式有着异曲同工之妙。360的创始人周鸿祎在ISC.AI大会上提出了“快思考”与“慢思考”的概念,其中“慢思考”强调了逻辑性、有意识的思考过程,与o1的CoT技术相呼应。360的CoE架构通过多个大模型的协作,实现了类似的“慢思考”推理模式,提高了模型的泛化性、鲁棒性、可解释性和推理效率。

CoE架构的一个关键优势在于其能够实现多模型的分工协作和并行工作,这与MoE(Mixture-of-Experts)架构相比,后者每次推理只能调用一个专家模型,并且高度依赖于路由分配机制。360的CoE架构通过集成一个主干LLM和多个CoE层,每层包含不同领域的专家模型,实现了更好的性能和资源利用效率。

在实际应用方面,360的CoE架构已经在其AI搜索和360AI浏览器等产品中得到应用,并且在翻译、写作等12项指标的测试中取得了优异的成绩,超越了GPT-4o。360AI搜索的增速和访问量也证明了其在市场上的受欢迎程度。

总的来说,360公司的CoE架构不仅在技术上与OpenAI的o1模型相媲美,而且在实际应用中也展现出了强大的潜力和价值。通过多个大模型的协作,CoE架构有望在人工智能领域实现更大的突破。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2074字 | 9分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...