OpenAI o1式思维链，开源模型也可以有，成功案例来了

AIGC动态11个月前发布 almosthuman2014

2,361 0 0

文章摘要

【关键词】 推理技术、Llamaberry、多轮推理、AI助手、g1项目

OpenAI于9月13日推出了推理性能强大的ο1系列模型，引发了研究者们对其技术原理的深入探索和尝试复现。尽管OpenAI采取了措施保护模型，但研究者们在短短几天内便宣称成功复现了类似性能的推理技术。

Llamaberry项目由Martin Bowling提出，旨在通过思维链（Chain of Thought, CoT）方法提升AI的推理能力。Bowling是RAGMiner.dev和Replit项目的开发者，前者能将网站内容转换为Markdown、XML或JSON格式，后者则利用AI将想法转化为代码。Llamaberry的核心是多轮思维链推理系统，基于Groq上的Llama 3.1 70B模型。

多轮推理允许模型在给出答案前进行多步思考，类似于大厨烹饪一道菜肴的过程。例如，AI首先尝试解决问题，然后回顾并改进思维过程，最后综合所有思考得到答案。这一过程通过将前一轮的输出作为后一轮的输入，使AI能够在每个阶段完善其思维。

Llamaberry的实现细节包括设置基本规则、进行多轮推理和综合结果。AI助手被要求逐步分解思考过程并解释每个步骤，最终以Markdown格式展示。在每一轮推理中，AI对问题进行思考，并在后续轮次中回顾之前的思考。经过三轮思考后，AI检视所有思考并得出最终答案。

Bowling在其博客中比较了单轮和多轮推理。单轮推理直接给出答案，而多轮推理则通过多角度分析问题，优化思考，得到更全面的答案。多轮推理在思考深度、自我提升、透明度和灵活性方面具有优势，并且采用Markdown格式，使结果更易于阅读和后续处理。

Llamaberry的使用也很简单，用户可以通过Replit获取模板，创建项目副本，获取Groq API Key，设置环境，运行项目，并在Gradio界面中输入问题以查看多轮推理的效果。

另一个实现类似ο1推理链的项目是g1，由Groq研究者Benjamin Klieger开发，同样基于Groq和Llama 3.1 70b模型。