斯坦福开源学术研究神器STORM再进化，AI智能体像人一样进行圆桌讨论

AIGC动态10个月前发布 almosthuman2014

2,438 0 0

文章摘要

【关键词】 STORM工具、大语言模型、协作对话、AI学术研究、思维导图

斯坦福大学推出了一款名为STORM的开源工具，利用大语言模型（LLM）辅助编写类维基百科文章。STORM能在三分钟内将输入的主题转换为长篇文章或研究论文，并支持PDF格式下载。STORM擅长处理需要大量研究和引用的写作任务，用户可在其网站上免费体验。STORM在GitHub上的Star量已超过12k。

最近，STORM团队推出了新功能Co-STORM，引入了协作对话机制和轮次管理策略，实现流畅的协作式AI学术研究。Co-STORM包含LLM专家、主持人和人类用户三种角色。LLM专家根据外部知识生成答案并提出后续问题；主持人根据未直接使用的信息生成问题；人类用户观察对话或引导讨论焦点。Co-STORM界面支持用户与AI智能体进行多轮对话，生成文章。

Co-STORM的论文已被EMNLP 2024主会议收录。Co-STORM框架模拟用户、观点引导专家和主持人之间的协作对话。它维护动态更新的思维导图，帮助用户跟踪对话；模拟专家根据对话历史生成问题或答案；模拟主持人利用未使用信息生成新问题，引导对话。思维导图可用于生成完整的引用报告。

评估结果显示，Co-STORM在报告质量和对话轮次质量方面优于基线方法RAG Chatbot和STORM+QA。Co-STORM通过模拟具有多个智能体角色的协作对话，提高了报告的深度和新颖性。其问答轮次在一致性和参与度方面也优于基线。Co-STORM的关键特性是LM智能体可以代表用户提问，主持人角色会根据未使用信息提出问题，引导对话发现更多信息。

人工评分和成对比较结果表明，Co-STORM可以帮助用户找到与其目标相关的更广泛、更深层次的信息。更多技术细节和评估结果可以参考原论文。