斯坦福开源学术研究神器STORM再进化,AI智能体像人一样进行圆桌讨论
文章摘要
【关 键 词】 STORM工具、大语言模型、协作对话、AI学术研究、思维导图
斯坦福大学推出了一款名为STORM的开源工具,利用大语言模型(LLM)辅助编写类维基百科文章。STORM能在三分钟内将输入的主题转换为长篇文章或研究论文,并支持PDF格式下载。STORM擅长处理需要大量研究和引用的写作任务,用户可在其网站上免费体验。STORM在GitHub上的Star量已超过12k。
最近,STORM团队推出了新功能Co-STORM,引入了协作对话机制和轮次管理策略,实现流畅的协作式AI学术研究。Co-STORM包含LLM专家、主持人和人类用户三种角色。LLM专家根据外部知识生成答案并提出后续问题;主持人根据未直接使用的信息生成问题;人类用户观察对话或引导讨论焦点。Co-STORM界面支持用户与AI智能体进行多轮对话,生成文章。
Co-STORM的论文已被EMNLP 2024主会议收录。Co-STORM框架模拟用户、观点引导专家和主持人之间的协作对话。它维护动态更新的思维导图,帮助用户跟踪对话;模拟专家根据对话历史生成问题或答案;模拟主持人利用未使用信息生成新问题,引导对话。思维导图可用于生成完整的引用报告。
评估结果显示,Co-STORM在报告质量和对话轮次质量方面优于基线方法RAG Chatbot和STORM+QA。Co-STORM通过模拟具有多个智能体角色的协作对话,提高了报告的深度和新颖性。其问答轮次在一致性和参与度方面也优于基线。Co-STORM的关键特性是LM智能体可以代表用户提问,主持人角色会根据未使用信息提出问题,引导对话发现更多信息。
人工评分和成对比较结果表明,Co-STORM可以帮助用户找到与其目标相关的更广泛、更深层次的信息。更多技术细节和评估结果可以参考原论文。
原文和模型
【原文链接】 阅读原文 [ 1234字 | 5分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆