文章摘要
【关 键 词】 AI智能体、深度访谈、行为模拟、开源代码、语言模型
斯坦福大学的研究团队通过深度访谈1052名参与者,创建了1000多个AI智能体,这些智能体能够以85%的准确度模拟真实人类的行为和态度。这项研究采用了生成式智能体,通过访谈内容作为输入,复刻出每个个体对应的AI智能体。这些智能体在综合社会调查中的回答准确率接近85%,与原参与者自我复现答案的准确率相当,并在人格预测、实验复制中表现与人类相当。
研究团队开发了AI面试官,完成了2小时的语音访谈,生成的录音平均长度为6,491个单词。访谈内容涵盖了参与者的生活故事、社会问题看法等多个方面。基于这些访谈数据,研究者创建了生成式智能体,并通过综合社会调查、大五人格测试、经济博弈和社会科学实验来评估智能体模拟人类的准确性。
结果显示,基于访谈的生成式智能体在预测个体态度、特质和行为方面表现出色,与基于人口统计描述的智能体相比,减少了准确性偏差。这项研究为模拟个体开辟了新的可能性,标志着生成式AI可以代表真实人类的时代正式开启。研究者已将开源存储库和用于这项工作的Python包上传到Github,包括他本人的智能体。
为了创建一个合格的AI访谈员,研究者设计了一种访谈架构,让研究者能控制访谈的整体内容和结构,同时允许智能体有一定的自由度来探索采访脚本中硬编码的后续问题。AI访谈员将被试的话语和访谈脚本作为输入,以后续问题的形式生成下一步行动,或决定使用语言模型继续下一个问题模块。反思模块有助于架构从正在进行的访谈中简洁地总结和推断见解,使智能体更有效地生成后续问题。
生成式AI之所以能模拟人类行为,是因为语言模型能提供支持,然后通过一组记忆来定义其行为。这些记忆以文本形式存储在数据库中,在需要时被检索出来,通过语言模型生成智能体的行为。同时,系统配备一个反思模块,将这些记忆综合为反思内容,从智能体记忆中的部分或全部文本中选择内容,以提示语言模型推导出有用的见解,从而增强智能体行为的可信度。
原文和模型
【原文链接】 阅读原文 [ 5608字 | 23分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★