理财AI勇闯「无人区」:理解专家、成为专家

AI-Agent7个月前发布 almosthuman2014
1,174 0 0
理财AI勇闯「无人区」:理解专家、成为专家

 

文章摘要


【关 键 词】 AI理财智能助理投顾服务技术进步用户需求

蚂蚁财富在服务数亿用户的过程中发现,尽管有5亿活跃用户可以轻松接触到各类理财产品,但真正理财行为成熟的用户仅占两成。
在中国7.2亿基金投资者中,每3600人才能分到1位传统理财顾问,导致许多普通投资者处于专业服务的”无人区”。
为了填补这一空白,2020年蚂蚁财富推出了AI理财助理支小宝,希望利用技术进步满足用户对专业服务的需求。

支小宝的底层技术包括面向严谨应用定制的凤凰大模型Finix和模仿专家思考和工作流程的agentUniverse专业智能体框架。
通过这三层技术,支小宝能够提供有效的投顾服务
在金价狂飙时,支小宝发出了上万次理性投资提醒,帮助许多盲目跟风的投资者冷静下来。
支小宝的回答不仅通俗易懂,而且综合了平台上多家基金公司的共识和分歧,以及个人持仓情况。

支小宝的技术发展分为两层:一是模仿专家理解用户,二是主动服务用户,成为专家。
在模仿专家方面,支小宝通过多智能体框架,让多个Agent各司其职,协同推理用户的真实意图。
这种新的解题模式与传统方式不同,系统不是直接做出判断,而是沿着分歧的”枝条”、”分叉”推理各种可能。
即便个别Agent判断失误,其他Agent也可以通过协同推理予以纠正,大大提高了系统的鲁棒性。

在成为专家方面,支小宝不仅被动解答问题,还能主动搭话,引导用户进入下一个服务场景。
例如,在用户查看基金持仓时,支小宝会主动询问是否需要解读涨跌或调整持仓。
这种多轮沟通的能力是破解金融服务难题的关键。
技术团队利用大模型压缩海量知识和专家智能体引入行业专家的SOP,让支小宝学会预测用户下一步最可能需要什么。

为了向专家对齐,支小宝的技术团队采用了监督微调和基于人类反馈的强化学习,明确指示模型应该完成哪些任务,以及如何以人类偏好的标准完成这些任务。
在监督微调阶段,技术团队从多个维度拆解”严谨”,为不同任务场景准备数据集,教会支小宝如何严谨地处理数字、观点、实体等。
在基于人类反馈的强化学习环节,进一步训练大模型对严谨性和专业性的自发遵从。

技术团队还构建了金融能力指令集,借鉴布鲁姆模型,将能力培养划分为记忆、理解、应用、分析、评价、创造等递进阶段,并据此设计训练任务。
在数据标注上,蚂蚁财富投入了大量精力和资源,组建了具有专业标注能力的团队,确保支小宝能够在复杂的金融领域游刃有余。

总之,支小宝作为AI理财助理,在理解专家和成为专家方面取得了显著进步。
通过多智能体框架、大模型技术和专家对齐训练,支小宝能够提供更专业、更准确的投顾服务,帮助普通投资者在专业服务的”无人区”中找到方向。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 5148字 | 21分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...