理财AI勇闯「无人区」：理解专家、成为专家

AI-Agent1年前 (2024)发布 almosthuman2014

2,355 0 0

文章摘要

蚂蚁财富在服务数亿用户的过程中发现，尽管有5亿活跃用户可以轻松接触到各类理财产品，但真正理财行为成熟的用户仅占两成。
在中国7.2亿基金投资者中，每3600人才能分到1位传统理财顾问，导致许多普通投资者处于专业服务的”无人区”。
为了填补这一空白，2020年蚂蚁财富推出了AI理财助理支小宝，希望利用技术进步满足用户对专业服务的需求。

支小宝的底层技术包括面向严谨应用定制的凤凰大模型Finix和模仿专家思考和工作流程的agentUniverse专业智能体框架。
通过这三层技术，支小宝能够提供有效的投顾服务。
在金价狂飙时，支小宝发出了上万次理性投资提醒，帮助许多盲目跟风的投资者冷静下来。
支小宝的回答不仅通俗易懂，而且综合了平台上多家基金公司的共识和分歧，以及个人持仓情况。

支小宝的技术发展分为两层：一是模仿专家理解用户，二是主动服务用户，成为专家。
在模仿专家方面，支小宝通过多智能体框架，让多个Agent各司其职，协同推理用户的真实意图。
这种新的解题模式与传统方式不同，系统不是直接做出判断，而是沿着分歧的”枝条”、”分叉”推理各种可能。
即便个别Agent判断失误，其他Agent也可以通过协同推理予以纠正，大大提高了系统的鲁棒性。

在成为专家方面，支小宝不仅被动解答问题，还能主动搭话，引导用户进入下一个服务场景。
例如，在用户查看基金持仓时，支小宝会主动询问是否需要解读涨跌或调整持仓。
这种多轮沟通的能力是破解金融服务难题的关键。
技术团队利用大模型压缩海量知识和专家智能体引入行业专家的SOP，让支小宝学会预测用户下一步最可能需要什么。

为了向专家对齐，支小宝的技术团队采用了监督微调和基于人类反馈的强化学习，明确指示模型应该完成哪些任务，以及如何以人类偏好的标准完成这些任务。
在监督微调阶段，技术团队从多个维度拆解”严谨”，为不同任务场景准备数据集，教会支小宝如何严谨地处理数字、观点、实体等。
在基于人类反馈的强化学习环节，进一步训练大模型对严谨性和专业性的自发遵从。

技术团队还构建了金融能力指令集，借鉴布鲁姆模型，将能力培养划分为记忆、理解、应用、分析、评价、创造等递进阶段，并据此设计训练任务。
在数据标注上，蚂蚁财富投入了大量精力和资源，组建了具有专业标注能力的团队，确保支小宝能够在复杂的金融领域游刃有余。

总之，支小宝作为AI理财助理，在理解专家和成为专家方面取得了显著进步。
通过多智能体框架、大模型技术和专家对齐训练，支小宝能够提供更专业、更准确的投顾服务，帮助普通投资者在专业服务的”无人区”中找到方向。