标签:数据增强

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞

DeepSeek团队提出的CODEI/O方法通过代码输入/输出预测任务,显著提升了大型语言模型在多种推理任务中的表现。该方法将原始代码文件转换为可执行函数,并构建...

百川智能发布金融大模型 Baichuan4-Finance,整体准确率领先GPT-4o近20%

百川智能于12月23日发布了全链路领域增强大模型Baichuan4-Finance,该模型在高质量金融数据的基础上,通过领域自约束训练方案,实现了金融能力和通用能力同步...

首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布

由伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)和西湖大学联合研究的首个类o1全链条训练框架「OpenR」已开源,旨在提升大型语言模...