智能体训练 | 学习AIGC

通义实验室最新成果WebDancer：开启自主智能Deep Research的新时代

在当今信息爆炸的时代，解决复杂问题需要深入的信息挖掘和多步推理。自主信息检索智能体的构建面临两大核心挑战：高质量训练数据的稀缺与开放环境训练的复杂...

AIGC动态

3个月前

Google DeepMind 近日宣布了其新一代世界模型 Genie 2，这一技术能够根据单张图像生成无限可玩的 3D 世界，为人类和 AI 智能体提供互动环境。Genie 2 的发布...

AIGC动态

9个月前

Google DeepMind 最新发布了新一代大规模基础世界模型 Genie 2，该模型能够从单张图像生成一个高度多样化、逻辑严谨且连贯一致的 3D 世界，并支持长达一分钟...

AIGC动态

9个月前

OpenAI于6月28日发布了CriticGPT，这是基于GPT-4的最新模型，专为开发人员设计，旨在提高人类反馈强化学习（RLHF）的效率，从而生成更高质量的训练数据。RLHF...

AIGC动态

1年前 (2024)

在图像生成领域，扩散模型已成为主流方法，并开始被应用于挑战强化学习智能体。近期研究提出了扩散世界模型，其主要通过对离散潜在变量序列的操作来模拟环境...

AIGC动态

1年前 (2024)