大语言模型 | 学习AIGC

LLM强化学习不稳定之谜，被Qwen团队从「一阶近似」视角解开

强化学习（RL）已成为提升大语言模型（LLM）复杂推理能力的关键技术范式，但其训练稳定性问题亟待解决。当前主流RL算法存在序列级奖励与token级优化的不匹配...

AIGC动态

20小时前

基于文本AI的终结？Agent协作可直接「复制思维」，Token效率暴涨

在Agentic AI时代，多智能体系统（MAS）的发展使得AI从独立运作转向协同合作。传统MAS依赖自然语言进行智能体间的交流，虽然可解释但效率低下且信息易丢失。...

AI-Agent

3天前

念首诗，就能让AI教你造核弹！Gemini 100%中招

最新研究发现，将恶意指令改写为诗歌形式能够有效突破主流大语言模型的安全限制。这项由意大利罗马大学和DEXAI实验室进行的研究测试了25个顶尖模型，结果显示...

AIGC动态

2周前

Meta超级智能实验室又发论文，模型混一混，性能直接SOTA

大语言模型（LLM）的训练通常依赖大量算力和时间资源，而模型Souping（Model Souping）作为一种轻量级方法，通过对同一架构的多个模型进行权重平均，能够融合...

AIGC动态

2周前

超实用提示词模板！AI科学家教你用协作提示词激发大模型潜力

当前主流大语言模型存在'短视'倾向，倾向于提供快速但肤浅的回应，而非深入探讨问题。这种现象源于训练过程中采用的人类反馈强化学习(RLHF)机制，该机制鼓励A...

AIGC动态

3周前

登顶开源SOTA！上交大&小红书LoopTool实现工具调用任务的「数据进化」

大语言模型与外部工具的结合已成为推动AI从“会说”走向“会做”的关键机制。这种结合在API调用、多轮任务规划、知识检索和代码执行等场景中尤为重要。然而，现有...

AIGC动态

3周前

强化学习 AI 系统的设计实现及未来发展

强化学习作为推动大语言模型智能化的核心手段，其复杂程度体现在算法理论与工程实践的双重挑战中。阿里巴巴算法专家曹宇在AICon 2025的分享中，系统梳理了RLH...

AI-Agent

4周前

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

阿里巴巴ROLL团队联合多所高校推出的「3A」协同优化框架，为强化学习在大语言模型（RL4LLM）中的应用带来了高效、精细与可解释的新范式。该框架由Async架构、...

AI-Agent

4周前

产品上线 4 个月，估值超 1 亿美元，Agnes AI 即将完成新一轮融资

新加坡AI公司SAPIENS旗下产品Agnes AI即将完成数千万美元的新一轮融资，公司估值突破1亿美元。本轮资金将重点投入区域大语言模型训练和全球市场商业化加速，...

AI-Agent

1个月前

视觉生成的另一条路：Infinity 自回归架构的原理与实践

以ChatGPT、DeepSeek为代表的大语言模型取得了巨大成功，但在视觉生成领域，扩散模型仍是主流方法。视觉自回归方法因其更好的scaling特性和统一理解与生成任...

AIGC动态

1个月前

标签：大语言模型

LLM强化学习不稳定之谜，被Qwen团队从「一阶近似」视角解开

基于文本AI的终结？Agent协作可直接「复制思维」，Token效率暴涨

念首诗，就能让AI教你造核弹！Gemini 100%中招

Meta超级智能实验室又发论文，模型混一混，性能直接SOTA

超实用提示词模板！AI科学家教你用协作提示词激发大模型潜力

登顶开源SOTA！上交大&小红书LoopTool实现工具调用任务的「数据进化」

强化学习 AI 系统的设计实现及未来发展

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

产品上线 4 个月，估值超 1 亿美元，Agnes AI 即将完成新一轮融资

视觉生成的另一条路：Infinity 自回归架构的原理与实践

热门网址

标签：大语言模型

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址