模型训练 | 学习AIGC

高效大规模创新3D重建模型iLRM

AIGC领域聚焦大语言模型发展与应用落地，而在3D建模方面，基于前馈网络的方法受关注，但多数基于Transformer架构的模型处理多视图输入时存在可扩展性问题，计...

AIGC动态

2周前

全球百万网友迷上赛博「养鱼」，我也被这群AI小丑鱼拿捏了

Draw A Fish 是一款让全球百万网友疯狂上头的 AI 小游戏。其玩法简单，打开网站利用绘图工具，选择颜色和笔刷粗细，在画布上绘制面朝右侧的小鱼，AI 会实时判...

AIGC动态

3周前

三个月、零基础手搓一块TPU，能推理能训练，还是开源的

大模型技术发展使 AI 专用芯片受关注，谷歌 TPU 是典型例子，其自 2015 年部署后已发展到第 7 代，推动了大模型技术进展。加拿大西安大略大学工程师 Surya Su...

AIGC动态

3周前

训练效率提升25%、成本降23%！上海期智研究院、算秩未来联合推出MegatronApp：专为万亿参数大模型训练打造的系统工具包

上海期智研究院与算秩未来在WAIC 2025世界人工智能大会上联合发布了开源项目MegatronApp，这是国内首个针对Megatron-LM框架的增强工具链。该工具链聚焦高可用...

AIGC动态

2个月前

最新 AGI 暴论：强化学习的「GPT-3 时刻」实现，还需要 1 万年？

强化学习（RL）领域正在经历一场潜在的变革，类似于语言模型在GPT-3出现时的飞跃。当前的RL模型虽然在特定任务上表现优异，但面临泛化能力差、难以适应新任务...

AIGC动态

2个月前

从RLHF、PPO到GRPO再训练推理模型，这是你需要的强化学习入门指南

强化学习已成为大型语言模型（LLM）技术栈的核心组成部分，其应用范围从模型对齐、推理训练扩展到新兴的智能体强化学习（Agentic RL）。Unsloth团队近期发布...

AI-Agent

3个月前

华为昇腾万卡集群揭秘：如何驯服AI算力「巨兽」？

AI算力集群已成为支撑现代人工智能发展的核心基础设施，其通过整合上万台计算机形成'算力航空母舰'，解决了大模型训练所需的庞大规模计算需求。面对超大规模...

AIGC动态

3个月前

图解 DeepSeek-R1

DeepSeek-R1 是人工智能领域的一个重要进展，特别是在机器学习研发社区中引起了广泛关注。该模型的核心特点在于其开放权重设计以及借鉴了 OpenAI O1 推理模型...

AIGC动态

6个月前

月之暗面Kimi的技术一点都不落后。

月之暗面团队于2023年5月启动MoBA框架研发，旨在提升大语言模型处理长文本的效率与兼容性。该框架结合稀疏注意力与分布式训练技术，支持上下文长度扩展至10M...

AIGC动态

7个月前

直逼DeepSeek-R1-32B，碾压李飞飞s1！UC伯克利等开源全新SOTA推理模型

斯坦福大学、加州大学伯克利分校等机构联合发布了开源推理模型OpenThinker-32B，其性能接近当前最先进的DeepSeek-R1-32B模型。该模型仅使用114k训练数据（相...

AIGC动态

7个月前

标签：模型训练

高效大规模创新3D重建模型iLRM

全球百万网友迷上赛博「养鱼」，我也被这群AI小丑鱼拿捏了

三个月、零基础手搓一块TPU，能推理能训练，还是开源的

训练效率提升25%、成本降23%！上海期智研究院、算秩未来联合推出MegatronApp：专为万亿参数大模型训练打造的系统工具包

最新 AGI 暴论：强化学习的「GPT-3 时刻」实现，还需要 1 万年？

从RLHF、PPO到GRPO再训练推理模型，这是你需要的强化学习入门指南

华为昇腾万卡集群揭秘：如何驯服AI算力「巨兽」？

图解 DeepSeek-R1

月之暗面Kimi的技术一点都不落后。

直逼DeepSeek-R1-32B，碾压李飞飞s1！UC伯克利等开源全新SOTA推理模型

热门网址

标签：模型训练

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址