标签:模型训练
高效大规模创新3D重建模型iLRM
AIGC领域聚焦大语言模型发展与应用落地,而在3D建模方面,基于前馈网络的方法受关注,但多数基于Transformer架构的模型处理多视图输入时存在可扩展性问题,计...
全球百万网友迷上赛博「养鱼」,我也被这群AI小丑鱼拿捏了
Draw A Fish 是一款让全球百万网友疯狂上头的 AI 小游戏。其玩法简单,打开网站利用绘图工具,选择颜色和笔刷粗细,在画布上绘制面朝右侧的小鱼,AI 会实时判...
三个月、零基础手搓一块TPU,能推理能训练,还是开源的
大模型技术发展使 AI 专用芯片受关注,谷歌 TPU 是典型例子,其自 2015 年部署后已发展到第 7 代,推动了大模型技术进展。加拿大西安大略大学工程师 Surya Su...
训练效率提升25%、成本降23%!上海期智研究院、算秩未来联合推出MegatronApp:专为万亿参数大模型训练打造的系统工具包
上海期智研究院与算秩未来在WAIC 2025世界人工智能大会上联合发布了开源项目MegatronApp,这是国内首个针对Megatron-LM框架的增强工具链。该工具链聚焦高可用...
最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?
强化学习(RL)领域正在经历一场潜在的变革,类似于语言模型在GPT-3出现时的飞跃。当前的RL模型虽然在特定任务上表现优异,但面临泛化能力差、难以适应新任务...
从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南
强化学习已成为大型语言模型(LLM)技术栈的核心组成部分,其应用范围从模型对齐、推理训练扩展到新兴的智能体强化学习(Agentic RL)。Unsloth团队近期发布...
华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?
AI算力集群已成为支撑现代人工智能发展的核心基础设施,其通过整合上万台计算机形成'算力航空母舰',解决了大模型训练所需的庞大规模计算需求。面对超大规模...
图解 DeepSeek-R1
DeepSeek-R1 是人工智能领域的一个重要进展,特别是在机器学习研发社区中引起了广泛关注。该模型的核心特点在于其开放权重设计以及借鉴了 OpenAI O1 推理模型...
月之暗面Kimi的技术一点都不落后。
月之暗面团队于2023年5月启动MoBA框架研发,旨在提升大语言模型处理长文本的效率与兼容性。该框架结合稀疏注意力与分布式训练技术,支持上下文长度扩展至10M...
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型
斯坦福大学、加州大学伯克利分校等机构联合发布了开源推理模型OpenThinker-32B,其性能接近当前最先进的DeepSeek-R1-32B模型。该模型仅使用114k训练数据(相...