标签:优化

全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍

DeepSeek-R1模型在H100 GPU上的性能优化取得了显著进展,短短4个月内性能提升了26倍,吞吐量接近DeepSeek官方数据。这一突破得益于SGLang、英伟达等机构的联...

Bye,英伟达!华为NPU,跑出了准万亿参数大模型

华为基于昇腾国产算力平台,成功实现了7180亿参数MoE模型的长期稳定训练,突破了负载均衡、通信开销和训练效率等多项技术挑战。这一成就标志着国产算力平台在...

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光

英伟达最新发布的Llama-Nemotron系列模型在推理性能和内存效率上超越了DeepSeek-R1,并且已经全面开源。这一系列模型包括LN-Nano 8B、LN-Super 49B和LN-Ultra...

突破瓶颈,嵌入式AI神经持续学习引擎—Replay4NCL

阿联酋大学、纽约大学阿布扎比分校和巴基斯坦国立科技大学的研究人员联合推出了一种名为Replay4NCL的高效内存重放方法,旨在解决嵌入式AI系统在动态环境中持...

刚刚,OpenAI大更新ChatGPT搜索,周搜索量10亿次

OpenAI于今日凌晨对ChatGPT搜索功能进行了重大更新,重点优化了网购体验。此次更新后,用户可以直接在ChatGPT中查看产品详情、价格、用户评价,并能够一键跳...

当AI基建告别“蛮力生长”:百度百舸如何用“系统思维”为应用铺路

在AI技术飞速发展的背景下,百度创始人李彦宏在Create 2025大会上强调了应用的重要性,认为“应用才是王者”。他指出,尽管大模型不断迭代,但找到合适的场景并...

腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon

在人工智能快速发展的背景下,大模型的推理性能优化已成为应对算力挑战、内存瓶颈与通信压力的关键突破口。当前,优化工作主要围绕模型优化、推理加速与工程...

OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙

OpenAI最新发布的o3和o4-mini模型在编码能力上取得了显著进步,甚至在全球人类选手中位列TOP 200。然而,这些模型在生成内容时存在严重的幻觉问题,o3的幻觉...

英伟达含量为零!华为密集模型性能比肩DeepSeek-R1,纯昇腾集群训练

华为推出的盘古Ultra模型在推理任务中展现出了与DeepSeek-R1等大规模模型竞争的能力。尽管盘古Ultra的参数量仅为135B,但其在数学竞赛、编程等推理任务中的表...

不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型

华为盘古团队成功开发了基于昇腾算力训练的千亿级通用语言大模型 Pangu Ultra,该模型在多个领域和评测上超越了之前的稠密模型,如 Llama 405B 和 Mistral La...
1 2 3