标签:优化
华为+DeepSeek,推理性能创新高!技术报告也公布出来了
华为昇腾在超大规模MoE模型推理部署领域取得了显著突破,其推理性能全面超越了英伟达的Hopper架构。这一成就主要归功于华为昇腾的“以数学补物理”策略,通过数...
破解300年数学难题,智能体大突破!谷歌发布超强AI Agent
谷歌Deepmind最新发布的编程AI Agent——AlphaEvolve,标志着人工智能在算法设计与优化领域的重大突破。AlphaEvolve与谷歌的大模型Gemini深度集成,旨在自动评...
56 年无人解开的数学难题,被谷歌的新 AI 突破了
Google DeepMind 最新发布的编程智能体 AlphaEvolve 标志着人工智能在算法发现和优化领域的重大突破。与传统的编程工具不同,AlphaEvolve 专注于通用算法的自...
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
DeepSeek-R1模型在H100 GPU上的性能优化取得了显著进展,短短4个月内性能提升了26倍,吞吐量接近DeepSeek官方数据。这一突破得益于SGLang、英伟达等机构的联...
Bye,英伟达!华为NPU,跑出了准万亿参数大模型
华为基于昇腾国产算力平台,成功实现了7180亿参数MoE模型的长期稳定训练,突破了负载均衡、通信开销和训练效率等多项技术挑战。这一成就标志着国产算力平台在...
超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光
英伟达最新发布的Llama-Nemotron系列模型在推理性能和内存效率上超越了DeepSeek-R1,并且已经全面开源。这一系列模型包括LN-Nano 8B、LN-Super 49B和LN-Ultra...
突破瓶颈,嵌入式AI神经持续学习引擎—Replay4NCL
阿联酋大学、纽约大学阿布扎比分校和巴基斯坦国立科技大学的研究人员联合推出了一种名为Replay4NCL的高效内存重放方法,旨在解决嵌入式AI系统在动态环境中持...
刚刚,OpenAI大更新ChatGPT搜索,周搜索量10亿次
OpenAI于今日凌晨对ChatGPT搜索功能进行了重大更新,重点优化了网购体验。此次更新后,用户可以直接在ChatGPT中查看产品详情、价格、用户评价,并能够一键跳...
当AI基建告别“蛮力生长”:百度百舸如何用“系统思维”为应用铺路
在AI技术飞速发展的背景下,百度创始人李彦宏在Create 2025大会上强调了应用的重要性,认为“应用才是王者”。他指出,尽管大模型不断迭代,但找到合适的场景并...
腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
在人工智能快速发展的背景下,大模型的推理性能优化已成为应对算力挑战、内存瓶颈与通信压力的关键突破口。当前,优化工作主要围绕模型优化、推理加速与工程...