标签:优化
英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生
英伟达通过Blackwell架构在AI推理领域取得了突破性进展,单节点(8颗Blackwell GPU)的DGX B200服务器实现了Llama 4 Maverick模型每秒单用户生成1000个token...
从 DeepSeek 部署看,华为如何让 MOE 架构“迎来”海量“专家”?
模型开发已经从早期的算法层优化转向系统工程层面的深度创新,标志着技术领域的重大转变。随着数字化时代的比特流量逐渐转向Token经济体系,国内Token日消耗...
华为+DeepSeek,推理性能创新高!技术报告也公布出来了
华为昇腾在超大规模MoE模型推理部署领域取得了显著突破,其推理性能全面超越了英伟达的Hopper架构。这一成就主要归功于华为昇腾的“以数学补物理”策略,通过数...
破解300年数学难题,智能体大突破!谷歌发布超强AI Agent
谷歌Deepmind最新发布的编程AI Agent——AlphaEvolve,标志着人工智能在算法设计与优化领域的重大突破。AlphaEvolve与谷歌的大模型Gemini深度集成,旨在自动评...
56 年无人解开的数学难题,被谷歌的新 AI 突破了
Google DeepMind 最新发布的编程智能体 AlphaEvolve 标志着人工智能在算法发现和优化领域的重大突破。与传统的编程工具不同,AlphaEvolve 专注于通用算法的自...
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
DeepSeek-R1模型在H100 GPU上的性能优化取得了显著进展,短短4个月内性能提升了26倍,吞吐量接近DeepSeek官方数据。这一突破得益于SGLang、英伟达等机构的联...
Bye,英伟达!华为NPU,跑出了准万亿参数大模型
华为基于昇腾国产算力平台,成功实现了7180亿参数MoE模型的长期稳定训练,突破了负载均衡、通信开销和训练效率等多项技术挑战。这一成就标志着国产算力平台在...
超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光
英伟达最新发布的Llama-Nemotron系列模型在推理性能和内存效率上超越了DeepSeek-R1,并且已经全面开源。这一系列模型包括LN-Nano 8B、LN-Super 49B和LN-Ultra...
突破瓶颈,嵌入式AI神经持续学习引擎—Replay4NCL
阿联酋大学、纽约大学阿布扎比分校和巴基斯坦国立科技大学的研究人员联合推出了一种名为Replay4NCL的高效内存重放方法,旨在解决嵌入式AI系统在动态环境中持...
刚刚,OpenAI大更新ChatGPT搜索,周搜索量10亿次
OpenAI于今日凌晨对ChatGPT搜索功能进行了重大更新,重点优化了网购体验。此次更新后,用户可以直接在ChatGPT中查看产品详情、价格、用户评价,并能够一键跳...