标签:性能优化

刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!

谷歌近日发布了Gemma 3,这是一组轻量级的开源AI模型,旨在减少能源消耗和成本,同时提供高性能的推理能力。Gemma 3基于与Gemini 2.0相同的研究和技术构建,...

多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

大型语言模型(LLMs)在处理复杂任务时面临挑战,尤其是在需要多步推理、特定领域知识或外部工具集成的场景中。现有的方法通常需要对模型进行微调或额外训练...

部分国产芯片适配满血版 DeepSeek,仍「遥遥无期」

国内AI芯片行业近期围绕DeepSeek模型的适配展开激烈竞争,真实技术实力通过适配满血版DeepSeek模型的能力得以显现。目前仅有华为、寒武纪、摩尔线程及昆仑芯...

腾讯推出快思考模型:API 成本只有 deepseek 不到一半

腾讯混元团队近期推出自研快思考模型Turbo S,该模型通过架构创新实现首字时延降低44%,部署成本较前代模型下降数倍,定价仅为0.8元/百万tokens输入费用。该...

DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明

在DeepSeek开源周的第六天,官方意外发布了DeepSeek-V3/R1推理系统的技术细节,展示了其优化大规模语言模型推理效率的核心方法。该系统通过跨节点专家并行(E...

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

2月27日,腾讯混元自研快思考模型Turbo S正式发布,首字时延降低44%,吐字速度提升一倍,实现“秒回”级响应。该模型通过Hybrid-Mamba-Transformer混合架构创新...

火山引擎AI一体机DeepSeek版来了!开箱即用,小时级部署,还有大模型应用经验加持

火山引擎近期发布的AI一体机-DeepSeek版旨在帮助企业解决大模型应用落地的核心难题。该产品通过软硬件协同优化和全链路能力覆盖,支持DeepSeek R1/V3全系列模...

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

DeepSeek在开源周连续发布核心技术成果,继首日开源MLA解码核FlashMLA后,次日推出专为混合专家系统(MoE)设计的通信库DeepEP。该库针对分布式训练中专家并...

DeepSeek引发推理侧革命,火山引擎凭什么做到最优解?

DeepSeek-R1作为新一代推理模型的代表,对云计算基础设施提出了全方位挑战,推动云服务商在性能、成本和稳定性等维度展开技术竞争。火山引擎凭借20ms内延迟响...

“2025 年将成 Python 主导 AI 领域的最后一年”

Java作为企业级应用领域的核心语言,正通过技术革新向AI领域发起冲击。Azul公司的调查报告显示,50%的组织已使用Java构建AI功能,在以Java为中心的企业中,其...
1 2 3 5