标签:架构
微软开源新版Phi-4:推理效率暴涨10倍,笔记本可运行
微软近日开源了Phi-4家族的最新版本Phi-4-mini-flash-reasoning,该版本延续了Phi-4家族参数小、性能强的特点,专门为受算力、内存和延迟限制的场景设计,适...
开源DeepSeek R1增强版:推理效率快200%,创新AoE架构
德国知名技术咨询公司TNG开源了DeepSeek R1的增强版DeepSeek-TNG-R1T2-Chimera。该模型基于DeepSeek的R1-0528、R1和V3-0324三大模型混合开发而成,并采用了一...
只用2700万参数,这个推理模型超越了DeepSeek和Claude
大语言模型在复杂推理任务中面临任务分解复杂、数据需求大以及高延迟等问题,当前的思维链(CoT)技术存在局限性。为了解决这些问题,Sapient Intelligence的...
22年前的一篇报告,预言了今天的CPU
在2003年,计算机架构师迈克尔·J·弗林(Michael J. Flynn)提出了一个关于计算未来的重要警告。他指出,CPU的复杂化趋势——如推测执行、深度流水线和臃肿的指...
华为CloudMatrix384超节点:官方撰文深度解读
在2025年华为云生态大会上,华为推出了CloudMatrix 384超节点,旨在应对AI时代的海量算力需求。这一新型架构基于“一切可池化、一切皆对等、一切可组合”的高速...
被骂“在乱讲”的专家,这次可能说对了:传统数据仓库正在被 Agentic AI 吞噬
随着AI技术的快速发展,传统数据仓库的架构正面临深刻的变革。Agentic AI的崛起标志着AI不再仅仅是“聊天工具”,而是具备感知、行动、协作能力的智能体。这种...
Mamba 架构实现推理性能超 Gemma3-27B!推理模型开始迈入「无注意力」时代
PromptCoT-Mamba-7B是首个实现解码显存常量、计算复杂度线性、长上下文稳定扩展且具备强推理能力的模型,标志着推理大模型首次完全不依赖注意力机制而运作。...
从 DeepSeek 部署看,华为如何让 MOE 架构“迎来”海量“专家”?
模型开发已经从早期的算法层优化转向系统工程层面的深度创新,标志着技术领域的重大转变。随着数字化时代的比特流量逐渐转向Token经济体系,国内Token日消耗...
秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一
Kimi-Audio 是一个全新的通用音频基础模型,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在多个音频基准测试中实现了最先进的性能。结果显示,...
教育信创到底怎么选?能做到”无感切换”的只有C86
近年来,随着中国网络空间安全协会对英特尔的网络安全审查以及微软关闭中国区业务的传闻,Wintel联盟的根基正面临前所未有的动摇。这一趋势与“2+8+N”行业信创...
1
2