大模型

LLM,VLM,模型

英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生

英伟达通过Blackwell架构在AI推理领域取得了突破性进展,单节点(8颗Blackwell GPU)的DGX B200服务器实现了Llama 4 Maverick模型每秒单用户生成1000个token...

突发!美国新法案,10年内禁止监管AI

美国众议院近日通过了《HR1》法案,该法案将在未来10年内禁止美国各州对人工智能(AI)进行监管。这一决定对微软、OpenAI、谷歌、亚马逊等科技巨头具有重要意...

现在,你终于可以用飞书搭自己的AI知识库了。

飞书作为一款深度集成的办公平台,已经成为许多企业和个人的核心工具,尤其是在数据管理和知识沉淀方面。作者作为飞书的深度用户,长期依赖飞书进行文档创建...

证明也有「选择困难症」?腾讯AI Lab与大模型研究部联手打造 MPS-Prover ,多视角破解形式化推理瓶颈!

自动化定理证明(ATP)是人工智能、数学及形式化方法领域的核心挑战,旨在为数学或逻辑陈述自动生成形式化、可验证的证明。尽管大语言模型(LLM)在非形式化...

从 DeepSeek 部署看,华为如何让 MOE 架构“迎来”海量“专家”?

模型开发已经从早期的算法层优化转向系统工程层面的深度创新,标志着技术领域的重大转变。随着数字化时代的比特流量逐渐转向Token经济体系,国内Token日消耗...

独家提问Google CEO Pichai:低谷时继续猛投AI,才让Google有了今天

在Google I/O的第二天,Google CEO Sundar Pichai与硅星人进行了交流,分享了Google在人工智能、搜索和广告等领域的战略与进展。Pichai强调,Google始终坚持...

Agent真的卷疯了,AI办公Agent也来了。

昆仑万维推出的Skywork Super Agents是一款专为办公场景设计的垂直领域Agent产品,旨在通过智能化的方式提升办公效率。该产品分为海外版和国内版,分别面向不...

模拟芯片工程师,为何越来越吃香?

模拟IC设计工程师在台湾科技业中享有最高的非主管职年薪,中位数达到155万新台币。模拟IC(Analog Integrated Circuit)是处理连续变化电压或电流信号的晶片...

博士宿舍激情脑暴,革新了Scaling Law?Qwen和浙大联手推出新定律,直接干掉95.5%推理内存!

阿里巴巴研究团队与浙江大学合作提出了一种新的并行计算缩放定律(ParScale),该定律通过在训练和推理阶段增加并行计算量,显著提升大模型的能力,同时保持...

纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源

a-m-team 最近发布了一篇名为“Not All Correct Answers Are Equal: Why Your Distillation Source Matters”的论文,探讨了在推理模型训练中蒸馏数据源的重要...
1 77 78 79 80 81 318