AI大模型
LLM,VLM,模型,VLA
四道题评测 Qwen3.7-Max:从空间推理到 3D 建模,它离 Agent 更近了吗?
阿里云通义千问团队在三个月内连续发布三款旗舰大模型,最新推出的Qwen3.7-Max在多项权威评测中表现卓越,位列全球第五、国产第一。该模型在推理和编程智能体...
Agent 该怎么做真正的安全评测?
上海人工智能实验室等机构提出了一系列面向智能体安全评测与诊断的基准测试,包括ATBench及其扩展版本ATBench-Claw和ATBench-CodeX。这些研究将智能体安全评...
小米狂撒Token!最高降幅99%,全面对标DeepSeek
近期,国产大模型API市场掀起激烈的价格战,竞争已正式杀入成本线。DeepSeek宣布V4-Pro API永久降价,随后小米MiMo迅速跟进,最高降幅达99%,其Pro版核心价格...
国内同行羡慕硅谷有钱,硅谷在羡慕宇树有副好身体
宇树科技的真正价值并非体现在传统成熟产业的财务指标中,而是其在全球具身智能竞赛中所占据的关键位置。当前,硅谷头部科技企业已将具身智能视为大模型发展...
超越 TurboQuant! OSCAR:面向真实 Serving 的 2bit KV Cache量化
长上下文模型在在线推理服务中面临KV Cache带来的显存容量和带宽压力。OSCAR方案旨在通过面向长上下文服务的近2-bit KV Cache量化技术,解决低比特压缩后模型...
Kimi办公室,藏着哪些江湖大佬的传说?
北京知春路76号的京东科技大厦,前身为翠宫饭店,见证了中关村几代科技创业者的兴衰与时代变迁。这座大楼不仅是互联网大佬们早期创业的聚集地,更是中国科技...
半数华人、3位亿万富翁:这张十年前的量化实习生合照,藏着 AI 时代的新贵版图
近年来,具有量化交易背景的人才正迅速崛起,成为人工智能领域的中坚力量。从华尔街到硅谷,众多高估值AI独角兽企业的创始人或核心高管,多拥有量化高频交易...
刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!
当前具身智能领域的视觉语言动作模型评测多依赖针对特定任务的微调,导致预训练阶段的真实贡献难以衡量。为突破这一困境,自变量机器人团队推出了Wall-OSS-0....
小龙虾彻底凉了?清华团队连夜开源Agent神器,Token成本狂降70%!
清华大学联合面壁智能等团队研发并开源了名为PilotDeck的智能体操作系统,旨在解决当前Agent工具在生产力应用中面临的工程化痛点。该系统通过提供独立工作舱...
多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL
过去的神经网络缩放定律通常仅关注模型参数量、数据量和训练计算量与损失函数下降之间的关系,但真实的训练过程受到训练步数、批大小、学习率等众多变量的复...



