大模型
LLM,VLM,模型
DeepMind哈萨比斯最新认知都在这里了
谷歌DeepMind CEO哈萨比斯在访谈中围绕AGI、旗下模型及技术应用等展开讨论,对相关领域发展发表了诸多见解。AGI愿景与挑战:哈萨比斯认为若未来十年实现完全...
新型光子芯片登场,效率暴增100倍
佛罗里达大学工程师开发出用光运行AI的芯片,为AI发展带来新希望。该研究于2025年9月8日发表在《先进光子学》上,领头人Volker J. Sorger博士认为在接近零能...
下周见!80 家AI摊主,5天4夜把中关村创业大街变成最AI的一条街
9月17 - 21日,北京中关村创业大街将变身“AI城市快闪实验室”,举办2025年度独特的AI盛会——AI创造者嘉年华。这不是传统科技展览,而是属于AI创造者的开放派对...
MCP:构建更智能、模块化 AI 代理的通用连接器
大语言模型驱动的人工智能代理虽潜力巨大,但集成外部组件面临挑战,模型上下文协议(MCP)应运而生,为解决这些问题提供了有效方案。MCP 是 2024 年底由 Ant...
将KV Cache预算降至1.5%!他们用进化算法把大模型内存占用砍下来了
键值缓存(KV cache)是大模型快速运行的核心技术,但存在输入文本越长、所需存储空间越大且处理长文本变慢的问题。现有 KV cache 压缩方法主要依赖基于规则...
机器人入职洗衣房,开始打工挣钱!苹果前AI高管打造
机器人Isaacs已在付费洗衣房Tumble Laundry上岗,开启机器人叠衣服赚钱的新尝试。Isaacs由前苹果团队创立的Weave Robotic打造,该团队在产品未正式亮相时就完...
Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3
Meta AI 团队本周五正式发布了 MobileLLM-R1,这是 MobileLLM 的全新高效推理模型系列,引发了机器学习社区的讨论。MobileLLM-R1 包含基础模型 MobileLLM-R1 ...
清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路
强化学习(RL)在人工智能发展中一直是重要方法,自1998年概念提出后,在多个领域取得显著成果。进入大模型时代,RL最初用于让模型更符合人类偏好,近年来研...
用户退订、封锁中国,Claude Code亲手送出的“泼天富贵”,腾讯CodeBuddy来接了?
Claude Code曾是备受追捧的AI编程工具黑马,但近期却让全球开发者失望。开发者 Ahmad 在推上细数其“数宗罪”,如 Claude Code 里没有 opus 4、周用量限制却不...
突遭制裁!美国政府将复旦微电等23个中国实体列入“黑名单”,清单总量已超千家
当地时间9月12日,美国商务部工业与安全局(BIS)修订《出口管理条例》,将32个实体添加到管制实体名单,其中23家为中国实体,包括复旦微电、中国科学院空天...