大模型
LLM,VLM,模型
让离线强化学习从「局部描摹」变「全局布局」丨ICLR’26
现有的主流生成式离线强化学习算法在处理复杂的连续长期任务时通常会暴露出现实性的瓶颈问题,这些生成的轨迹经常处于看起来内部合理但实际上已经严重偏离全...
iPhone本地跑Gemma 4火了,0 token时代还有多远?
最近谷歌正式推出一款代号为Gemma 4的开源基础模型,这一技术产品采用了与业界前沿的高端产品同源架构体系,原生支持全模态的数据输入处理方式。其在相关评测...
你敢把「龙虾」放在手机上跑吗?手机 Agent 离落地还差一道「隐私关」
香港中文大学深圳分校 Freedoms AI 团队联合腾讯混合大视觉大模型等多项合作研究推出了一个新的测评基准项目名为 My Phone Bench该系统专门用于系统化衡量手...
OpenAI又曝出内讧了!IPO前夜高层大换血
面对刚刚创纪录的融资规模与市场高度关注的上市预期,这家领先的科技独角兽却在冲刺关键阶段遭遇了前所未有的管理挑战。最近的核心高层动态显示,原本作为稳...
GPT-6抢先发布?Mythos被曝难产,算力惊人烧垮Anthropic
硅谷两大 AI 领军企业正在经历一场从技术比拼向资源囤积转变的极致生死时速,两者面临的挑战集中体现在基础设施建设速度与资本规划逻辑上。尽管市场上关于下...
Karpathy强推,大厂抢着「复古」命令行,Star数全都上千了
近期飞书、钉钉与企业微信在短时间内相继推出 CLI 工具,引发了企业软件对交互模式的新一轮思考,预示着 AI 生态格局面临深刻重塑。命令行界面在此刻的价值体...
没有KPI,也能领先OpenAI?从“内部观察者”视角看顶级AI实验室如何运作
DeepMind 的核心竞争优势不仅得益于背后提供算力与资金的支持,更关键在于建立了独特的双重运行管理架构。该系统既允许资深研究人员享有高度的学术自由和探索...
传 GPT-6 4 月 14 日上线,性能暴涨;段永平改口怒夸泡泡玛特:中国产品国际化先驱;57 年后,宇航员重现经典「地球升起」照片
科技圈近日焦点聚集于生成式模型的快速迭代及硬件底层创新。业内预测下一款旗舰大模型预计在本月中旬正式上线,其推理与代码处理能力预计大幅提升,同时原生...
Harness项目推荐丨CLI-Anything 、CrewAI、LangGraph、EigenFlux….
AI 基础设施领域的建设正逐步从单一模型调用转向系统化工程管理。Harness 架构梳理出包括工具接入和安全防护在内的七大核心模块,为技术选型提供了明确的路径...
Karpathy知识库「LLM Wiki」火爆了,全网围观讨论
系统架构被清晰划分为底层原始数据源、中间生成的维基文档集以及顶层控制工作流的指令规范这三类层级。原始的素材文件始终保持固定以确保真实性,而核心文档...





