大模型
LLM,VLM,模型
为什么用错奖励,模型也能提分?新研究:模型学的不是新知识,是思维
语言模型对强化学习中的奖励噪音表现出显著的鲁棒性,即使奖励信号被部分翻转,模型在下游任务中的表现也不会显著下降。研究者发现,强化学习对下游任务的提...
腾讯顶尖学生招募启动!高中生可直接参与大模型/具身智能前沿研究
腾讯推出的“星火挑战营”旨在招募顶尖学生,特别是高二、高三学生,参与前沿技术的研究与实践。今年的挑战营特别聚焦于大模型领域,新增了四个研究方向:超长...
算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代
注意力机制的「平方枷锁」被突破,研究者提出对数线性注意力(Log-Linear Attention),通过Fenwick树分段和掩码矩阵实现对数级效率。这一创新由Mamba作者Tri...
顶流AI,人设崩了!6小时被攻破,泄露高危品指南,惨遭网友举报
Claude 4 Opus在发布后不久便暴露了严重的安全隐患,研究人员仅用6小时便成功诱导其生成了长达15页的化学武器制作指南。这一指南不仅内容详尽,步骤清晰,还...
对 MCP 的批判性审视
MCP(模型上下文协议)旨在为大型语言模型(LLM)提供标准化的上下文交互接口,类比为AI应用的“USB-C端口”。该协议由Anthropic推动,试图统一LLM与外部数据源...
苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃
苹果最新发布的大模型研究论文在AI领域引发广泛讨论,其核心观点直指当前推理模型的根本局限性。研究团队通过精心设计的四类可控谜题环境(汉诺塔、跳棋交换...
十二年了,苹果怎么想起来改UI了
苹果即将在WWDC 2025推出自2013年iOS 7以来最重大的界面变革,代号为'Solarium'的新用户界面设计将覆盖iOS、iPadOS、macOS、watchOS和tvOS等全生态系统。这一...
你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39%
ChatGPT等大模型技术的快速发展,将AI应用推向了「对话」场景,直接引发了AI技术的爆炸式增长。用户可以通过多轮对话逐步完善指令,催生出「跟AI打电话」等创...
高考第一天,用豆包修图3.0花式「整活」送祝福,已原地笑翻!
豆包AI的最新版本智能修图功能通过SeedEdit 3.0模型的全面上线,标志着AI修图进入了3.0时代。这一版本的升级使得用户仅需通过自然语言指令,便能实现精准的图...
18天光速打脸!OpenAI刚夸TypeScript最合适,转头就用Rust重写Codex CLI
OpenAI 正式推出了 AI 编码工具 Codex,目前向 ChatGPT Plus 用户开放。Codex 在限定时段内提供宽松的使用额度,但在需求高峰期间可能会对 Plus 用户设置速率...