大模型
LLM,VLM,模型
腾讯AI Lab 提出解耦推理新框架,破解IMO 数学难题
近年来,大语言模型(LLM)在数学推理领域取得了显著进展,但在形式化数学证明方面却遇到了瓶颈。尽管LLM能够以超过80%的准确率生成非形式化的解题思路,但在...
MCP协议曝出大漏洞:会泄露整个数据库
最新研究揭示了MCP协议存在重大漏洞,攻击者可以利用大语言模型(LLM)的指令/数据混淆漏洞直接访问数据库。MCP协议作为智能体领域的行业标准,广泛应用于连...
奖励模型终于迎来预训练新时代!上海AI Lab、复旦POLAR,开启Scaling新范式
在大语言模型的后训练阶段,强化学习是提升模型能力、对齐人类偏好的核心方法,但奖励模型的设计与训练仍是关键瓶颈。当前主流方法包括“基于偏好的奖励建模”...
赵晓卉,你老板知道你用飞书AI爆改绩效评价吗?
飞书的多维表格和知识问答功能在2025飞书未来无限大会中得到了显著升级,展示了其在企业应用中的强大潜力。赵晓卉通过飞书的“超级AI版Excel”爆改了自己的绩效...
马斯克20万GPU训出史上最聪明AI,Grok 4重返地球之巅!人类博士全线溃败
Grok 4的发布标志着xAI在人工智能领域的一次重大突破。这一最新模型在多项基准测试中表现卓越,尤其在HLE(人类最后考试)中展现出博士级别的能力,能够解决...
Cursor终结者?Grok 4正式登顶!马斯克扬言编程碾压,20万N卡年赚47亿美金!
Grok 4的发布标志着xAI在人工智能领域的又一次重大突破。这款通用模型不仅跳过了Grok 3.5,还带来了多个专为特定任务设计的模型,包括编码模型、多模态代理和...
独家丨百川智能联合创始人谢剑将离职
百川智能技术联合创始人谢剑即将离职,其离职原因和下一步动向尚未公开。谢剑在人工智能领域拥有丰富的经验,曾在百度担任主任研发架构师,并深度参与了凤巢...
微软开源新版Phi-4:推理效率暴涨10倍,笔记本可运行
微软近日开源了Phi-4家族的最新版本Phi-4-mini-flash-reasoning,该版本延续了Phi-4家族参数小、性能强的特点,专门为受算力、内存和延迟限制的场景设计,适...
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
Hugging Face最新推出的30亿参数模型SmolLM3,以其全面开源和卓越性能成为小模型领域的标杆。该模型支持128k长上下文处理,并在多语言任务中展现出色表现,同...
组织先用好 AI,再谈 AI 改变组织
过去三年,AI工具已逐步渗透到日常办公场景,从撰写报告到会议总结,个体工作效率显著提升。然而,这种变革长期停留在个人层面,未能与企业数字系统深度融合...