AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
Scale AI、Center for AI Safety与MIT研究者联合推出的ENIGMAEVAL基准,通过1184道源自解谜寻宝竞赛的复杂题目,系统评估大语言模型的多模态推理能力。该基准...
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
OpenAI的GPT-4o近期进行了版本更新,在大模型竞技场中与DeepSeek-R1并列第一,并在多个单项评测中表现突出。除数学能力排名第六外,其在创意写作、编程、指令...
微信也接不住DeepSeek的流量?
近期,微信开始灰度测试接入DeepSeek模型,用户可通过对话框顶部搜索入口体验'AI搜索'功能。此次接入标志着腾讯旗下包括文档、音乐、云服务等产品全面拥抱Dee...
DeepSeek 颠覆了什么?学习不靠“人盯”,AI自己“卷”自己
DeepSeek 在近期推出的 R1 模型及其 Zero 研究,通过纯强化学习路线实现了推理模型的突破性进展。其核心创新在于证明无需过程监督数据,仅依靠结果控制即可训...
LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞
DeepSeek团队提出的CODEI/O方法通过代码输入/输出预测任务,显著提升了大型语言模型在多种推理任务中的表现。该方法将原始代码文件转换为可执行函数,并构建...
DeepSeek掀低成本革命,中科院系黑马闯入全球TOP 10!破解高精度-低能耗困局
2025年中国大模型领域迎来重要突破,DeepSeek与YAYI-Ultra两大模型展现出显著技术优势。DeepSeek-R1通过算法优化突破算力限制,其深度推理能力为国内大模型行...
全球空间智能第一股!浙大清华“三剑客”,英伟达基因,填补两大技术空白
中国杭州的群核科技于2024年2月正式向港交所递交招股书,计划成为全球空间智能第一股。作为行业领军企业,其2023年收入占据中国空间设计市场22.2%的份额,平...
马斯克用程序员和AI算法“整顿”华盛顿,此刻已乱成一锅粥
2024年11月,特朗普政府成立直接向白宫幕僚长汇报的政府效率部(DOGE),由埃隆·马斯克领导,旨在通过技术手段提升联邦政府效率。该部门采取激进的改革措施,...
DeepSeek冲击之下,大模型六小强如何「回应」?
全球大模型格局因DeepSeek-R1的发布发生剧烈震荡,国内外科技企业与初创公司纷纷调整战略以应对冲击。国内六家头部大模型创业公司通过技术迭代、场景落地和生...
一觉醒来,地标建筑们都被AI变成毛绒玩具了。
近期,多地政务账号及高校通过快手可灵AI特效制作的“毛茸茸变身”短视频引发全网刷屏。AI特效功能凭借极简操作和萌趣效果迅速走红,成为城市形象宣传与机构营...