博客 | 第 14 页 | 学习AIGC

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

Scale AI、Center for AI Safety与MIT研究者联合推出的ENIGMAEVAL基准，通过1184道源自解谜寻宝竞赛的复杂题目，系统评估大语言模型的多模态推理能力。该基准...

AIGC动态

7天前

OpenAI的GPT-4o近期进行了版本更新，在大模型竞技场中与DeepSeek-R1并列第一，并在多个单项评测中表现突出。除数学能力排名第六外，其在创意写作、编程、指令...

AIGC动态

7天前

近期，微信开始灰度测试接入DeepSeek模型，用户可通过对话框顶部搜索入口体验'AI搜索'功能。此次接入标志着腾讯旗下包括文档、音乐、云服务等产品全面拥抱Dee...

AIGC动态

7天前

DeepSeek 在近期推出的 R1 模型及其 Zero 研究，通过纯强化学习路线实现了推理模型的突破性进展。其核心创新在于证明无需过程监督数据，仅依靠结果控制即可训...

AIGC动态

7天前

DeepSeek团队提出的CODEI/O方法通过代码输入/输出预测任务，显著提升了大型语言模型在多种推理任务中的表现。该方法将原始代码文件转换为可执行函数，并构建...

AIGC动态

7天前

2025年中国大模型领域迎来重要突破，DeepSeek与YAYI-Ultra两大模型展现出显著技术优势。DeepSeek-R1通过算法优化突破算力限制，其深度推理能力为国内大模型行...

AIGC动态

7天前

中国杭州的群核科技于2024年2月正式向港交所递交招股书，计划成为全球空间智能第一股。作为行业领军企业，其2023年收入占据中国空间设计市场22.2%的份额，平...

AIGC动态

7天前

2024年11月，特朗普政府成立直接向白宫幕僚长汇报的政府效率部（DOGE），由埃隆·马斯克领导，旨在通过技术手段提升联邦政府效率。该部门采取激进的改革措施，...

AIGC动态

7天前

全球大模型格局因DeepSeek-R1的发布发生剧烈震荡，国内外科技企业与初创公司纷纷调整战略以应对冲击。国内六家头部大模型创业公司通过技术迭代、场景落地和生...

AI-Agent

7天前

近期，多地政务账号及高校通过快手可灵AI特效制作的“毛茸茸变身”短视频引发全网刷屏。AI特效功能凭借极简操作和萌趣效果迅速走红，成为城市形象宣传与机构营...

AIGC动态

7天前