文章摘要
【关 键 词】 AI升级、Apple设备、Google模型、多模态、智能助手
OpenAI在发布会的第五天宣布了ChatGPT与Apple设备的集成升级,用户可以在Apple设备上无需ChatGPT账号即可启用Apple Intelligence扩展,享受Siri的复杂任务转交、内容创作等功能。此外,iPhone 16和macOS也分别推出了视觉智能模式和快捷调用功能。尽管演示内容简单,但整体表现平平。
与此同时,Google发布了其迄今为止最强大、专为“代理时代”设计的下一代模型Gemini 2.0,以及首个版本Gemini 2.0 Flash实验版。Gemini 2.0 Flash以低延迟和增强性能为核心,性能超越前代1.5 Pro,速度提升一倍,并在多模态方面实现了重大突破,支持图像、视频、音频等多种输入和输出功能,并能原生调用Google搜索、执行程序代码,支持第三方工具接入。
Google还推出了多模态实时API,支持开发者构建动态交互应用。2.0 Flash实验版已整合至Gemini聊天助手中,全球用户可通过桌面和移动网页版访问,移动应用集成也将推出。Google还在搜索中的AI概览功能中测试Gemini 2.0的高级推理能力,并计划扩展到更多产品中。
针对Advanced付费用户,Google推出了Deep Research功能,专为复杂在线研究设计,能自动创建研究计划,收集和分析信息,生成综合报告。Gemini 2.0系列模型定位为“AI model for the agentic era”,具备更强的代理能力,能理解用户环境,执行多步预判思维和操作。
Google展示了基于2.0 Flash新能力的原型项目进展,包括Project Astra、Project Mariner和Jules等,涉及现实世界中的通用智能助手、浏览器中的复杂任务助手和面向开发者的AI编程助手。Gemini 2.0还展示了其在空间智能领域的潜力,通过AI Studio推出的工具集,开发者可以探索融合多模态推理的空间智能应用。
与OpenAI的发布会相比,Google的Gemini 2.0发布会显得更为重要,标志着AI从信息理解向实际任务执行的转变,朝着“通用助手”的目标迈进。Google正借助Gemini重塑旗下七大核心产品,影响20亿用户。
原文和模型
【原文链接】 阅读原文 [ 2321字 | 10分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★