Gemini 2.0来了：一个要做所有AI agent底座的超级模型

AI-Agent1年前 (2024)发布 Si-Planet

2,944 0 0

文章摘要

【关键词】 AI升级、Apple设备、Google模型、多模态、智能助手

OpenAI在发布会的第五天宣布了ChatGPT与Apple设备的集成升级，用户可以在Apple设备上无需ChatGPT账号即可启用Apple Intelligence扩展，享受Siri的复杂任务转交、内容创作等功能。此外，iPhone 16和macOS也分别推出了视觉智能模式和快捷调用功能。尽管演示内容简单，但整体表现平平。

与此同时，Google发布了其迄今为止最强大、专为“代理时代”设计的下一代模型Gemini 2.0，以及首个版本Gemini 2.0 Flash实验版。Gemini 2.0 Flash以低延迟和增强性能为核心，性能超越前代1.5 Pro，速度提升一倍，并在多模态方面实现了重大突破，支持图像、视频、音频等多种输入和输出功能，并能原生调用Google搜索、执行程序代码，支持第三方工具接入。

Google还推出了多模态实时API，支持开发者构建动态交互应用。2.0 Flash实验版已整合至Gemini聊天助手中，全球用户可通过桌面和移动网页版访问，移动应用集成也将推出。Google还在搜索中的AI概览功能中测试Gemini 2.0的高级推理能力，并计划扩展到更多产品中。

针对Advanced付费用户，Google推出了Deep Research功能，专为复杂在线研究设计，能自动创建研究计划，收集和分析信息，生成综合报告。Gemini 2.0系列模型定位为“AI model for the agentic era”，具备更强的代理能力，能理解用户环境，执行多步预判思维和操作。

Google展示了基于2.0 Flash新能力的原型项目进展，包括Project Astra、Project Mariner和Jules等，涉及现实世界中的通用智能助手、浏览器中的复杂任务助手和面向开发者的AI编程助手。Gemini 2.0还展示了其在空间智能领域的潜力，通过AI Studio推出的工具集，开发者可以探索融合多模态推理的空间智能应用。

与OpenAI的发布会相比，Google的Gemini 2.0发布会显得更为重要，标志着AI从信息理解向实际任务执行的转变，朝着“通用助手”的目标迈进。Google正借助Gemini重塑旗下七大核心产品，影响20亿用户。