谷歌深夜祭出Gemini 2.0 “硬刚”OpenAI，还让开发者免费试用！Agent时代最强模型登场了？

AI-Agent1年前 (2024)发布 ai-front

1,851 0 0

谷歌深夜祭出Gemini 2.0 “硬刚”OpenAI，还让开发者免费试用！Agent时代最强模型登场了？

文章摘要

【关键词】 AI模型、Gemini 2.0、多模态、TPU Trillium、竞争

谷歌在与OpenAI的竞争中发布了Gemini 2.0系列人工智能模型的首个版本，名为Gemini 2.0 Flash。这个模型提供聊天版本供全球用户使用，并有一个实验版供开发人员免费使用，后者具备文本转语音和图像生成功能。谷歌宣称这是Agent时代最强大的AI模型，速度是上一代的两倍，性能更强。Gemini 2.0在代码生成和提供事实正确响应方面表现优于前代。

Gemini 2.0 Flash基于1.5 Flash的成功，是谷歌目前最受开发者欢迎的版本，具备快速响应时间和增强性能。它支持多模式输入输出，包括图像、视频、音频，并能原生生成图像和可操纵的文本转语音多语言音频。此外，它还能调用Google搜索、代码执行和第三方用户定义函数等工具。

Gemini 2.0 Flash作为实验模型已通过Google AI Studio和Vertex AI中的Gemini API向开发者提供，早期合作伙伴可使用文本转语音和原生图像生成功能。谷歌还发布了Multimodal Live API，具有实时音频、视频流输入和使用多个组合工具的能力。Gemini 2.0基于谷歌定制的硬件第六代TPU Trillium构建，提供100%算力支持。

谷歌还推出了Deep Research功能，使用高级推理和长上下文功能充当研究助手，探索复杂主题并代表用户编写报告。AI Overviews功能已触达10亿用户，谷歌计划将Gemini 2.0的高级推理能力融入AI Overviews，以攻克更复杂的主题和多步骤问题。

Gemini 2.0是谷歌在人工智能竞赛中的最新成果，与微软、Meta以及AI初创公司如OpenAI、Perplexity和Anthropic等展开竞争。谷歌CEO Sundar Pichai表示，他愿意在任何时候对两家公司的模型进行并排比较。微软CEO纳德拉对谷歌的技术实力给予了高度肯定。