文章摘要
【关 键 词】 AI模型、Gemini 2.0、多模态、TPU Trillium、竞争
谷歌在与OpenAI的竞争中发布了Gemini 2.0系列人工智能模型的首个版本,名为Gemini 2.0 Flash。这个模型提供聊天版本供全球用户使用,并有一个实验版供开发人员免费使用,后者具备文本转语音和图像生成功能。谷歌宣称这是Agent时代最强大的AI模型,速度是上一代的两倍,性能更强。Gemini 2.0在代码生成和提供事实正确响应方面表现优于前代。
Gemini 2.0 Flash基于1.5 Flash的成功,是谷歌目前最受开发者欢迎的版本,具备快速响应时间和增强性能。它支持多模式输入输出,包括图像、视频、音频,并能原生生成图像和可操纵的文本转语音多语言音频。此外,它还能调用Google搜索、代码执行和第三方用户定义函数等工具。
Gemini 2.0 Flash作为实验模型已通过Google AI Studio和Vertex AI中的Gemini API向开发者提供,早期合作伙伴可使用文本转语音和原生图像生成功能。谷歌还发布了Multimodal Live API,具有实时音频、视频流输入和使用多个组合工具的能力。Gemini 2.0基于谷歌定制的硬件第六代TPU Trillium构建,提供100%算力支持。
谷歌还推出了Deep Research功能,使用高级推理和长上下文功能充当研究助手,探索复杂主题并代表用户编写报告。AI Overviews功能已触达10亿用户,谷歌计划将Gemini 2.0的高级推理能力融入AI Overviews,以攻克更复杂的主题和多步骤问题。
Gemini 2.0是谷歌在人工智能竞赛中的最新成果,与微软、Meta以及AI初创公司如OpenAI、Perplexity和Anthropic等展开竞争。谷歌CEO Sundar Pichai表示,他愿意在任何时候对两家公司的模型进行并排比较。微软CEO纳德拉对谷歌的技术实力给予了高度肯定。
原文和模型
【原文链接】 阅读原文 [ 2317字 | 10分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆