1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

AIGC动态8个月前发布 almosthuman2014

1,710 0 0

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

文章摘要

谷歌近期发布了Gemini 2.0 Flash Thinking推理模型的加强版，并在Chatbot Arena排行榜上再次登顶。谷歌AI负责人Jeff Dean表示，新版本引入了1M长的上下文，以增强对长篇文本的深入分析能力，并减少模型思想与答案之间的矛盾。Gemini 2.0 Flash Thinking基于Gemini 2.0 Flash，经过专门训练，能够使用思维来增强推理能力。该模型在技术上的两大突破是处理高达1M token的长上下文理解能力，以及在多轮对话和推理中自我纠错的能力。此外，模型会明确展示其思考过程，如在解答物理问题时解释推理过程。

Gemini 2.0 Flash Thinking在AIME2024（数学能力测试）、GPQA Diamond（科学能力测试）和MMMU（多模态推理能力）中表现突出，尤其是数学成绩提升了54%。谷歌将所有Gemini系列模型集成在名为Google AI Studio的界面中，提供一站式服务，包括API密钥、创建提示词、访问实时对话、开发APP等。尽管界面功能分散，谷歌计划在模型正式发布时提供完整的技术报告，并根据用户反馈进行改进。

谷歌的开发理念是打造一个全面均衡的通用模型，能够完成用户期待的各类任务。Gemini 2.0 Flash Thinking的亮点是超长的上下文窗口，能够在对话过程中保持连贯的思维，并灵活运用之前积累的信息完成任务。此外，Gemini 2.0在理解多模态能力上也有所提升，可以根据语音提示实时改变界面元素的排布。这一能力得益于Project Mariner，一个旨在探索人类与AI智能体互动的研究性实验项目。目前，谷歌正在瞄准3D数据领域，期待其下一个突破。