1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首
文章摘要
【关 键 词】 AI模型、推理能力、多模态、长上下文、技术突破
谷歌近期发布了Gemini 2.0 Flash Thinking推理模型的加强版,并在Chatbot Arena排行榜上再次登顶。谷歌AI负责人Jeff Dean表示,新版本引入了1M长的上下文,以增强对长篇文本的深入分析能力,并减少模型思想与答案之间的矛盾。Gemini 2.0 Flash Thinking基于Gemini 2.0 Flash,经过专门训练,能够使用思维来增强推理能力。该模型在技术上的两大突破是处理高达1M token的长上下文理解能力,以及在多轮对话和推理中自我纠错的能力。此外,模型会明确展示其思考过程,如在解答物理问题时解释推理过程。
Gemini 2.0 Flash Thinking在AIME2024(数学能力测试)、GPQA Diamond(科学能力测试)和MMMU(多模态推理能力)中表现突出,尤其是数学成绩提升了54%。谷歌将所有Gemini系列模型集成在名为Google AI Studio的界面中,提供一站式服务,包括API密钥、创建提示词、访问实时对话、开发APP等。尽管界面功能分散,谷歌计划在模型正式发布时提供完整的技术报告,并根据用户反馈进行改进。
谷歌的开发理念是打造一个全面均衡的通用模型,能够完成用户期待的各类任务。Gemini 2.0 Flash Thinking的亮点是超长的上下文窗口,能够在对话过程中保持连贯的思维,并灵活运用之前积累的信息完成任务。此外,Gemini 2.0在理解多模态能力上也有所提升,可以根据语音提示实时改变界面元素的排布。这一能力得益于Project Mariner,一个旨在探索人类与AI智能体互动的研究性实验项目。目前,谷歌正在瞄准3D数据领域,期待其下一个突破。
原文和模型
【原文链接】 阅读原文 [ 1503字 | 7分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆