文章摘要
【关 键 词】 推理能力、机器学习、多模式、AI竞争、数据类型
谷歌在其“Gemini 2.0 Flash Thinking”模型上取得了新进展,该模型以其卓越的推理能力而受到关注,能够通过“明确地展示自己的思维”来解决复杂问题,其水平与物理、化学和生物学博士生相当。谷歌CEO Sundar Pichai称其为“我们迄今为止最周到的模型”。该模型基于“2.0 Flash的速度和性能”,并经过训练以大声思考,从而具有更强的推理性能。为了与OpenAI的o1竞争,谷歌DeepMind首席科学家Jeff Dean表示,该模型经过训练可以使用思维来加强其推理能力,同时受益于速度更快的Gemini Flash 2.0模型。
Gemini 2.0 Flash Thinking通过思考一系列步骤然后提供解决方案来解答物理问题。它已在Google AI Studio和Vertex AI中推出,并在Chatbot Arena LLM排行榜上首次亮相,位居“所有类别第一”。谷歌还在Gemini应用程序中推出了2.0 Experimental Advanced,Gemini-Exp-1206也位居排行榜榜首。
该模型意味着机器将指令分解为可以产生更强结果的更小的任务。Google产品负责人Logan Kilpatrick展示了该模型如何推理解决涉及视觉和文本元素的问题,并表示“这只是我们推理之旅的第一步”。
在开发者文档中,谷歌解释说,思考模式的响应推理能力比基础版Gemini 2.0 Flash模型更强,而基础版Gemini 2.0 Flash模型是谷歌最新、最出色的模型。新模型仅支持32000个标记输入(约50-60页文本),并且每个输出响应可以产生8000个标记。它最适合“多模式理解、推理”和“编码”。
与OpenAI的竞争推理模型o1和o1 mini不同,Gemini 2.0允许用户通过下拉菜单访问其逐步推理,从而更清晰、更透明地了解模型如何得出结论。这解决了人们对人工智能作为“黑匣子”运行的长期担忧,并使该模型与竞争对手的其他开源模型相提并论。
一些开发者对该模型的早期简单测试表明,它可以正确而快速地回答一些对于其他AI模型来说非常棘手的问题。Gemini 2.0 Flash Thinking是对竞争对手OpenAI o1系列的进一步改进,旨在处理跳跃中的图像。目前,这两种模型也只能返回文本。
Gemini 2.0 Flash Thinking的多模式能力扩展了其潜在用例,使其能够应对结合不同类型数据的场景。开发人员可以通过Google AI Studio和Vertex AI利用这些功能,其中模型可供实验。随着人工智能领域的竞争日趋激烈,Gemini 2.0 Flash Thinking可能标志着问题解决模型新时代的开始,它能够处理多种数据类型、提供可视化推理并大规模执行,这使它成为推理人工智能市场的有力竞争者,可与OpenAI的o1系列及其他产品相媲美。
原文和模型
【原文链接】 阅读原文 [ 1140字 | 5分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆