冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

 

文章摘要


【关 键 词】 AI模型Gemini 2.0代码生成性能提升技术革命

谷歌本周发布了新一代的AI模型系列Gemini 2.0,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite和旗舰模型Gemini 2.0 Pro实验版本,并在Gemini App中推出了推理模型Gemini 2.0 Flash Thinking。这些模型在多个领域任务中表现出色,其中Gemini 2.0 Pro在Chatbot Arena所有类别中排名第一,尤其在代码等复杂任务上表现突出。谷歌首席科学家Jeff Dean表示,Gemini 2.0 Pro能够一次性生成包含正确数据结构和搜索算法的完整代码。

Gemini 2.0系列模型的性能提升显著,能够生成代码实现模拟物理规律的效果。第三方试用结果也显示了其性能的显著提升。谷歌通过Gemini 2.0 Flash和2.0 Flash-Lite降低了成本,两者均采用单一输入类型的定价模式,取消了对短上下文和长上下文请求的区分,使得在混合上下文工作负载下的成本可能低于Gemini 1.5 Flash。

Gemini 2.0 Pro实验版本是谷歌迄今为止在编码和复杂指令任务中表现最好的模型,支持最长200万tokens上下文窗口,能够处理大量信息,并支持调用Google搜索和代码执行等工具。Gemini 2.0 Flash作为Flash系列模型的最新成员,适合大规模处理高容量、高频率任务,并通过100万tokens上下文窗口进行多模态推理。Gemini 2.0 Flash-Lite则是谷歌性价比最高的模型,针对大规模文本输出用例进行了成本优化。

Gemini 2.0的全面开放在机器学习社区引起了热烈讨论,被认为是改变游戏规则的技术革命。在处理真实文档时,Gemini 2.0能够做到高准确率和低成本,尤其在PDF到Markdown转换方面提供近乎完美的准确性。这标志着大模型技术革命在多个领域已经出现。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 1930字 | 8分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...