碾压Cursor？谷歌突发Gemini 2.5 Pro 预览版，编码能力全网第一

1,289 0 0

文章摘要

谷歌在年度I/O开发者大会前夕，发布了Gemini 2.5 Pro Preview（I/O版），这是其旗舰AI模型的升级版本。该模型在多项主流基准测试中表现优异，特别是在编程和Web开发领域。Gemini 2.5 Pro Preview在LMArena编程类别和WebDev Arena排行榜上均名列第一，显示出其在编码和构建交互式Web应用方面的显著提升。此外，新版本在代码转换和编辑任务上也表现出色，比上一版本在Web Arena排行榜上高出147个Elo积分。

Gemini 2.5 Pro Preview通过Gemini API、Vertex AI和AI Studio平台提供，价格与之前的版本相同。该模型还被引入到谷歌的Gemini聊天机器人应用中，供Web及移动设备端使用。DeepMind CEO Demis Hassabis在X上表示，这是谷歌迄今为止构建的最佳编程模型，其在Web开发挑战中展现出的能力尤为突出。

在视频理解方面，Gemini 2.5 Pro Preview同样表现卓越，在VideoMME基准测试中取得了84.8%的得分。结合其编码功能，该模型实现了之前版本无法完成的全新流程，提供了更丰富的功能体验。谷歌在博文中提到，新版本不仅提升了编程性能，还解决了开发者提出的多项关键反馈，包括减少函数调用中的错误并提高触发率。

在前端Web开发方面，Gemini 2.5 Pro Preview表现优异，能够帮助开发者快速实现新功能。例如，在IDE中使用该模型，可以自动生成与现有应用风格一致的新组件，如视频播放器。此外，该模型在听写入门应用中展现了其强大的实用功能和优雅的用户界面，通过动态波长动画、流畅的响应式布局和巧妙的按钮悬停交互效果，显著提升了开发效率。

社区对Gemini 2.5 Pro Preview的反应热烈，AI编码工具Cursor CEO Michael Truell称赞其进一步提升了编码能力。Hacker News上的用户认为，尽管Gemini 2.5系列比其他模型更可靠，但仍无法与人类开发者媲美。然而，有用户认为AI在编码能力方面超越人类只是时间问题，并呼吁将精力放在如何适应这一趋势上。

尽管Gemini 2.5 Pro Preview在编码技能上有所提高，但也有用户指出，其他方面略有下降，认为该模型更适合专注于编码任务，而非一般用途。总体而言，Gemini 2.5 Pro Preview的发布标志着谷歌在AI竞赛中的又一重要进展，特别是在编程和Web开发领域的应用潜力。