谷歌2小时疯狂复仇，终极杀器硬刚GPT-4o！Gemini颠覆搜索，视频AI震破Sora

AI-Agent1年前 (2024)发布 AIera

3,255 0 0

谷歌2小时疯狂复仇，终极杀器硬刚GPT-4o！Gemini颠覆搜索，视频AI震破Sora

文章摘要

【关键词】 人工智能、谷歌I、O、Gemini 1.5 Pro、Project Astra、文生视频模型Veo

Gemini 1.5 Pro：谷歌宣布了其大型语言模型Gemini的新版本，Gemini 1.5 Pro，其上下文长度达到了200万token，远超现有的大型语言模型。这一特性使得模型能够处理更长的输入，如2小时视频、22小时音频、超过6万行代码或140多万单词。
Project Astra：作为对OpenAI GPT-4o的回应，谷歌推出了Project Astra，这是一个视觉识别和语音交互的AI项目，其效果与GPT-4o相当。
文生视频模型Veo：谷歌展示了文生视频模型Veo，它能够生成超过1分钟的酷炫视频，打破了Sora的记录。
谷歌搜索的变革：谷歌宣布将通过Gemini彻底重塑谷歌搜索，使其不再需要用户手动点击搜索结果，而是通过AI Overview进行多步骤推理，自动提供所需信息。
Gemini的应用案例：谷歌CEO展示了Gemini在实际应用中的多个例子，包括帮助用户总结会议要点、识别关于特定主题的电子邮件、为学生提供个性化的科学讨论等。
Agent的智能服务：谷歌展示了其智能助手Agent的新功能，如帮助用户申请退货、探索新城市的服务等，展示了Gemini的多步推理能力。
多模态能力：Gemini支持多模态输入，能够处理用户上传的任何格式的信息，并将其转化为适合用户的形式，实现与用户的互动。
Gemini的目标：谷歌的目标是实现无限长的上下文处理能力，并通过Gemini的多模态、超长上下文和智能体能力，使世界上的所有信息对每个人都可触达、可利用。
开发者社区的增长：谷歌宣布，全球使用Gemini的开发者数量已达到150万人。
AI的普及：谷歌CEO强调，我们正处于Gemini时代，AI技术将对每个人都有用。