文章摘要
【关 键 词】 苹果AI、谷歌Gemini、iPhone功能、AI大模型、WWDC2024
上个月,彭博社报道了苹果公司正在与谷歌进行谈判,希望将谷歌的AI系统Gemini集成到iPhone中,以增强iPhone的AI功能。这一消息引起了业界的广泛关注,因为苹果一向以自主研发著称,而此次却考虑与第三方合作,这在苹果的历史上并不常见。尽管苹果自身也在AI领域有所投入,例如发布了自研的MM1大模型论文,但内部团队认为与主流的GPT-4、Gemini相比,苹果的大模型不具备竞争力,这可能是苹果寻求外部合作的原因之一。
苹果可能会在2024年的WWDC大会上公布自研模型的进展和与第三方厂商的合作计划。iOS 18被内部誉为史上升级最大的版本,主要卖点之一是Siri将成为更加智能的“私人助理”。如果苹果与谷歌的合作落地,由于合规问题,苹果需要在中国内地寻找合作伙伴,而百度是最有可能的合作方。
文章还介绍了谷歌的Gemini在手机上能实现的AI功能,包括魔法修图、魔法换天、音频橡皮擦、最佳照片、AI壁纸、视频增强、即圈即搜和语音备忘录转文字等。这些功能在Google Pixel 8 Pro上得到了体验,但大多数功能依赖网络连接,端侧模型Gemini Nano的功能有限。此外,文章还对比了国行版三星S24与谷歌合作的AI功能,发现国内技术提供方在照片编辑和搜索能力上已经接近Gemini的水平。
总的来说,尽管国内技术提供方在某些AI功能上已经接近谷歌的Gemini,但苹果在产品设计上的思维与其他厂商不同。苹果更看重的是Gemini基于自然语义的对话能力,而不仅仅是工具类功能。理想状态下,如果Siri接入Gemini,用户可以将Siri当作一个聊天机器人,系统会学习用户的生活轨迹和习惯,智能作出判断。苹果需要解决的是如何将一整套流程完整、顺畅地串联起来,这是新版Siri的挑战。相比之下,字节系的豆包AI智能助手在自然语义沟通能力上可能更胜一筹,因为只有让Siri听起来更像一个真人,用户才会有与之沟通的欲望。
原文和模型
【原文链接】 阅读原文 [ 3300字 | 14分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 gpt-4
【摘要评分】 ★★★★☆