Inflection-2.5发布:情商最高大模型、性能媲美GPT-4计算量仅为40%,App日活已破百万

AIGC动态8个月前发布 Founder Park
829 0 0

模型信息


【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★★★

Inflection-2.5发布:情商最高大模型、性能媲美GPT-4计算量仅为40%,App日活已破百万
 

文章摘要


【关 键 词】 Inflection-2.5PiAI性能个性化

Inflection AI 发布新一代大语言模型 Inflection-2.5

美国 AI 创业公司 Inflection AI 于本周四发布了新一代大语言模型 Inflection-2.5,该模型在仅使用 40% 的计算量下,实现了与 GPT-4 相媲美的性能。与此同时,Inflection AI 的聊天工具 Pi 也得到了新升级模型的支持,现已达到百万日活用户,展现出高智商和独特的亲和力。

Pi:个性化 AI 的新升级

Pi 是 Inflection AI 在 2023 年 5 月发布的第一款产品,旨在打造具有同理心、实用且安全的个人 AI。随着 Inflection-2.5 的发布,Pi 不仅在情商(EQ)上有所提升,还在智力(IQ)上得到了增强。Inflection-2.5 在保持 Pi 的个性化特点和同理心的同时,实现了与世界顶尖 LLM 相媲美的基础能力。

Inflection-2.5 的性能与效率

Inflection-2.5 在多项任务上的表现超过了 GPT-4 的 94%,尤其在 STEM 领域表现突出。在 MMLU 基准测试和 GPQA Diamond 专家级基准测试中,Inflection-2.5 的进步显著。此外,Inflection-2.5 在数学和编程方面的能力也有显著提升,尽管与 GPT-4 仍有差距。

Inflection AI 的背景与团队

Inflection AI 由前谷歌 DeepMind 联合创始人创办,估值达到 40 亿美元,成为全球估值第三高的 AI 创业公司。公司的投资人包括微软、英伟达以及多位知名科技界人士。Inflection AI 的团队由前 Google Brain 和 OpenAI 的研究员组成,致力于开发具有人文主义色彩的对话式 AI。

用户体验与实际应用

尽管 Inflection-2.5 在多个测试中表现出色,但用户的实际体验可能会因网络信息检索、少样本提示方式等因素而有所不同。Inflection AI 团队在 MT-Bench 基准评测中发现问题并进行了修正,以确保模型性能的客观评估。

结论

Inflection AIInflection-2.5 和聊天工具 Pi 的新升级,标志着公司在 AI 领域取得了显著进步。这些发展不仅挑战了 GPT-4 的地位,也为用户带来了更智能、更个性化的 AI 体验。随着 AI 技术的不断进步,我们期待看到更多创新和突破。

原文信息


【原文链接】 阅读原文
【阅读预估】 2852 / 12分钟
【原文作者】 Founder Park
【作者简介】 来自极客公园,专注与科技创业者聊「真问题」。

© 版权声明

相关文章

暂无评论

暂无评论...