Inflection-2.5:性能可与GPT-4和Gemini相媲美的大模型
模型信息
【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★☆☆
文章摘要
【关 键 词】 Inflection AI、LLM进展、融资成功、AI集群、性能突破
近期,Inflection AI 在大型语言模型(LLM)领域取得了显著进展,其推出的Inflection-2.5模型在性能上与 OpenAI 的 GPT-4 和 Google 的 Gemini 等顶尖 LLM 相媲美。这一成就得益于公司最近完成的一轮 13 亿美元融资,由 微软、英伟达 以及知名投资者如 Reid Hoffman、Bill Gates 和 Eric Schmidt 领投,使得 Inflection AI 累计筹集的资金达到了 15.25 亿美元。
Inflection AI 正在与 CoreWeave 和 英伟达 合作,构建全球最大的 AI集群,该集群由 22000 张 NVIDIA H100 Tensor Core显卡 构成,这在历史上是前所未有的。这一强大的计算能力将助力公司培训和部署新一代大规模 AI模型,并在 个人AI 领域取得突破。Inflection AI 的集群在开源基准 MLPerf 上展现了先进性能,仅用 11 分钟就完成了 LLM 的训练任务,成为该基准上最快的集群。
Inflection AI 之前发布的 Inflection-1模型 在多项基准测试中超越了包括 GPT-3.5、LLaMA、Chinchilla 和 PaLM-540B 在内的行业巨头。用户可以通过自然的方式与 Inflection AI 的个人 AI —— Pi 互动,获得快速、相关、有价值的信息和建议。Inflection AI 对透明度和可重复性的承诺体现在其发布的技术备忘录上,详细介绍了 Inflection-1 在多个基准测试中的评估和表现。
Inflection-2.5模型 现已面向所有使用 Pi 的用户开放,支持 Web端、iOS、Android 以及全新的 桌面应用 等多个平台。这一整合是 Inflection AI 实现其“为每个人打造个人 AI”使命的重要里程碑。在性能方面,Inflection-2.5 在各类智力导向任务中的表现达到了 GPT-4 的 72%,而在 STEM领域,Inflection-2.5 的平均性能达到了 GPT-4 的 94%,尤其在 编程 和 数学 领域表现出色。
Inflection-2.5 在行业基准测试中也展现出色表现,尤其是在 MMLU基准 和 GPQA Diamond基准 上,与 Inflection-1 相比有明显提升。在 匈牙利数学考试 和 物理GRE 中,Inflection-2.5 展现了出众的表现。Inflection-2.5 不仅保持了 Pi 的个性化特点和安全标准,还提升了其作为多功能且极具价值的个人 AI 的地位。
Inflection AI 提供了 Inflection-2.5 在各行业基准测试中的全面技术结果和细节,履行了其对透明度和可重复性的承诺。尽管这些评估代表了 Pi动力模型 的性能,但用户的实际体验可能会因网络检索、少样本提示的结构和其他生产端差异等因素略有不同。
总结来说,Inflection-2.5 代表了在 LLM领域的一次重大飞跃,其性能可与行业标杆相媲美,同时只使用了一小部分计算资源。Inflection-2.5 集成到 Pi 中,将原始功能与同理心个性和安全标准相结合,提供了丰富的用户体验。Inflection AI 的前瞻性不仅体现在模型开发上,还在于公司意识到了预训练和微调对于创造高质量、安全、有用的 AI 体验的重要性。作为一个垂直整合的 AI 工作室,Inflection AI 自行处理了从数据摄入、模型设计到高性能基础设施的整个过程,不断突破 LLM 的极限,引领 AI 社区期待其接下来的新突破。
原文信息
【原文链接】 阅读原文
【阅读预估】 2107 / 9分钟
【原文作者】 AI大模型实验室
【作者简介】 关注大模型技术的创新与发展,探索大模型的实际应用,探讨 AI 未来对企业与社会发展的影响。