Inflection-2.5:性能可与GPT-4和Gemini相媲美的大模型

AIGC动态9个月前发布 damoxingLab
866 0 0

模型信息


【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

Inflection-2.5:性能可与GPT-4和Gemini相媲美的大模型
 

文章摘要


【关 键 词】 Inflection AILLM进展融资成功AI集群性能突破

近期,Inflection AI 在大型语言模型(LLM)领域取得了显著进展,其推出的Inflection-2.5模型在性能上与 OpenAIGPT-4GoogleGemini 等顶尖 LLM 相媲美。这一成就得益于公司最近完成的一轮 13 亿美元融资,由 微软英伟达 以及知名投资者如 Reid HoffmanBill GatesEric Schmidt 领投,使得 Inflection AI 累计筹集的资金达到了 15.25 亿美元。

Inflection AI 正在与 CoreWeave英伟达 合作,构建全球最大的 AI集群,该集群由 22000 张 NVIDIA H100 Tensor Core显卡 构成,这在历史上是前所未有的。这一强大的计算能力将助力公司培训和部署新一代大规模 AI模型,并在 个人AI 领域取得突破。Inflection AI 的集群在开源基准 MLPerf 上展现了先进性能,仅用 11 分钟就完成了 LLM 的训练任务,成为该基准上最快的集群。

Inflection AI 之前发布的 Inflection-1模型 在多项基准测试中超越了包括 GPT-3.5LLaMAChinchillaPaLM-540B 在内的行业巨头。用户可以通过自然的方式与 Inflection AI 的个人 AI —— Pi 互动,获得快速、相关、有价值的信息和建议。Inflection AI 对透明度和可重复性的承诺体现在其发布的技术备忘录上,详细介绍了 Inflection-1 在多个基准测试中的评估和表现。

Inflection-2.5模型 现已面向所有使用 Pi 的用户开放,支持 Web端iOSAndroid 以及全新的 桌面应用 等多个平台。这一整合是 Inflection AI 实现其“为每个人打造个人 AI”使命的重要里程碑。在性能方面,Inflection-2.5 在各类智力导向任务中的表现达到了 GPT-4 的 72%,而在 STEM领域Inflection-2.5 的平均性能达到了 GPT-4 的 94%,尤其在 编程数学 领域表现出色。

Inflection-2.5 在行业基准测试中也展现出色表现,尤其是在 MMLU基准GPQA Diamond基准 上,与 Inflection-1 相比有明显提升。在 匈牙利数学考试物理GRE 中,Inflection-2.5 展现了出众的表现。Inflection-2.5 不仅保持了 Pi 的个性化特点和安全标准,还提升了其作为多功能且极具价值的个人 AI 的地位。

Inflection AI 提供了 Inflection-2.5 在各行业基准测试中的全面技术结果和细节,履行了其对透明度和可重复性的承诺。尽管这些评估代表了 Pi动力模型 的性能,但用户的实际体验可能会因网络检索、少样本提示的结构和其他生产端差异等因素略有不同。

总结来说,Inflection-2.5 代表了在 LLM领域的一次重大飞跃,其性能可与行业标杆相媲美,同时只使用了一小部分计算资源。Inflection-2.5 集成到 Pi 中,将原始功能与同理心个性和安全标准相结合,提供了丰富的用户体验。Inflection AI 的前瞻性不仅体现在模型开发上,还在于公司意识到了预训练和微调对于创造高质量、安全、有用的 AI 体验的重要性。作为一个垂直整合的 AI 工作室,Inflection AI 自行处理了从数据摄入、模型设计到高性能基础设施的整个过程,不断突破 LLM 的极限,引领 AI 社区期待其接下来的新突破。

原文信息


【原文链接】 阅读原文
【阅读预估】 2107 / 9分钟
【原文作者】 AI大模型实验室
【作者简介】 关注大模型技术的创新与发展,探索大模型的实际应用,探讨 AI 未来对企业与社会发展的影响。

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...