刚刚，OpenAI劲敌重磅发布Inflection-2.5！性能媲美GPT-4但计算量仅为40%，高情商应用Pi日活已破百万

AIGC动态2年前 (2024)发布 AIera

2,223 0 0

模型信息

【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★★★

文章摘要

摘要：

Inflection-2.5模型的发布标志着AI领域的新里程碑。这款由Inflection公司开发的新模型，在仅使用40%的计算量的情况下，性能与GPT-4不相上下。这一成就不仅展示了Inflection在AI技术上的突破，也对OpenAI的GPT-4构成了直接挑战。与此同时，Inflection的聊天工具Pi也得到了升级，其日活跃用户已达到百万级别，显示出极高的用户粘性。

Inflection-2.5模型的发布，是在OpenAI的前员工创立的Anthropic公司发布Claude 3模型之后不久。这两款模型都显示出了在智力任务上与GPT-4竞争的能力。Inflection-2.5在多个领域，尤其是STEM领域，都有显著的提升。在MMLU基准测试和GPQA Diamond基准测试中，Inflection-2.5的表现都非常出色，与GPT-4的差距非常小。

Inflection公司还对MT-Bench基准测试中的问题进行了修正，发现大约25%的案例中，原始答案存在错误或基于的假设有漏洞。这一发现强调了准确和合理的题目设计对于评估模型性能的重要性。

此外，Inflection还提供了物理学GRE考试的试卷，以更好地测试模型。这些试卷的发布，不仅为AI模型提供了新的测试材料，也为AI领域的研究者提供了宝贵的资源。

总结：

Inflection-2.5模型的发布，是AI领域的一个重要进展。它不仅在性能上与GPT-4相媲美，而且在计算资源的使用上更为高效。Pi聊天工具的升级，进一步增强了其在用户互动方面的能力。Inflection公司在基准测试和题目设计上的严谨态度，为AI模型的评估提供了更准确的标准。随着这些新模型和工具的发布，AI领域的发展将更加迅速，同时也为用户带来了更多的可能性。

原文信息

【原文链接】 阅读原文
【阅读预估】 2070 / 9分钟
【原文作者】 新智元
【作者简介】 智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。