OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年

AIGC动态5个月前发布 aitechtalk
995 0 0
OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年

 

文章摘要


【关 键 词】 GPT-4o mini多模态小模型智能提升成本降低

OpenAI于7月18日推出了GPT-4o mini,标志着其进入多模态小模型领域。这一举措与欧洲和中国团队在小模型领域的研究相呼应,这些团队已在此领域研究了大半年。GPT-4o mini的发布不仅显示了端侧模型和智能小模型的发展趋势,也引发了对小模型未来价值的讨论。

AI技术专家Andrej Karpathy认为,未来将出现参数规模小但思考能力强的小模型,这将是AI大模型的最终目标。他指出,目前AI模型之所以“大”,是因为训练方法不够高效。面壁智能团队也表达了相似观点,并提出了“面壁定律”,即模型参数规模随时间递减,但智能水平不断上升。

GPT-4o mini在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5 Turbo和其他小模型。它支持的语言范围与GPT-4o相同,且长上下文性能有所提高。在大规模多任务语言理解(MMLU)测试中,GPT-4o mini的得分为82%,显示出其强大的语言理解和使用能力。

OpenAI表示,GPT-4o mini的成本比GPT-3.5 Turbo便宜超过60%,并向免费版、Plus版和团队版的ChatGPT用户开放。这一举措可能是为了吸引那些无法承担大模型昂贵费用的开发者,为他们提供更轻量且廉价的工具。

国产大模型团队在小模型领域也取得了显著成果。例如,商汤科技发布了1.8B参数规模的SenseChat-Lite版本,上海人工智能实验室OpenGV Lab推出了多模态小模型系列,面壁智能则在小模型上取得了知识密度的显著提升。

小模型的崛起带来了行业变化,如端侧模型的兴起和开源社区的形成。端侧模型需要与具体行业和领域相结合,同时需要丰富的训练数据和完善的数据工程系统。小模型的开源社区使更多高校科研人员能够参与研究,增加了竞争压力。

OpenAI发布GPT-4o mini可能是大模型价格战的缩影,对云端API市场造成冲击。端侧大模型的兴起为应用公司提供了智能化底座,但同时也带来了推理成本的挑战。国产大模型团队在小模型领域的技术成果值得关注,显示了国产大模型技术的快速发展。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3603字 | 15分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...