OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

AIGC动态1年前 (2024)发布 aitechtalk

3,015 0 0

文章摘要

OpenAI于7月18日推出了GPT-4o mini，标志着其进入多模态小模型领域。这一举措与欧洲和中国团队在小模型领域的研究相呼应，这些团队已在此领域研究了大半年。GPT-4o mini的发布不仅显示了端侧模型和智能小模型的发展趋势，也引发了对小模型未来价值的讨论。

AI技术专家Andrej Karpathy认为，未来将出现参数规模小但思考能力强的小模型，这将是AI大模型的最终目标。他指出，目前AI模型之所以“大”，是因为训练方法不够高效。面壁智能团队也表达了相似观点，并提出了“面壁定律”，即模型参数规模随时间递减，但智能水平不断上升。

GPT-4o mini在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5 Turbo和其他小模型。它支持的语言范围与GPT-4o相同，且长上下文性能有所提高。在大规模多任务语言理解（MMLU）测试中，GPT-4o mini的得分为82%，显示出其强大的语言理解和使用能力。

OpenAI表示，GPT-4o mini的成本比GPT-3.5 Turbo便宜超过60%，并向免费版、Plus版和团队版的ChatGPT用户开放。这一举措可能是为了吸引那些无法承担大模型昂贵费用的开发者，为他们提供更轻量且廉价的工具。

国产大模型团队在小模型领域也取得了显著成果。例如，商汤科技发布了1.8B参数规模的SenseChat-Lite版本，上海人工智能实验室OpenGV Lab推出了多模态小模型系列，面壁智能则在小模型上取得了知识密度的显著提升。

小模型的崛起带来了行业变化，如端侧模型的兴起和开源社区的形成。端侧模型需要与具体行业和领域相结合，同时需要丰富的训练数据和完善的数据工程系统。小模型的开源社区使更多高校科研人员能够参与研究，增加了竞争压力。

OpenAI发布GPT-4o mini可能是大模型价格战的缩影，对云端API市场造成冲击。端侧大模型的兴起为应用公司提供了智能化底座，但同时也带来了推理成本的挑战。国产大模型团队在小模型领域的技术成果值得关注，显示了国产大模型技术的快速发展。

原文和模型

【原文链接】 阅读原文 [ 3603字 | 15分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # GPT-GPTs # 大模型 # GPT-4o mini # 多模态 # 小模型 # 成本降低 # 智能提升

文章版权归作者所有，未经允许请勿转载。

模型评测不是用来刷榜的，智源要用“辩论赛”的方式找回评测该有的样子

硅星人Pro

1,430

全面超越GPT-4，Claude 3终于来了，有大学生智商，支持百万token

机器之心

2,324

谷歌发布Gemini Live：对标GPT-4o，让每一个人都有贾维斯

AIGC开放社区

2,166

硅谷掀桌！DeepSeek遭OpenAI和Anthropic围剿，美国网友都看不下去了

量子位

1,649

MIT系初创打破Transformer霸权！液体基础模型刷新SOTA，非GPT架构首次显著超越Transformer

新智元

2,733

生成式AI迎来窗口期，阶跃星辰加速冲刺｜钛媒体AGI

钛媒体AGI

2,094

暂无评论

暂无评论...

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

文章摘要

原文和模型

GPT-4o mini背后团队揭秘：9人团华人面孔过半，清华北大同济校友在列

香港理工大学 MIND 实验室招收进化计算/类脑计算/语音信号处理等方向全奖博士生/博士后

相关文章

暂无评论

热门网址

热门文章

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

文章摘要

原文和模型

GPT-4o mini背后团队揭秘：9人团华人面孔过半，清华北大同济校友在列

香港理工大学 MIND 实验室招收进化计算/类脑计算/语音信号处理等方向全奖博士生/博士后

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章