百万tokens低至1元!大模型越来越卷了

百万tokens低至1元!大模型越来越卷了

 

文章摘要


【关 键 词】 AGI前景智谱AI大模型降价商业化落地技术进步

智谱AI在ICLR 2024大会上公布了面向AGI通用人工智能前景的三大技术趋势,并预告了GLM的后续升级版本。同时,智谱大模型开放平台上线了新的价格体系,其中入门级产品GLM-3 Turbo模型调用价格下调80%,从5元/百万tokens降至1元/百万tokens。调整后,使用GLM-3 Turbo创作一万条小红书文案(以350字计)将仅需约1元钱,足以吸引更多企业和个人使用。此外,新注册开放平台用户赠送额度提升500%,从500万tokens提升至2500万tokens。

GLM-3 Turbo是大模型开放平台最受欢迎的模型产品,适用于对知识量、推理能力、创造力要求较高的场景。此次调价后,其竞争力更强,国内其他128k级别大模型的调用价格大多从百万tokens数元到几十元不等。企业级产品GLM-4/GLM-4V价格仍维持在0.1元/千tokens,百万tokens的价格为100元,但作为一款能力逼近GPT-4的国内领先大模型,这一价格仍然具有竞争力。

大模型降价有利于吸引更多开发者和企业客户,扩大其生态圈。华福证券最近发布报告称,大模型成本优化与算力需求并不是直接的此长彼消,而是互相搭台、相互成就。定价的持续走低有望带来更快的商业化落地,进而会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。

智谱AI的API定价更新体现了其覆盖开发者用户的决心,单次调用适合对实时性要求高的中小用户,批量调用定价更低则是为数据量大、对成本敏感的企业及用户量身定制。作为国内应用最为广泛的开放平台,智谱的开放平台上已经聚集了超过数十万的企业和开发者,并且在持续快速增长,过去的半年每日的token消耗增长超过一百倍。

技术的进步也为降低开发、运行LLMs成本提供了现实可能。例如,从基础设施来看,随着一些老款AI芯片(比如Nvidia A100)降价,大模型培训成本下降了约60%。英伟达也优化了软件性能,帮助开发者更快训练和运行大模型。研发人员也在模型架构、模型压缩以及GPU调用等方面探索到一些降本增效的办法。

智谱曾表示,通过模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现以及精细化集群调度等技术将GLM-3 Turbo的推理成本压缩到1/5。自大模型开放平台上线以来,在模型效果和推理性能不断提升的情况下,已累计降价超过百倍。

除了降价,智谱AI还宣布包括GLM-3 Turbo以及最先进基座大模型GLM-4在内的GLM系列模型也将迎来更新,目前正在灰度测试中,很快将和广大开发者和应用者见面。

原文和模型


【原文链接】 阅读原文 [ 1119字 | 5分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...