百万tokens低至1元！大模型越来越卷了

AIGC动态1年前 (2024)发布 almosthuman2014

2,244 0 0

文章摘要

智谱AI在ICLR 2024大会上公布了面向AGI通用人工智能前景的三大技术趋势，并预告了GLM的后续升级版本。同时，智谱大模型开放平台上线了新的价格体系，其中入门级产品GLM-3 Turbo模型调用价格下调80%，从5元/百万tokens降至1元/百万tokens。调整后，使用GLM-3 Turbo创作一万条小红书文案（以350字计）将仅需约1元钱，足以吸引更多企业和个人使用。此外，新注册开放平台用户赠送额度提升500%，从500万tokens提升至2500万tokens。

GLM-3 Turbo是大模型开放平台最受欢迎的模型产品，适用于对知识量、推理能力、创造力要求较高的场景。此次调价后，其竞争力更强，国内其他128k级别大模型的调用价格大多从百万tokens数元到几十元不等。企业级产品GLM-4/GLM-4V价格仍维持在0.1元/千tokens，百万tokens的价格为100元，但作为一款能力逼近GPT-4的国内领先大模型，这一价格仍然具有竞争力。

大模型降价有利于吸引更多开发者和企业客户，扩大其生态圈。华福证券最近发布报告称，大模型成本优化与算力需求并不是直接的此长彼消，而是互相搭台、相互成就。定价的持续走低有望带来更快的商业化落地，进而会衍生出更多的微调及推理等需求，将逐步盘活国内AI应用及国产算力发展。

智谱AI的API定价更新体现了其覆盖开发者用户的决心，单次调用适合对实时性要求高的中小用户，批量调用定价更低则是为数据量大、对成本敏感的企业及用户量身定制。作为国内应用最为广泛的开放平台，智谱的开放平台上已经聚集了超过数十万的企业和开发者，并且在持续快速增长，过去的半年每日的token消耗增长超过一百倍。

技术的进步也为降低开发、运行LLMs成本提供了现实可能。例如，从基础设施来看，随着一些老款AI芯片（比如Nvidia A100）降价，大模型培训成本下降了约60%。英伟达也优化了软件性能，帮助开发者更快训练和运行大模型。研发人员也在模型架构、模型压缩以及GPU调用等方面探索到一些降本增效的办法。

智谱曾表示，通过模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现以及精细化集群调度等技术将GLM-3 Turbo的推理成本压缩到1/5。自大模型开放平台上线以来，在模型效果和推理性能不断提升的情况下，已累计降价超过百倍。

除了降价，智谱AI还宣布包括GLM-3 Turbo以及最先进基座大模型GLM-4在内的GLM系列模型也将迎来更新，目前正在灰度测试中，很快将和广大开发者和应用者见面。