一张图看懂大模型性价比:能力、价格、并发量全面PK

AIGC动态7个月前发布 aitechtalk
1,174 0 0
一张图看懂大模型性价比:能力、价格、并发量全面PK

 

文章摘要


【关 键 词】 云厂商竞争大模型降价需求匹配成本考量性能对比

当前,国内云厂商的大模型价格战正酣,部分模型价格降幅高达99%,甚至有的模型实现免费提供。然而,在这场看似遍地的黄金降价潮中,实则隐藏着诸多细节和考量。

首先,企业在选用大模型时需根据自身需求明确模型的类型。若需解决复杂业务场景问题,应选择各大头部厂商的最强模型,如豆包Pro、通义千问Qwen-Max和文心ERNIE 4.0等,虽然这些模型已超越GPT3.5,但与GPT-4相比仍有一定差距。若对模型能力要求不高,可以选择各大模型的轻量化版本

其次,在选择适配业务的模型后,企业需要考虑使用成本。实际上,与价格紧密相关的TPM(每分钟token数)和RPM(每分钟请求数)两个关键指标将直接影响模型的使用效果。因此,在比较价格时,还需关注这两个并发能力指标。

针对此次降价潮中最受关注的火山引擎、阿里云和百度智能云三家云厂商的大模型进行详细对比发现,百度最强模型价格保持不变,但轻量模型已实现免费。阿里云全线降价,最强模型降幅相对较低,轻量模型降幅较大,价格具有诚意,但初始支持的TPM/RPM稍显不足。火山引擎的豆包大模型在最强模型和轻量模型、TPM和RPM方面均表现出强大的竞争力

综上所述,企业在面对大模型降价潮时,应综合考虑模型能力、价格、并发能力等多方面因素,做出明智的选择

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 1295字 | 6分钟 ]
【原文作者】 AI科技评论
【摘要模型】 glm-4
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...