智谱AI在悄悄搞大事。

2,537 0 0

文章摘要

OpenAI 发布了全新的 GPT-4.1 模型，标志着 AI 领域的竞争进一步加剧。OpenAI 的 CEO Sam Altman 此前已预告此次发布，GPT-4.1 在价格上更具优势，但与此同时，国内 AI 公司智谱也宣布了重大进展。智谱不仅启动了 IPO 进程，成为“AI 六小龙”中首个上市的创业公司，还基于 MIT 协议开源了其最新一代模型 GLM-4-32B-0414 系列。这一系列模型包含基座、推理和沉思三类，参数规模达 320 亿，性能可与 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列相媲美。更重要的是，智谱的模型在价格上显著低于 GPT-4.1，推理速度更是达到 200 Tokens/秒，是目前已知最快的模型。

智谱的模型在性能、速度和价格之间找到了一个难得的平衡点，为开发者提供了更具性价比的选择。GLM-4-32B-Base-0414 作为基础大模型，擅长处理报告撰写、代码生成、函数调用和搜索问答等任务，表现接近 GPT-4o 和 DeepSeek-V3 等超大模型。此外，智谱还推出了 GLM-Z1-32B-0414 推理模型，该模型在数学、编程和逻辑推理方面表现突出，并引入了“偏好学习”和“排名反馈”机制，使其更符合人类思维。测试显示，智谱的模型在响应速度上显著优于 DeepSeek R1，且提供了更多细节优化，如表格数据的一键导出功能。

智谱的模型不仅在大参数规模上表现出色，还在小尺寸模型上展现了高效性能。GLM-4-9B 作为小尺寸推理模型，在官方测评中表现依然优异，体现了智谱在“极致性价比”方向上的探索。与此同时，智谱还推出了 Z-Rumination 模型，该模型支持“自主提出问题—搜索信息—构建分析—完成任务”的完整研究闭环，特别适合开放式复杂任务。这一模型代表了智谱对 AGI（通用人工智能）未来形态的思考，并在 Agent 类产品中展现了强大的潜力。

智谱的 MaaS 平台提供了多个版本的模型，覆盖了不同用户的需求。基础模型方面，GLM-4-Air-250414 和 GLM-4-Flash-250414 分别针对不同场景，其中 Flash 版本对外免费开放，降低了早期项目的试错成本。推理模型则分为极速版（AirX）、高性价比版本（Air）和免费版本（Flash），进一步降低了应用门槛。这种灵活的定价策略使得开发者可以零成本跑通 Demo，待产品验证后再切换到性能更强的付费版本。

智谱的开源模型不仅在技术上取得了突破，还为国内 AI 应用提供了更多可能性。尽管 OpenAI 仍在全球范围内保持领先地位，但智谱的模型在推理速度和价格上的优势，使得国内开发者可以更放心地调用这些模型，而无需担心延迟和成本问题。此外，智谱的深思系列模型虽然尚未上线 MaaS 平台，但已可用于构建 Agent 产品，进一步推动了 AI 技术的实际应用。智谱的持续创新和开源策略，无疑为国内 AI 生态的发展注入了新的活力。