文章摘要
【关 键 词】 视频通话、人工智能、开源模型、图像处理、软件开发
智谱近期推出了一系列更新和新产品,包括清言App的“视频通话”功能和新一代基座大模型GLM-4-Plus。清言App的“视频通话”功能是国内首个面向C端开放的视频通话,支持文本、音频和视频模态,并具备实时推理能力。用户可以通过视频通话窗口与清言进行流畅通话,即使频繁打断,清言也能迅速反应。此外,清言还可以理解摄像头拍摄到的内容,听懂指令并准确执行。
GLM-4-Plus是智谱全自研GLM大模型的最新版本,在语言理解、指令遵循、长文本处理等方面性能得到全面提升。GLM-4-Plus使用了大量模型辅助构造高质量合成数据以提升模型性能,利用PPO有效提升模型推理表现,更好反映人类偏好。在语言文本能力方面,GLM-4-Plus与GPT4o及405B参数量的Llama3.1相当。长文本能力则通过更精准的长短文本数据混合策略,取得了更强的长文本推理效果,比肩国际先进水平。GLM-4V-Plus还可以理解网页内容并将其转换为html代码,在图像和视频理解能力方面位居前列。
智谱还发布了文生图模型的最新版本CogView-3-Plus,其效果接近目前最佳的MJ-V6及FLUX等模型,并支持图片编辑功能。此外,继CogVideoX 2B版本开源后,5B版本也于近日正式开源,性能更强,推理显存需求最低仅为11.4GB。同时,CogVideoX-2B的开源协议调整为更加开放的Apache 2.0协议,任何企业与个人均可自由使用。随着CogVideoX-5B的开源,智谱在开源模型数量上领先,累计下载量突破2000万次。
智谱还宣布大模型开放平台bigmodel.cn最具性价比的大模型GLM-4-Flash现已完全免费,用户可以通过调用GLM-4-Flash快速、免费地构建专属模型和应用。这也是智谱开放平台首个完全免费的大模型API。智谱表示,最新推出的基座大模型和此前发布的CogVideoX等模型一道,完善了智谱自主原创的全栈大模型谱系,推动智谱实现面向世界先进水平的全面对标。
此外,智谱还推荐了2024年8月18-19日在上海举办的AICon全球人工智能开发与应用大会,以及InfoQ将于10月18-19日在上海举办的QCon全球软件开发大会,覆盖前后端/算法工程师、技术管理者、创业者、投资人等泛开发者群体,内容涵盖当下热点和传统经典,侧重实操性和可借鉴性。
原文和模型
【原文链接】 阅读原文 [ 1786字 | 8分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆