智谱 AI 张鹏:「清影」和 Sora 有不少差距,我们在用自己的方式往前追
文章摘要
【关 键 词】 视频生成、智谱清影、AI技术、商业模式、人机协同
智谱AI于7月26日发布了其视频生成产品——智谱清影(Ying),该产品现已全面上线官网及移动端,所有用户无需预约即可使用。免费用户可以不限次数地生成6秒时长、1440×960分辨率、6fps帧率的视频。智谱清影不仅支持文生视频,还支持图生视频和视频生成视频。此外,清影API也已上线大模型开放平台bigmodel.cn,开发者可以通过调用API体验和使用文生视频及图生视频的模型能力。
智谱清影在风景、动物、超现实、人文历史类需求上表现突出,同时支持皮克斯风格、卡通风格、摄影风格、动漫风格等多种风格。在镜头效果上,近景表现最佳,而在实体生成上,动物的表现优于植物、物品、建筑和人物。智谱清影还推出了提示词bot,帮助用户获取更匹配AI的提示词,并提供配乐功能,生成直接可用的短视频。
智谱AI CEO张鹏在发布会上表示,尽管智谱清影与OpenAI的Sora存在差距,但公司正通过自己的方式不断追赶,努力降低视频生成算力成本,提升响应速度,使产品更加普及。张鹏还透露,智谱清影的视频生成模型CogVideoX在算法和数据方面进行了优化,推理速度提升了6倍。此外,智谱自研的端到端视频理解模型增强了模型的文本理解和指令遵循能力,使生成的视频更符合用户输入。
在商业模式方面,张鹏表示,智谱清影的上线是阶段性成果,目前还处于早期阶段,无论是ToC还是ToB,大规模商业化还需要时间。智谱清影的收费策略目前是一种早期尝试,旨在回收部分成本。未来,公司将根据市场和用户反馈进行调整。张鹏还提到,智谱AI的最终目标是实现AGI(人工通用智能),视频模型是多模态路径中的一部分,公司希望将技术和产品发展路线结合起来。
智谱清影在数据来源方面,除了公开数据集,还得到了B站、华策、央视等合作伙伴的支持。张鹏强调,视频数据的清洗、挑选和筛选对技术有很高要求,高质量的视频训练数据对于AI模型的性能至关重要。他还提到,文生视频技术对影视行业的影响正在讨论中,尽管AI技术在辅助工作和小规模创作中具有潜力,但要达到改变电影制作的程度还有一段路要走。
最后,张鹏表示,智谱AI将专注于实际效用,通过AI助手提高生产力和学习效率,逐步改变人们的生活状态。他认为,人机协同是未来发展方向,AI应用将与人们的生活和工作更加紧密地融合。
原文和模型
【原文链接】 阅读原文 [ 4823字 | 20分钟 ]
【原文作者】 Founder Park
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★