文章摘要
【关 键 词】 AI技术、数字人、视频生成、内容推荐、商业化应用
2024年上海世界人工智能大会(WAIC)上,快手公司展示了其AI技术的最新成果,包括数字人「AI关小芳」和视频生成大模型「可灵」的升级。这些成果不仅吸引了大量观众,也体现了快手作为一家以AI为核心要素的科技公司的定位。
「AI关小芳」是一个多模态输入输出的实时互动智能体,能够识别用户体征、语音、形态等信息,并以拟真的语气、话术、表情、动作进行回复,提供沉浸式交互体验。这一数字人的背后是快手自研的大语言模型、ASR、TTS等技术的支持,展现了快手在AI层面的长期积累。
「可灵」则是快手在视频生成领域的明星产品,通过一系列重磅升级和AIGC短剧,展示了其出色的生成效果和对物理规律的理解能力。在WAIC现场,「可灵」发布了新的图生视频和视频续写能力,以及更加清晰的高画质版和全新的编辑功能。
快手的大模型战略非常具体,围绕内容推荐、内容生产、内容理解三大块展开。公司通过自研的大模型技术,推动了内容层面的全面升级。快手高级副总裁盖坤表示,快手的AI技术会围绕这三大块展开,以大模型为”锤”去找”钉子”,本质上是一场内容之争。
在商业化方面,快手已经在视频广告素材、数字人直播、营销对话等方向探索大模型的应用,并取得了显著成效。例如,AIGC广告消耗从1月份的几乎可以忽略不计,到6月份快速增长至每天近2000万。快手生态内的AI产品也帮助了近2万商家实现智能化经营。
总体来看,快手通过自研的大模型技术,不仅推动了内容层面的创新,也在商业化方面取得了突破。这为大模型与互联网信息时代的关系提供了一个值得借鉴的案例。随着大模型技术的不断发展和应用,我们期待看到更多像快手这样的公司,为大模型与现实世界之间找到更加平顺的关系。
原文和模型
【原文链接】 阅读原文 [ 5406字 | 22分钟 ]
【原文作者】 极客公园
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★