真·罗永浩直播干不过假·罗永浩?网友:不是老罗在演AI吧?

AIGC动态7小时前发布 QbitAI
78 0 0
真·罗永浩直播干不过假·罗永浩?网友:不是老罗在演AI吧?

 

文章摘要


【关 键 词】 直播数字人电商技术创新

在今年的618大促中,罗永浩的数字人首次在百度电商直播中亮相,并取得了令人瞩目的成绩。带货单量超过了5月份罗永浩真人直播的同期数据,吸引了超过1300万人次的观看,商品交易总额(GMV)突破5500万元。这一成功背后,离不开百度电商数字人直播工具“慧播星”的支持。慧播星打造的高说服力数字人,本质上是一个具备形象、感知决策和行动的超级智能体,实现了多项技术突破。

首先,慧播星推出了业界首个双数字人互动直播间,罗永浩和朱萧木的数字人能够默契配合,还原了“主播+助播”的真实直播状态。得益于百度视觉大模型和语音大模型的升级,双人讲解时采用双音轨,支持打断说和同时说,观众几乎无法分辨出数字人与真人的区别。其次,慧播星通过文心大模型4.5 Turbo的加持,推出了全新的大师级别剧本模式,数字人能够轻松复刻个人直播风格,告别了机械感,具备网感和热点敏感度。

此外,慧播星高说服力数字人在视觉上实现了多模高度融合,动作、表情、语调等多模态能够自动贴合话术表达进行配合,画面衔接流畅自然。第四点突破在于整体直播效果,负责直播控场的AI大脑全面升级,能够主动邀评、即时回复用户评论,并在复杂场景中游刃有余地应对。这些技术的结合,使得数字人直播体验大幅提升,用户平均观看时长也超过了5月的真人首秀。

百度自研的多模协同数字人技术是这一系列突破的底层逻辑。通过以语言模型为核心驱动,百度实现了剧本生成、语音合成和视频生成的高效协同。剧本生成不仅包括台词生成,还涉及视觉标签和语音标签的生成,以确保多模驱动的协同效果。语音合成方面,百度通过文本自控的语音合成大模型,实现了高复原的语音合成能力,特别是在双人对话场景中,对话上下文编码器确保了流畅自然的对话效果。视频生成方面,百度建设了数字人形象生成和驱动的一整套技术,实现了高一致性、高表现力的长视频生成,支持复杂交互。

数字人技术的突破不仅促成了罗永浩数字人直播的成功,还降低了普通人和中小商家使用数字人技术的门槛。通过慧播星,即使没有团队和直播经验的新人主播也能轻松获得数字人分身,实现7×24小时不间断直播。例如,三农领域创作者东北翠花通过数字人直播间,结合生活场景和地域特色,构建了强代入感的消费氛围,订单量实现了10倍增长。新会陈皮的源头产地商家广芸堂也通过数字人直播,突破了真人直播的成本限制,GMV实现了160%的增长。

数字人技术的规模化落地是百度AI战略深度实践的重要印证。目前,已有超过10万家商家通过百度数字人直播,覆盖电商、教育、医疗等多个行业,GMV平均提升62%,开播运营成本降低了80%。伴随618大促,百度还发布了“梦蝶计划”和“繁星计划”,通过流量扶持、数字人消费补贴和运营扶持,帮助更多普通人和中小企业开启数字人直播。数字人技术不再是顶级主播的专属,而是普惠共享的新型生产力,推动了电商行业的创新与发展。

原文和模型


【原文链接】 阅读原文 [ 2884字 | 12分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...