谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

AIGC动态9个月前更新 AIera
1,111 0 0

作者信息


【原文作者】 新智元
【作者简介】 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
【微 信 号】 AI_era

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

文章摘要


【关 键 词】 AI视频生成蒋路TikTok谷歌VideoPoet

摘要总结:

谷歌Research Lead蒋路,负责VideoPoet项目,已确认加入TikTok,继续在视频生成AI领域工作。蒋路在谷歌期间,带领团队推出了与Sora技术路线相似的视频生成技术VideoPoet,该技术在生成连贯、动作幅度大的视频方面取得了显著成果。VideoPoet采用Transformer架构,实现了10秒长视频的生成,且在多模态学习方面展现出强大的能力。蒋路的加入,预示着TikTok在视频生成AI领域的进一步发展。

详细内容:

蒋路的背景: 蒋路在谷歌担任研究科学家和管理岗位,同时也是卡内基梅隆大学(CMU)的兼职教授。他在自然语言处理(ACL)和计算机视觉(CVPR)等领域的顶级会议上屡获佳绩,并对谷歌的多款产品如YouTube、Cloud、Cloud AutoML等的开发和完善起到了关键作用。

VideoPoet项目: 蒋路领导的VideoPoet项目在AI视频生成领域取得了突破性进展。VideoPoet利用Transformer架构,能够生成10秒长、连贯且动作幅度大的视频。与Sora相比,VideoPoet在技术路线上具有相似性,但在视频生成的质量和多样性上有所超越。

技术优势: VideoPoet的主要优势在于其能够生成更长的视频,提供更好的用户控制能力,以及根据文本提示生成不同的运镜手法。在用户偏好评级中,VideoPoet在文本保真度和动作趣味性方面均优于其他模型。

未来展望: 谷歌研究人员表示,VideoPoet框架未来将实现「any-to-any」的生成能力,包括文本到音频、音频到视频以及视频字幕等。这将为视频生成领域带来更广泛的应用前景。

蒋路的加入对TikTok的意义: 蒋路的加入将为TikTok在视频生成AI领域带来强大的技术支持,有助于TikTok在与Sora等竞争产品中保持领先地位。同时,蒋路的丰富经验和专业知识也将为TikTok的技术创新和产品开发提供重要支持。

 

原文信息


【原文链接】 阅读原文
【原文字数】 1851
【阅读时长】 7分钟

© 版权声明

相关文章

暂无评论

暂无评论...