让鲁迅说绕口令、赫本玩嘻哈,又一视频模型火了,斯坦福华人博士创立
文章摘要
【关 键 词】 Proteus模型、斯坦福大学、transformer架构、视频生成、AI对话实体
Proteus,由斯坦福大学团队开发,是一个低延迟基础模型,能够生成具有高度真实感和表现力的人物形象。
它采用了先进的transformer架构和潜在扩散模型,实现了实时高效率的视频生成,每秒可达100帧以上。
Proteus不仅能够模仿人类的笑声、唱歌等动作,还能让文学和历史人物如鲁迅和爱因斯坦执行生动的表情和动作。
该模型的研发团队期望Proteus成为声音可控的视觉化身,为AI对话实体提供直观交互界面,并无缝兼容多模态大语言模型,以定制化服务满足多种应用场景。
团队由六名成员组成,其中包括华人,由斯坦福大学Apparate Labs研发。
原文和模型
【原文链接】 阅读原文 [ 3053字 | 13分钟 ]
【原文作者】 机器之心
【摘要模型】 generalv3.5
【摘要评分】 ★☆☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...