免费AI“神器”第十三弹:会20种语言的克隆数字人突然爆火;美国 AI 机器人能提前0.8秒预测人类表情|钛媒体AGI

AIGC动态7个月前发布 TMTPOSTAGI
805 0 0
免费AI“神器”第十三弹:会20种语言的克隆数字人突然爆火;美国 AI 机器人能提前0.8秒预测人类表情|钛媒体AGI

 

文章摘要


【关 键 词】 AIGC数字人人形机器人动态视频文生图

  1. Digen AI – 克隆数字人
  2. Digen AI推出了一款能够支持20种语言、40+种声音的克隆数字人工具。这款工具利用生成式AI技术,可以同步手势、口型和语调,创造出逼真的视频效果。用户可以免费申请内测,个性化头像生成需要5-7天时间。Digen提供免费版、创作者版和专业版,不同版本提供不同的服务和价格。免费计划允许每月制作总长度为2分钟的视频,而视频数量不受限制。

  3. EMO – 人形机器人
  4. 由美国哥伦比亚大学创新机器实验室研发的EMO,是一款能够预测并模仿人类表情的人形机器人。EMO采用自我监督学习框架,能够在人类微笑前839毫秒预测微笑,并与人同步表达。它还能预测其他表情,并进行眼神互动。EMO的面部由26个电机驱动,模拟人类肌肉。研究团队计划将语言交流整合到EMO中,使其能够回答问题和对话。

  5. Domo AI – 动态视频生成
  6. 映刻科技的Domo AI是一款将图片和视频动漫化的AI工具,最近推出了图像生成视频的新功能。这项功能能够将静态照片中的人物特征与动态视频中的运动数据匹配,实现从静态到动态的转变。Domo AI适用于多种场景,如社交媒体、电影、游戏或广告制作。新功能已在Discord频道上线,用户可以体验将静态照片变为动态视频的过程。

  7. Ideogram – AI文生图工具
  8. Ideogram是一款由谷歌前员工打造的文字生成图像工具,擅长生成包含文本的图片。Ideogram 1.0版本在显示文本和图像质量方面有显著提升,能够理解复杂的提示词,生成清晰、逼真的图像。它还引入了“魔法提示”功能,帮助用户创造更美观、具创意的图像。Ideogram提供了免费和付费使用方案。

  9. LaVi-Bridge – 文生图框架
  10. LaVi-Bridge是一个由香港大学、香港中文大学和香港科技大学的研究团队开发的技术框架,它可以将不同的语言模型和生成视觉模型结合起来,实现文本到图像的生成。LaVi-Bridge使用LoRA和适配器,提供即插即用的方法,无需修改原始模型权重。该框架兼容多种模型,能够提高文本对齐或图像质量。

这些工具的出现,不仅证明了AI技术在创意领域的广泛应用,也为用户带来了更加丰富和便捷的创作体验。随着AI技术的不断发展,我们可以预见未来将有更多令人惊叹的应用诞生。

原文和模型


【原文链接】 阅读原文 [ 1915字 | 8分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 gpt-4
【摘要评分】 ★★★★☆

© 版权声明

相关文章

暂无评论

暂无评论...