视频生成

视频,video

轻松让张国荣、赫本唱歌,阿里推出创新视频模型EMO

本文介绍了阿里巴巴集团AI研究院推出的创新性视频模型——EMO。该模型能够通过用户提供的图像和音频生成表情丰富的视频,如让张国荣唱歌或让赫本唱《Perfect》...

Sora「翻车」:猴子长出鹦鹉尾巴,物体学会「穿墙术」

在彭博社对OpenAI的Sora进行的测试中,Sora在将文本提示转换为视频方面表现出了一些技术局限性。尽管Sora能够生成视频,但在处理复杂的场景时,如物体的物理...

HiDream CTO 姚霆:Sora 出圈,中国 AI 创业公司的机会在哪里?

在这篇文章中,HiDream.ai 智象未来的 CTO 姚霆博士对 Sora 的技术进行了深入解读,并探讨了 AI 生成视频技术在影视级应用方面的实践。智象未来开发的「智象...

2023年,被用户放弃了的 Top AI 产品有哪些?

文章总结:这篇文章主要分析了2023年上半年AI产品榜单的变化,以及市场上AI产品的供给和用户需求的变化。文章分为六个部分:1. 20款产品掉队,ToB类榜单变动...

苹果Vision Pro与Sora联袂,AI浪潮助推XR硬件走向何方?

文章摘要:本文主要讨论了AI技术的最新进展及其在多个领域的应用,包括OpenAI推出的Sora视频生成工具、苹果公司的Vision Pro空间计算设备以及华强北的XR设备...

Dreamina,字节的Sora时刻要来了!

文章主要介绍了字节跳动近期在AI领域的几项重要进展和产品动态。首先,作者提到了字节跳动在去年11月和今年1月分别发布了视频生成研究成果PixelDance和视频生...

ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型

摘要:图像匹配是计算机视觉中的关键任务,对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限,而基于深度学习的模型受限于特定场...

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实度高的说话人头部视频...

AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap

摘要总结:阿里推出了一款名为EMO的基于音频驱动的肖像视频生成框架,引起了广泛关注。用户只需提供一张参考图像和一段音频,即可生成表情生动的AI视频。这项...
1 84 85 86 87 88 106