标签:视频生成

解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品

这篇研究综述由理海大学和微软研究院的华人团队发布,深入分析了Sora模型的技术细节、应用前景和局限性。Sora是一个基于扩散模型和Transformer架构的视频生成...

试了下 Stable Video,我的建议是不如不用|AI 测评室

去年11月,Stability AI推出了Stable Video,一款基于Stable Diffusion文本转图片模型的视频生成AI。近日,Stable Video正式开放公测,为不具备强大硬件或技...

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

SnapChat背后的公司Snap联合特伦托大学等机构发布了一款名为Snap Video的文本生成视频模型。该模型采用了可扩展的时空Transformer架构,旨在提高视频生成的质...

Sora外部测试翻车了!3个视频都有Bug

Sora,OpenAI的文本转视频模型,最近在油管上引起了一些关注。科技up主分享了他们使用Sora生成的视频,其中包含了一些有趣的bug。例如,一个视频中的3D打印机...

Sora「翻车」:猴子长出鹦鹉尾巴,物体学会「穿墙术」

在彭博社对OpenAI的Sora进行的测试中,Sora在将文本提示转换为视频方面表现出了一些技术局限性。尽管Sora能够生成视频,但在处理复杂的场景时,如物体的物理...

苹果Vision Pro与Sora联袂,AI浪潮助推XR硬件走向何方?

文章摘要:本文主要讨论了AI技术的最新进展及其在多个领域的应用,包括OpenAI推出的Sora视频生成工具、苹果公司的Vision Pro空间计算设备以及华强北的XR设备...

Dreamina,字节的Sora时刻要来了!

文章主要介绍了字节跳动近期在AI领域的几项重要进展和产品动态。首先,作者提到了字节跳动在去年11月和今年1月分别发布了视频生成研究成果PixelDance和视频生...

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实度高的说话人头部视频...

比Sora惊艳!文本生成超25秒视频,带背景音乐、转场等效果

专注AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。2月29日,Lightricks宣布推出生成式AI电影制作平...

中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度的短视频,尽管还不能...
1 3 4 5 6 7 8