标签:视频模型

Sora终于来了,但多模态AI呼唤实用主义

OpenAI发布的视频生成模型Sora Turbo在实测中未能超越市场上现有视频模型,存在视频时长、生成效果一致性、指令遵循等方面的不足。Sora项目被比作视频版GPT-1...

腾讯版Sora开源!最强开源视频模型,130亿参数、物理模拟、电影级画质!

腾讯开源了名为HunyuanVideo(混元)的视频模型,这是一个拥有130亿参数的类Sora文生视频模型,是目前参数最大的开源视频模型。混元具备物理模拟、一镜到底、...

MiniMax,也许做出了最接近 Sora 的文生视频产品

MiniMax公司近期推出了一款名为abab-video-1的视频模型,并通过其产品“海螺AI”向用户展示了文生视频功能。尽管较晚进入市场,MiniMax的产品在技术上实现了显...

谷歌推出通用视频模型:能精准分类、定位、检索等

谷歌的研究人员开发了一种名为VideoPrism的通用视频模型,该模型在视频领域的多种任务上展现出了卓越的性能。为了验证VideoPrism的性能,研究人员在33个视频...

从零开始,用英伟达T4、A10训练小型文生视频模型,几小时搞定

文本生成视频模型是2024年AI领域的热门趋势之一,继大语言模型之后备受关注。本文作者Fareed Khan介绍了如何构建一个小型的文本生成视频模型,从理解理论概念...

太逼真了!Gen-3 Alpha重磅发布,Sora最强竞争对手!

Gen-3 Alpha是Runway平台最近发布的文生视频模型,它带来了一系列显著的改进和创新。与之前的Gen-2相比,Gen-3在视频生成的质量、色彩、饱和度、光影效果、文...

中国首个Sora级大模型:文本生成16秒,1080p高清视频

4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技发布了中国首个长时间、高一致性、高动态性视频大模型——Vidu。Vidu采用了U-ViT架构...

哪里要动点哪里!腾讯联合清华、港科大推出全新图生视频大模型

文章介绍了一个新的图像生成视频模型 Follow-Your-Click,由腾讯混元、清华大学和香港科技大学联合推出。这个模型可以让静态的图像区域动起来,只需在照片中...

大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界

新智元报道指出,谷歌DeepMind、UC伯克利和MIT的研究人员提出了一种大视频模型的概念,认为这可能比现有的大语言模型更接近于构建一个完整的世界模型。他们认...

国内大厂集体“屏蔽”Sora

在AI技术飞速发展的今天,OpenAI发布了首个文生视频模型Sora,这一模型能够根据人类指令生成长达一分钟的视频,引起了业界的广泛关注。Sora的发布标志着文生...
1 2