视频生成
视频,video
PIKA正式上线唇形同步 – 给AI视频注入新的”想象”
本文主要介绍了AI产品PIKA的最新更新动态。在沉寂了3个月后,PIKA没有继续卷模型和控制,而是继续追求其1.0版本最初的目标:对话。PIKA的模型与其他AI视频产...
最长处理2小时,开源视频字幕模型Video ReCap
本文介绍了北卡罗来纳大学和Meta AI研究人员开源的视频字幕模型Video ReCap。该模型能够处理长达2小时的视频,并在多个层级上生成字幕。研究人员还推出了Ego4...
“谷歌版Sora”被嘲画质好糊,但在世界模拟器上又前进了一步
谷歌DeepMind团队推出了一个名为Genie的交互式虚拟世界生成模型,它拥有110亿参数。Genie的特点是能够从单张图像出发,生成可交互的2D虚拟世界,而且这个虚拟...
从 Sora 出发,视频生成模型会如何改变电子游戏开发范式,以及泛娱乐内容形态?
这篇文章由AutoGame创始人张昊阳撰写,探讨了OpenAI最新推出的文生视频模型Sora如何改变电子游戏的开发和制作流程。文章首先介绍了Sora模型的能力,它能够从...
猜想:中国版Sora,百度和科大讯飞最有可能率先突破
摘要:随着人工智能领域的迅猛发展,新一代世界模拟器Sora引发了全球热议。Sora不仅在视频生成速度和质量上颠覆传统,更能模拟真实物理定律,如物体运动轨迹...
“世界模型”大争议:杨立昆狠批Sora不是世界模型,生成式路线注定失败|甲子光年
在AI领域,世界模型的概念至关重要,它指的是机器对世界运作方式的理解和内部表示。最近,OpenAI发布了Sora,一个被定义为“世界模拟器”的视频生成模型,引起...
既不用ChatGPT也不是Bard,黄仁勋每天都在用的AI工具咱可能都没听过
本文主要介绍了人工智能(AI)在提高工作效率方面的应用,并以黄仁勋使用的Perplexity AI为例进行了详细阐述。Perplexity AI是一款基于大模型的搜索引擎产品...
字节等待一鸣惊人
近日,字节跳动正式发布了文生图模型SDXL-Lightning,采用了新的渐进式对抗蒸馏技术,显著提高了图像生成的速度和质量,将计算时间和成本降至十分之一。此外...
谷歌10M上下文窗口正在杀死RAG?被Sora夺走风头的Gemini被低估了?
Gemini 1.5 Pro 测评摘要:谷歌推出的Gemini 1.5 Pro模型在多模态数据处理方面展现出了显著的能力,尤其是在处理超长上下文方面。该模型能够处理高达100万tok...
与Sora一样能生成视频、图像,还能一次解读100万数据!
本文介绍了加州大学伯克利分校研究人员开源的大世界模型(LWM),这是一种多模态自回归模型,具备文本、音频、图像和视频的生成与理解能力。LWM能够一次性精...