“长视频”的搜索结果

最长处理2小时,开源视频字幕模型Video ReCap
本文介绍了北卡罗来纳大学和Meta AI研究人员开源的视频字幕模型Video ReCap。该模型能够处理长达2小时的视频,并在多个层级上生成字幕。...
剪映的AI革命,字节的AI狂想
文章摘要:剪映作为一款视频编辑工具,自2019年推出以来,已成为全球最大的移动视频编辑产品,拥有超过3亿的月活跃用户。剪映最初被视为...
Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能
在AI领域,谷歌的Gemini 1.5版本在实测中表现出色,有望重新夺回被Sora抢占的风头。Gemini 1.5能够分析视频内容,判断其是否由AI生成,...
谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
摘要总结:谷歌Research Lead蒋路,负责VideoPoet项目,已确认加入TikTok,继续在视频生成AI领域工作。蒋路在谷歌期间,带领团队推出了...
免费 AI “神器”系列第四弹:字节跳动发布视频界“神笔马良”,谷歌Gemini竞争对手爆火|钛媒体AGI
1. 视频界“神笔马良”——字节Boximator模型字节跳动开发的Boximator模型,通过文本描述精准控制视频中人物或物体的动作。用户输入动作描述...
OpenAI 一线员工比国内还“卷”!深度揭秘 Sora 关键技术:时空补丁如何变成OpenAI 的新“魔法”
OpenAI的Sora模型通过时空补丁的创新使用,实现了将静态图像转化为动态、逼真视频的能力。Sora结合了Diffusion和Transformer架构,创建...
为什么说Sora是世界的模拟器?
Sora:物理世界的模拟器OpenAI的Sora模型,一个能够生成逼真视频的AI系统,被冠以“世界的模拟器”的称号。它不仅在视频生成领域取得了突...
Gemini一眼识破Sora视频是AI生成?百万token上下文能力碾压GPT-4
新智元报道:谷歌的Gemini 1.5模型在AI圈大佬们的极限测试中展现出了强大的实力。这些测试包括分析视频内容、处理长视频和音频、翻译稀...
Meta、谷歌、特斯拉,竞争对手联合起来吐槽OpenAI!Sora不懂物理世界,它只是GPT3!
OpenAI发布了其首个视频生成模型Sora,引起了广泛关注。然而,Sora的Transformer模型也遭到了来自Meta和谷歌等竞争对手的研究人员的批评...
OpenAI Sora背后的秘密与潜力
OpenAI发布了其首个文生视频模型Sora,这一创新预计将推动人工智能领域的快速发展。Sora的核心特点包括:1. 60秒超长视频长度:Sora能够...
1 3 4 5 6