视频生成
视频,video
ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型
摘要:图像匹配是计算机视觉中的关键任务,对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限,而基于深度学习的模型受限于特定场...
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...
让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了
摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实度高的说话人头部视频...
AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap
摘要总结:阿里推出了一款名为EMO的基于音频驱动的肖像视频生成框架,引起了广泛关注。用户只需提供一张参考图像和一段音频,即可生成表情生动的AI视频。这项...
比Sora惊艳!文本生成超25秒视频,带背景音乐、转场等效果
专注AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。2月29日,Lightricks宣布推出生成式AI电影制作平...
吐槽完 Sora,Google自己做的“基础世界模型”来了
Google DeepMind推出了名为「Genie」的人工智能模型,这是一个能够根据用户提示生成交互式视频游戏的AI。Genie可以将合成图像、真实照片、手绘草图或想法转换...
中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻
摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度的短视频,尽管还不能...
Sora阴影之下,焦虑的中国AI
文章详细分析了Sora这一人工智能视频生成技术的重大突破,并探讨了中美之间的技术差距。Sora的展示不仅引起了从业者的担忧,也引发了关于中国AI行业的焦虑。...
字节跳动正秘密研发多个AI产品
摘要:界面新闻报道称,字节跳动正在AI大模型领域秘密研发多个产品,包括多模态数字人产品以及AI生图、AI生视频产品等。据悉,字节跳动旗下剪映已组建封闭团...
创业者聊 Sora:可复刻吗、如何产品化、创业公司的机会在哪里?
2024年,Sora引起的关注与2023年GPT-4的发布相媲美,尽管尚未开放测试,但官方技术报告和生成的视频让人们对其技术路径有所了解。在Founder Park旗下的Global...