视频生成

视频,video

CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术

视频理解技术旨在准确把握视频中的时空信息,但面临着短视频片段的时空冗余和复杂时空依赖关系的双重挑战。传统的三维卷积神经网络(CNN)和视频Transformer...

OpenAI进军好莱坞:电影制作用Sora指日可待

  文章摘要 【关 键 词】 OpenAI、视频生成、人工智能、好莱坞、合作关系 OpenAI最近展示了其自动生成视频的Sora,引起了好莱坞和硅谷的关注。 公...

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

何恺明的目标是探索面向复杂世界的智能。Sora是首个引起广泛关注的大规模通用视频生成模型,自OpenAI于2024年2月推出以来,没有其他视频生成模型能在性能或支...

Mixtral、Solar及OpenChat三大模型融合,效果能拉多高?

```htmlFuseLLM是中山大学和腾讯AI Lab的研究人员提出的一种用于融合多个异构大模型的方法。与以往的模型集成和权重合并不同,FuseLLM从概率分布表征的角度来...

算数不行、还不懂中国文化,大模型现在抢不了设计师的饭碗! | AI 测评室

这篇文章是关于AI大模型在文生图领域的测评。作者选择了四个模型:文心一格、360智绘、美图MiracleVision 4.0和GPT-4,通过同题多解的方式,逐一测评了它们的...

人大 Sora 思辩:Sora 到底懂不懂物理世界?

本文主要讨论了在物理世界、AGI等关键问题上的不同定义,使多样化的思考诞生。Sora作为一种人工智能技术,虽然仍未正式对外开放,但对其技术细节、切实影响的...

一百多张卡,马上能变现!朱啸虎连投三轮

知名投资人朱啸虎对Fancytech公司的产品表示高度赞赏,认为其产品效果好且能快速实现盈利。Fancytech主要提供AIGC电商内容智能化服务,由前天猫奢品负责人李...

微软NaturalSpeech语音合成推出第三代,网友惊呼:超自然!实至名归

微软NaturalSpeech项目介绍微软NaturalSpeech项目介绍本文介绍了微软在文本到语音合成(TTS)领域的研究项目NaturalSpeech,该项目旨在通过生成式人工智能技...

游戏NPC“活”了,英伟达AI立大功

本文介绍了育碧在CES上宣布跟进英伟达的ACE微服务后发布的首个DEMO,展示了智能NPC在游戏主线中的推动作用。通过英伟达ACE中的Riva和Audio2Face微服务,游戏...

Sora复刻版来了,微软参与,华人团队打造

这篇文章介绍了一种名为Mora的多智能体框架,是对Sora的复刻版。Mora具有多种功能,包括文本转视频、视频编辑、视频拼接、模拟数字世界等。研究团队来自理海...
1 117 118 119 120 121 155