标签:长视频

CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术

视频理解技术旨在准确把握视频中的时空信息,但面临着短视频片段的时空冗余和复杂时空依赖关系的双重挑战。传统的三维卷积神经网络(CNN)和视频Transformer...

用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

这篇文章介绍了腾讯和复旦大学研究团队提出的创新性AI生成框架MovieLLM,旨在解决长视频理解的挑战。长视频的分析与理解一直是一个难题,因为缺乏高质量、多...

ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

在2024年世界经济论坛上,图灵奖得主Yann LeCun提出了视频模型应该在抽象表征空间中进行预测的观点。本文研究者基于最优传输理论,提出了一种鲁棒的长视频学...