Adobe推出超分辨率，细节丰富视频模型VideoGigaGAN

AIGC动态1年前 (2024)发布 AIGCOPEN

2,098 0 0

文章摘要

【关键词】 超分辨率、视频处理、技术挑战、模型创新、细节重建

视频超分辨率技术致力于将低分辨率视频转化为高分辨率，面临两大挑战：一是保持视频帧的时间连贯性，避免闪烁或抖动；二是放大视频帧时重建高频细节，以呈现清晰纹理。

Adobe和马里兰大学的研究人员推出了VideoGigaGAN模型，该模型兼顾帧率连贯性和丰富的高频细节。

VideoGigaGAN基于先前的大规模图像超分辨率模型GigaGAN，后者在8倍放大图像时仍能生成逼真的高分辨率图像。然而，直接将GigaGAN应用于视频帧会导致时间抖动和混叠伪影，研究人员通过创新性改造解决了这一问题。

创新之处在于引入了时序卷积和自注意力层，将GigaGAN从2D图像模型扩展为3D视频模型，并加入光流引导模块，以改善视频的时间一致性和细节丰富性。

时序卷积层在解码器块中紧随空间自注意力层之后，使模型能先在空间维度提炼特征，然后在时间维度进一步加工，更好地理解视频中的时间动态。

同时，自注意力层与光流引导结合，捕捉空间细节和纹理，并增强时间一致性。

光流引导模块通过预测输入低分辨率视频的双向光流图，捕捉像素级运动信息，然后利用双向循环神经网络处理光流图和原始帧像素，学习时间感知的特征。

通过反向变形层，确保在超分辨率过程中保持特征的空间一致性。这一方法让VideoGigaGAN在物体快速运动时也能生成清晰的超分辨率视频，准确估计运动轨迹并保留高频细节。

原文和模型

【原文链接】 阅读原文 [ 1608字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

智谱AI

智谱AI是一家国内的AI大模型...

# AIGC动态 # 图像生成 # 大模型 # 视频生成 # 技术挑战 # 模型创新 # 细节重建 # 视频处理 # 超分辨率

文章版权归作者所有，未经允许请勿转载。

小红书要不要做大模型？

AI科技评论

1,693

从“百模”到“千体”：大模型智能体的竞争格局、商业模式和技术挑战

AI科技评论

2,192

深度解码：AI 大模型的繁荣与困境 | Q福利

AI前线

1,256

XREAL创始人CEO徐驰：未来5-10年，我们将见证眼镜取代手机

硅星人Pro

1,980

Sora为何没能诞生在中国？

admin

2,535

智谱 AI 狂飙：与商业化博弈的一年

AI科技评论

1,862

暂无评论

暂无评论...

Adobe推出超分辨率，细节丰富视频模型VideoGigaGAN

文章摘要

原文和模型

我们跟一线 AI 开发者聊了聊，发现中国开源生态已经在全球找到了自己的位置

终于来啦！Stable Diffusion 3将在6月12日正式开源

相关文章

暂无评论

热门网址

热门文章

Adobe推出超分辨率，细节丰富视频模型VideoGigaGAN

文章摘要

原文和模型

我们跟一线 AI 开发者聊了聊，发现中国开源生态已经在全球找到了自己的位置

终于来啦！Stable Diffusion 3将在6月12日正式开源

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章