视频生成

视频,video

大妈跳上“赛博广场舞”?AI迎来春节破圈时刻

春节作为中国传统节日,已成为互联网产品实现用户破圈的重要时刻。2015年春晚“摇一摇”使微信支付用户激增,2016年支付宝“集五福”普及数字支付,2018年抖音通...

新年大礼!阿里刚开源视觉 AI Agent模型—Qwen2.5-VL

阿里巴巴最新发布了视觉多模态模型Qwen2.5-VL,该模型在图像、文本、视频的理解与识别能力上显著增强,并且具备直接作为视觉Agent自动化操作电脑和手机的独特...

杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini

阿里巴巴集团旗下的通义Qwen发布了新的视觉理解模型Qwen2.5-VL,这是一个开源的视觉语言模型,包含3B、7B和72B三个版本。Qwen2.5-VL-72B-Instruct在多个领域...

滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion

DeepSeek最近发布了新模型多模态Janus-Pro-7B,并立即开源。这一新模型在GenEval和DPG-Bench基准测试中超越了DALL-E 3和Stable Diffusion。Janus-Pro-7B基于D...

只是RAG了一下,我看到了AI大模型的态度!

在探讨如何使AI大模型在回答问题时既准确又丰富,并且观点鲜明有态度时,RAG(检索增强生成)技术被提出作为一种解决方案。RAG技术通过结合大模型能力和搜索...

AI 2025!8大热门赛道开年前瞻,从AI眼镜到推理Scaling一网打尽

站在2025年的起点,AI科技领域的发展趋势呈现出多样化的特点,涉及产品和技术两大方面。在产品侧,人形机器人、AI眼镜、智能驾驶和AI陪伴成为热点。人形机器...

Video Depth Anything来了!字节开源首款10分钟级长视频深度估计模型,性能SOTA

字节跳动智能创作AR团队与豆包大模型团队联合开发的Video Depth Anything(VDA)模型,针对单目深度估计在视频领域的应用难题取得了突破。VDA基于Depth Anyth...

自由画布第一波实测,边玩边把DDL列表清空了

百度文库与百度网盘联合推出了一款名为“自由画布”的AI创作工具,旨在为用户提供一个全方位的创作空间,实现多模态内容创作的全流程多线程并行处理。自由画布...

英伟达 RTX 5090、5080 和 5070 Ti 最新基测:不支持 DLSS 的游戏将拥有更多 AI 能力

英伟达近期公布了GeForce RTX 5090、GeForce RTX 5080、GeForce RTX 5070 Ti和GeForce RTX 5070等新一代GPU的技术和功能细节。这些新GPU在性能基准测试中不仅...

贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行

贾佳亚团队与Adobe团队合作开发的GenProp(Generative Video Propagation)模型,展示了Text-to-Video模型作为世界模拟器的潜力,并对传统视觉任务进行了革新...
1 26 27 28 29 30 172