视频生成
视频,video
单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2
智源研究院与上海交通大学等机构联合发布了新一代超长视频理解模型Video-XL-2,该模型在长视频理解领域取得了显著进展。长视频理解是多模态大模型的关键能力...
短剧开启全面战争,爱优腾不会让红果总压着自己
短剧行业正迎来一个关键的转折点,竞争全面升级,各大平台纷纷加大投入,试图在这一新兴领域确立自己的地位。中央广播电视总台的精品短剧集《奇迹》的开机发...
单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满
智源研究院近日发布了新一代超长视频理解模型Video-XL-2,该模型在长视频理解任务中表现出色,显著提升了多模态大模型对长视频内容的理解能力。Video-XL-2在M...
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
长视频理解作为多模态大模型的关键能力之一,尽管OpenAI GPT-4o和Google Gemini等私有模型已取得显著进展,但开源模型在效果、计算开销和运行效率等方面仍存...
免费使用Sora!微软发布Bing Video Creator
微软今日凌晨发布了Bing搜索引擎的全新功能——Bing Video Creator,该功能由OpenAI的文生视频模型Sora提供技术支持。通过自然语言输入,用户可以生成各种类型...
陶哲轩重写20年本科经典教材!Lean编程数学证明,GitHub已放出
陶哲轩最近对形式化数学证明产生了浓厚兴趣,并在YouTube上开设了账号,上传了四段视频,专门介绍如何使用Lean进行形式化数学证明。其中,第三支视频尤为引人...
第一家因为“AI first”而被用户抛弃的公司出现了
2025年5月17日,Duolingo突然清空其TikTok和Instagram上的所有内容,引发了1000多万粉丝的困惑。这一举动并非黑客入侵,而是一次精心策划的营销策略,旨在转...
AI生图迎来大升级:图像编辑达到像素级!背后团队大多来自Stable Diffusion模型基础技术发明团队
德国初创公司 Black Forest Labs(BFL)发布了名为 FLUX.1 Kontext 的全新图像生成模型,可实现图像生成和编辑,并允许添加文本及其他图像进行内容修改。模型...
从找眼镜到当导购,我和豆包的24小时”室友”体验
年轻人普遍因使用体验与日常生活脱节、使用门槛高而放弃使用AI助手,这引发了关于降低AI产品使用门槛的思考。豆包移动端全量推出的“视频通话”功能在一定程度...
AI产品的错位
作为AI的坚定支持者,向数百人推荐AI后,发现多数用户反馈冷淡。经系统对比主流AI客户端使用体验,意识到用户与模型间连接的产品设计存在问题。AI模型能力的...