视频生成

视频,video

美团新独立APP,点不了菜只能点AI

美团最新开源的多模态模型LongCat-Flash-Omni实现了全模态实时交互能力,在Omni-Bench等综合性基准测试中超越同类开源模型,达到与闭源Gemini-2.5-Pro相当的...

LeCun预言成真!790年长视频,炼出最强开源「世界模型」

人工智能领域迎来重大突破,北京智源研究院发布多模态原生世界模型Emu3.5。这款340亿参数的模型基于790年长视频数据训练,采用自回归架构实现多模态理解与生...

可以彻底放弃 Photoshop 了。

Lovart最新推出的图层编辑功能标志着AI图像领域的重大突破,解决了长期以来AI生成图像难以精确修改的痛点。过去在业务场景中使用AI生成图像时,虽然能快速产...

AI深度应用关键元年,快手重塑内容与商业价值

2025年被广泛视为AI深度应用的关键转折点,多模态生成与Agent技术正推动AI向更高效、更贴合用户需求的方向发展。在这一背景下,快手作为以技术驱动的科技公司...

本周AI项目推荐:VideoTutor、Articuler、Gambo、Sheet0…

近期AI应用领域涌现出一批创新项目,展现出行业发展的新动向。许多新产品明确对标已验证成功的成熟产品,如VideoTutor定位为'新多邻国',捏TA2.0打造AI版抖音...

人类首次机械飞升!马斯克豪言Neuralink击败全人类

Neuralink的最新进展标志着脑机接口技术迈入全新阶段。全球已有12名患者植入该设备,累计使用时间超过2000天,其中首位受试者Noland Arbaugh的经历尤为引人注...

5分钟上手,无照就能飞:91万「空中F1」已经排到了2027

Jetson公司推出的Jetson ONE个人电动垂直起降飞行器,正在将科幻动画《杰森一家》中的出行方式变为现实。这款飞行器采用铝合金与碳纤维结构,配备八个电机驱...

智源悟界·Emu3.5发布,开启“下一个状态预测”!王仲远:或开启第三个 Scaling 范式

智源研究院于2024年10月发布的悟界·Emu3是全球首个基于'Next-Token Prediction'的原生多模态世界模型,实现了图像、文本、视频的统一处理。一年后升级的Emu3....

今年双11,聪明人都在偷偷换AI PC

技术底层的关键在于NPU(神经网络处理单元)的引入,与CPU、GPU形成协同架构。NPU专攻低功耗AI任务,如视频会议降噪、智能抠图,实现能效与体验的双重突破。...

语言模型之后,智源 EMU3.5 找到了 AI 的「第三种 Scaling 范式」

智源研究院发布的「悟界 EMU3.5」多模态世界大模型,标志着人工智能从语言学习向多模态世界学习演进的新阶段。在当前大语言模型文本能力逐渐触顶的背景下,多...
1 2 3 215