标签：视频分析

杨立昆亲自指导开源世界大模型，为AI Agent打造超级大脑

Meta近期开源了其最新的大模型V-JEPA 2，该模型在多个方面实现了显著的技术突破。V-JEPA 2通过使用100万小时的视频和100万张图像进行超大规模训练，旨在让AI...

AI-Agent

2个月前

英伟达开源「描述一切」模型，拿下7个基准SOTA

为了实现这些功能，DAM 采用了两个关键创新：焦点提示（focal prompt）和局部视觉骨干网络（localized vision backbone）。焦点提示通过提供完整图像和目标区...

AIGC动态

4个月前

Gemini一眼识破Sora视频是AI生成？百万token上下文能力碾压GPT-4

新智元报道：谷歌的Gemini 1.5模型在AI圈大佬们的极限测试中展现出了强大的实力。这些测试包括分析视频内容、处理长视频和音频、翻译稀有语言、理解长论文和...

AIGC动态

1年前 (2024)