“多模态”的搜索结果

中学生能看懂：Sora 原理解读

1. Sora是由OpenAI发布的一款强大的视频生成AI，旨在更好地理解和模拟真实世界的运动和交互。2. Sora通过将不同类型的视觉数据转换为统...

AIGC动态

9个月前

OpenAI的Sora视频生成模型在多个方面达到了当前最优水平（SOTA），包括视频的保真度、长度、稳定性、一致性、分辨率和文字理解。Sora采...

AIGC动态

9个月前

摘要：清华大学的CogVideo项目是一项颠覆性的人工智能技术，旨在通过深度学习和计算机视觉，让机器能够理解视频内容并生成文字或语音...

AIGC动态

9个月前

随着端侧大模型的火爆，手机市场迎来了新的活力。具有创新性的AI应用不仅为手机OEM厂商提供了新的发展方向，也为用户带来了全新的体验，...

AIGC动态

9个月前

OpenAI首席执行官Sam Altman在达沃斯论坛上表示，他的首要任务是推出下一代大模型，即GPT-5。GPT-5将是一个多模态模型，支持语音、图像...

AIGC动态

9个月前

在这篇文章中，谷歌宣布推出了旗下最强大多模态模型Gemini，包括Ultra、Pro和Nano三种不同规模的模型。Gemini的应用范围涵盖了Android和...

AIGC动态

9个月前

北京时间2月8日21点，谷歌宣布了其旗下最强大的多模态模型Gemini的最新进展，包括三个不同规模的模型：最大的Ultra、中等规模的Pro、以...

AIGC动态

9个月前

本文介绍了阿里发布的Qwen1.5版本，其中包含多个尺寸的模型，最大的Qwen1.5-72B-Chat模型在各项评估中表现优异。该版本集成到了Hugging ...

AIGC动态

9个月前

在2月2日的谷歌官网更新中，谷歌对生成式AI产品进行了重大更新，包括类ChatGPT聊天助手Bard可以通过文本提示生成图像，全新的文生音乐平...

AIGC动态

9个月前

根据泄露的文档，Google 的 Gemini Ultra 模型将于 2 月 7 日上线，同时 Google 聊天机器人 Bard 将更名为 Gemini。这一品牌整合标志着 ...

AIGC动态

9个月前