“多模态”的搜索结果

中学生能看懂:Sora 原理解读
1. Sora是由OpenAI发布的一款强大的视频生成AI,旨在更好地理解和模拟真实世界的运动和交互。2. Sora通过将不同类型的视觉数据转换为统...
OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
OpenAI的Sora视频生成模型在多个方面达到了当前最优水平(SOTA),包括视频的保真度、长度、稳定性、一致性、分辨率和文字理解。Sora采...
清华“魔镜”CogVideo:人工智能如何看懂视频并生成智能解说,这场视觉革命正悄然改变世界
摘要: 清华大学的CogVideo项目是一项颠覆性的人工智能技术,旨在通过深度学习和计算机视觉,让机器能够理解视频内容并生成文字或语音...
大模型进手机,AI创新赛道会跑出几匹国产黑马?
随着端侧大模型的火爆,手机市场迎来了新的活力。具有创新性的AI应用不仅为手机OEM厂商提供了新的发展方向,也为用户带来了全新的体验,...
GPT-5首次曝光后,Altman:现在最重要的事就是GPT-5
OpenAI首席执行官Sam Altman在达沃斯论坛上表示,他的首要任务是推出下一代大模型,即GPT-5。GPT-5将是一个多模态模型,支持语音、图像...
Bard 出局、Gemini 独立+收费,谷歌在 AI 大战中找到了感觉
在这篇文章中,谷歌宣布推出了旗下最强大多模态模型Gemini,包括Ultra、Pro和Nano三种不同规模的模型。Gemini的应用范围涵盖了Android和...
谷歌发布旗下最强大模型Gemini Ultra,Bard更名Gemini、还有Gemini App和包月套餐
北京时间2月8日21点,谷歌宣布了其旗下最强大的多模态模型Gemini的最新进展,包括三个不同规模的模型:最大的Ultra、中等规模的Pro、以...
阿里大模型春节礼包来了:代码可执行率超GPT-4,1.5版本全系列开源
本文介绍了阿里发布的Qwen1.5版本,其中包含多个尺寸的模型,最大的Qwen1.5-72B-Chat模型在各项评估中表现优异。该版本集成到了Hugging ...
谷歌产品大更新:Bard可生成图像;文生音乐平台等5大免费功能
在2月2日的谷歌官网更新中,谷歌对生成式AI产品进行了重大更新,包括类ChatGPT聊天助手Bard可以通过文本提示生成图像,全新的文生音乐平...
谷歌将发布 Gemini Ultra,这是为了对应ChatGPT 5 吗?
根据泄露的文档,Google 的 Gemini Ultra 模型将于 2 月 7 日上线,同时 Google 聊天机器人 Bard 将更名为 Gemini。这一品牌整合标志着 ...
1 79 80 81 82 83 85