“多模态”的搜索结果

“国家队”入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资
联汇科技近日宣布完成数亿元战略融资,投资方包括中国移动产业链发展基金中移和创投资等。本轮融资将用于多模态大模型及自主智能体的技...
全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了
Ideogram是一款新兴的文生图工具,它在文字渲染能力上表现出色,成功获得了8000万美元的融资。这款工具能够根据用户的提示生成带有自然...
安卓率先跑通多模态大模型,终端本地就能看图生成文本!高通:WiFi都会AI起来
在MWC 2024首日,高通展示了其在终端侧AI领域的最新进展。首先,高通成功将多模态大模型首次本地部署在安卓手机上,这意味着用户可以通...
谷歌Gemini 1.5深夜爆炸上线,史诗级多模态硬刚GPT-5!最强MoE首破100万极限上下文纪录
谷歌DeepMind近日发布了新一代多模态大模型——Gemini 1.5系列。Gemini 1.5 Pro是谷歌最强的MoE大模型,最高可支持10,000K token超长上下...
超越GPT-4V: 浦语·灵笔2在13项多模态评测的领先之旅
浦语·灵笔2是一款基于书生·浦语2-7B模型研发的图文多模态大模型,具有强大的图文写作和图像理解能力。该模型在13项多模态评测中展现出卓...
统一多模态框架GPT4Video不仅能看懂视频也能生成视频(附视频demo)
腾讯人工智能实验室与悉尼大学在十一月发布了一项最新研究,提出了一种名为GPT4Video的统一多模态框架。该框架不仅能够理解多模态内容,...
零一万物Yi-VL多模态大模型开源,MMMU、CMMMU两大权威榜单领先
零一万物公司于1月22日发布了Yi-VL多模态语言大模型,该模型基于Yi语言模型开发,包括Yi-VL-34B和Yi-VL-6B两个版本。Yi-VL模型在英文数...
比肩GPT-4,商汤日日新大幅升级4.0,多模态能力领先一步
商汤科技近日发布了其大模型体系「日日新 SenseNova」的4.0版本,该版本在语言能力、文生图能力等方面进行了全面升级,并提供了低门槛的...
OpenAI 危险了?Gemini 和 GPT4 比较,谁强,只需两张图秒懂;Gemini 天生多模态,很可能是不一样的技术路线
Gemini 和 GPT-4 是两种人工智能模型,Gemini 天生多模态,而 GPT-4 是靠多功能的拼装。 Gemini 在多个测试中得分均高于 GPT-4,包括一...
多模态检索增强生成(Multimodal Retrieval Augmented Generation,MM-RAG)
第一部分介绍了多模态机器学习的重要性,以及MM-RAG技术的应用。对比学习用于多模态表示的方法被提出,强调了对比学习的关键要素和其在...
1 9 10 11 12 13 85