“多模态大模型”的搜索结果

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
剑桥大学信息工程系人工智能实验室最近开源了首个预训练、通用多模态后期交互知识检索器PreFLMR。该模型基于Fine-grained Late-interact...
COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim
本文介绍了哈工大联合度小满推出的针对多模态模型的自适应剪枝算法 SmartTrim,该算法旨在解决基于 Transformer 结构的视觉语言大模型(...
清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果”
生数科技是一家清华系多模态大模型公司,最近完成了一轮数亿元的融资,由多家投资方领投。他们的研究成果包括文生图、文生3D模型、文生...
能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了
摘要:2023年,多模态大语言模型(MLLM)在文本、代码、图像、视频等领域取得了显著进展。上海人工智能实验室联合多所大学发布了一份详...
“国家队”入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资
联汇科技近日宣布完成数亿元战略融资,投资方包括中国移动产业链发展基金中移和创投资等。本轮融资将用于多模态大模型及自主智能体的技...
安卓率先跑通多模态大模型,终端本地就能看图生成文本!高通:WiFi都会AI起来
在MWC 2024首日,高通展示了其在终端侧AI领域的最新进展。首先,高通成功将多模态大模型首次本地部署在安卓手机上,这意味着用户可以通...
零一万物Yi-VL多模态大模型开源,MMMU、CMMMU两大权威榜单领先
零一万物公司于1月22日发布了Yi-VL多模态语言大模型,该模型基于Yi语言模型开发,包括Yi-VL-34B和Yi-VL-6B两个版本。Yi-VL模型在英文数...
年轻人的AI新玩具:Vary-toy,1080Ti轻松驾驭的多模态大模型!
Vary-toy的核心目标是为视觉-语言模型提供更丰富的视觉词汇库,使其能够更准确地理解和描述复杂的视觉场景,提升了模型在文档OCR和对象...
2024年启航:多模态大模型+垂直领域
第一段介绍了技术进步对信息获取的影响,指出了搜索引擎的诞生开启了人与机器之间信息共享的时代,但技术进步也加剧了人与人之间的差距...
腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法
第一段介绍了多模态大模型(MM LLMs)在通往通用人工智能(AGI)的道路上的重要性,以及谷歌 Gemini 宣传片和腾讯 AI Lab 最新综述的重...
1 2 3 4 5 19