“多模态”的搜索结果

LeCun谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V
LeCun和谢赛宁团队近日推出了Cambrian-1,一种采用以视觉为中心方法设计的多模态大语言模型(MLLM),并全面开源了模型权重、代码、数据...
宇树科技王兴兴:与其完善多模态大模型,不如探索开发全新模型
2024年被广泛认为是人形机器人技术发展的重要年份,具身智能论坛在2024智源大会上成为焦点,吸引了众多关注。宇树科技的创始人兼CEO王兴...
超越CVPR 2024方法,DynRefer在区域级多模态识别任务上,多项SOTA
DynRefer是一种新型的区域级多模态理解模型,由中国科学院大学LAMP实验室的研究人员开发,旨在通过模拟人类视觉认知过程,提高区域级多...
GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
智谱AI在最新版本的GLM-4模型上取得了显著的技术与商业进展。其大模型开放平台已积累30万注册用户,日均调用量达到400亿Tokens,过去六...
谷歌创新框架:从非结构化数据,实现多模态学习
在数据爆炸时代,大模型学习非结构化数据如视频、音频和图片面临重大挑战。多模态学习,特别是处理多种输入和异构数据时,深度神经网络...
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
近期研究表明,通过训练纯解码器生成模型,可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇...
新的多模态盲测榜单来了,一眼望过去全是国产模型 | AI鲜测
在人工智能领域,模型能力的比较一直是一个重要的研究方向。近期,滑铁卢大学的TIGER实验室推出的GenAI-Arena平台,为模型比较提供了一...
AI搜索卷向多模态,他为什么能比谷歌还快?
在当前的AI技术演进浪潮中,天工AI搜索作为一款国内领先的产品,展现了显著的优势和潜力。其背后依托的MoE大模型,使得天工AI能够精准地...
多模态、长文本……谷歌搜索IO大会搜索炫技,中国AI搜索鼻祖“申请出战”
在当前国际AI前沿,中国的天工AI和谷歌展开激烈竞争。天工AI作为中国AI搜索的领军者,成功推出国内首个AI搜索产品,凭借多模态、多步骤...
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体
多模态大模型(MLLM)在视觉任务中展现出强大的认知理解能力,但目前大多数模型局限于单向的图像理解,难以在图像上进行精确定位。这一...
1 2 3 4 5 72