“多模态”的搜索结果

LeCun和谢赛宁团队近日推出了Cambrian-1，一种采用以视觉为中心方法设计的多模态大语言模型（MLLM），并全面开源了模型权重、代码、数据...

AIGC动态

3个月前

2024年被广泛认为是人形机器人技术发展的重要年份，具身智能论坛在2024智源大会上成为焦点，吸引了众多关注。宇树科技的创始人兼CEO王兴...

AIGC动态

3个月前

DynRefer是一种新型的区域级多模态理解模型，由中国科学院大学LAMP实验室的研究人员开发，旨在通过模拟人类视觉认知过程，提高区域级多...

AIGC动态

3个月前

智谱AI在最新版本的GLM-4模型上取得了显著的技术与商业进展。其大模型开放平台已积累30万注册用户，日均调用量达到400亿Tokens，过去六...

AIGC动态

4个月前

在数据爆炸时代，大模型学习非结构化数据如视频、音频和图片面临重大挑战。多模态学习，特别是处理多种输入和异构数据时，深度神经网络...

AIGC动态

4个月前

近期研究表明，通过训练纯解码器生成模型，可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇...

AIGC动态

4个月前

在人工智能领域，模型能力的比较一直是一个重要的研究方向。近期，滑铁卢大学的TIGER实验室推出的GenAI-Arena平台，为模型比较提供了一...

AIGC动态

4个月前

在当前的AI技术演进浪潮中，天工AI搜索作为一款国内领先的产品，展现了显著的优势和潜力。其背后依托的MoE大模型，使得天工AI能够精准地...

AIGC动态

4个月前

在当前国际AI前沿，中国的天工AI和谷歌展开激烈竞争。天工AI作为中国AI搜索的领军者，成功推出国内首个AI搜索产品，凭借多模态、多步骤...

AIGC动态

4个月前

多模态大模型（MLLM）在视觉任务中展现出强大的认知理解能力，但目前大多数模型局限于单向的图像理解，难以在图像上进行精确定位。这一...

AIGC动态

4个月前