标签:多模态模型

超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题

本文介绍了由智子引擎团队研发的多模态大模型Awaker 1.0,该模型在多模态任务中表现出色,特别是在数据生成和模型自主更新方面具有创新性。以下是对文章内容...

对话联想创投宋春雨:相信万亿参数、多模态是通往 AGI 的最佳路径

AI投资与技术创新访谈本文是一篇关于人工智能(AI)领域投资和技术创新的深度访谈,主要访谈对象是联想创投的合伙人宋春雨。宋春雨是一位专注于AI领域的投资...

马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合

模型Grok-1.5V的概述与特点马斯克的xAI团队推出了新的多模态模型Grok-1.5V,这是一个具有划时代意义的AI模型,它不仅在多项基准测试中超越了GPT-4V,还展示了...

马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

自2023年11月首次亮相以来,马斯克的公司在大模型领域不断取得进步,推出了,这是一个多模态模型,能够理解文本并处理文档、图表、截图和照片中的内容。Grok-...

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

GPT-4V的推出标志着多模态大模型研究的新篇章,它在多模态问答、推理和交互等领域展现了卓越的能力。然而,一些研究揭示了GPT-4V在基本能力上的不足,尤其是...

中科大等意外发现:大模型不看图也能正确回答视觉问题!

近期,中科大、香港中文大学和上海AI Lab的研究团队发现了一个有趣的现象:即使没有查看图片,一些大型语言模型和多模态模型也能在多模态基准测试MMMU中取得...

谷歌推出多模态视频模型,自动生成丰富动作视频

  文章摘要 【关 键 词】 AIGC、多模态模型、VLOGGER、视频生成、技术创新 随着数字化经济的蓬勃发展,虚拟数字人的需求在各行业中日益增长。为了...

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹果股东大会上表示,公...

跟科幻片一样!OpenAI只用13天给机器人加上了GPT,从此无比“接近人类”

文章介绍了硅谷火遍的人形机器人Figure 01,由OpenAI支持,展示了其具备看、听、对话等能力的最新demo。这个机器人通过自我学习而不是远程操作,展示了识别环...

万字梳理:阿里、腾讯等8家中国互联网大厂的50款大模型及应用,能否全面超越GPT-4? | 钛媒体AGI

自OpenAI推出ChatGPT以来,全球科技巨头纷纷加速布局AI大模型领域。钛媒体AGI整理了2023年以来,包括阿里巴巴、百度、字节跳动、腾讯、华为等在内的8家科技公...
1 3 4 5 6