标签:多模态模型
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
Chameleon模型挑战了OpenAI的GPT-4o,成为首个敢于与之一较高下的新模型。Chameleon采用统一的Transformer架构,能够在单一神经网络中无缝处理文本和图像,通...
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
谷歌发布了Gemini 1.5系列多模态大模型的技术报告,该系列模型代表了高计算效率的下一代技术。报告指出,Gemini 1.5能够处理数百万token的上下文,并具备强大...
微软宣布GPT-4o模型,可在 Azure OpenAI上使用
模型发布与应用平台:微软在官网宣布,OpenAI的多模态模型GPT-4o已在Azure OpenAI云服务中可用。GPT-4o能够进行跨文本、视频、音频的多模态推理,例如,可以...
OpenAI重磅更新定档下周一,奥特曼暗示会有「魔法」!
OpenAI即将在下周一(13日)上午10点(太平洋时间)进行线上直播,届时将展示全新的ChatGPT demo演示和GPT-4升级更新。尽管之前有关于GPT-5和搜索引擎的传闻...
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
本文介绍了由智子引擎团队研发的多模态大模型Awaker 1.0,该模型在多模态任务中表现出色,特别是在数据生成和模型自主更新方面具有创新性。以下是对文章内容...
对话联想创投宋春雨:相信万亿参数、多模态是通往 AGI 的最佳路径
AI投资与技术创新访谈本文是一篇关于人工智能(AI)领域投资和技术创新的深度访谈,主要访谈对象是联想创投的合伙人宋春雨。宋春雨是一位专注于AI领域的投资...
马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合
模型Grok-1.5V的概述与特点马斯克的xAI团队推出了新的多模态模型Grok-1.5V,这是一个具有划时代意义的AI模型,它不仅在多项基准测试中超越了GPT-4V,还展示了...
马斯克的首款多模态大模型来了,GPT-4V又被超越了一次
自2023年11月首次亮相以来,马斯克的公司在大模型领域不断取得进步,推出了,这是一个多模态模型,能够理解文本并处理文档、图表、截图和照片中的内容。Grok-...
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
GPT-4V的推出标志着多模态大模型研究的新篇章,它在多模态问答、推理和交互等领域展现了卓越的能力。然而,一些研究揭示了GPT-4V在基本能力上的不足,尤其是...
中科大等意外发现:大模型不看图也能正确回答视觉问题!
近期,中科大、香港中文大学和上海AI Lab的研究团队发现了一个有趣的现象:即使没有查看图片,一些大型语言模型和多模态模型也能在多模态基准测试MMMU中取得...