标签:多模态模型
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了
在最新的中文多模态大模型测评基准SuperCLUE-V中,腾讯的hunyuan-vision和上海AI Lab的InternVL2-40B分别成为闭源和开源界的领跑者,表现出色,甚至在某些方...
超强实体ChatGPT机器人:语音推理、视觉识别,“终结者”来啦!
Figure.AI联合创始人Brett Adcock发布了新一代实体机器人Figure 02,该机器人在前一代01的基础上进行了软硬件的大量更新。Figure 02搭载了6个RGB摄像头、Open...
8 人团队的开源多模态:Moshi,效果堪比 GPT-4o,合成数据立功
法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型,该模型具备听、说、看的能力,能够理解带有法国口音的英语。Moshi可以流畅地进行日...
现场Live震撼!OmAgent框架强势开源!行业应用已全面开花
联汇科技作为大模型行业的领军企业,其发展历程与自动驾驶技术的演变颇为相似,均经历了从概念到现实的转变,并在技术产品创新和用户体验上不断取得突破。公...
Sora负责人与谢赛宁「隔空对话」,LLM先锋集结中国最硬核AI内行盛会!智源大模型全家桶亮相
2024年的智源大会展示了人工智能领域的最新进展和学术成果,其中最引人注目的是智源研究院和中国电信人工智能研究院联合研发的全球首个低碳单体稠密万亿参数...
斯坦福AI团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路
斯坦福团队在Medium发布的文章中宣称,他们训练出了一个小型多模态模型Llama 3-V,其性能超越了GPT-4V、Gemini Ultra和Claude Opus等模型,且尺寸只有GPT4-V...
中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o
在中国移动人工智能生态大会主旨论坛上,中国移动发布了自研的「九天」千亿多模态基座大模型。这一模型被誉为国内最值得信赖、最懂行业的全栈大模型,旨在为...
国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座
在人工智能领域,一款仅用8B参数的端侧多模态模型引发了广泛关注。这款名为MiniCPM-Llama3-V 2.5的模型,以其卓越的性能击败了多模态巨无霸Gemini Pro和GPT-4...
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
Chameleon模型挑战了OpenAI的GPT-4o,成为首个敢于与之一较高下的新模型。Chameleon采用统一的Transformer架构,能够在单一神经网络中无缝处理文本和图像,通...
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
谷歌发布了Gemini 1.5系列多模态大模型的技术报告,该系列模型代表了高计算效率的下一代技术。报告指出,Gemini 1.5能够处理数百万token的上下文,并具备强大...