标签:多模态模型

中国AI竞争加剧:苹果或与腾讯字节合作,新增46万张GPU芯片、豆包语言模型排名第一|钛媒体AGI

苹果公司正在与中国的腾讯和字节跳动进行谈判,考虑将这两家公司的AI模型整合到在中国销售的iPhone中。字节跳动的豆包大模型和腾讯的混元模型在评测中表现突...

OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1

谷歌DeepMind宣布了新一代原生多模态模型Gemini 2.0 Flash的正式发布,标志着智能体时代的进一步发展。Gemini 2.0 Flash在性能上超越了前代1.5 Pro,速度提升...

亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

亚马逊最近推出了Nova系列多模态模型,其中Nova Pro在多项基准测试中超越了GPT-4o,仅次于Gemini 1.5 Pro和Claude 3.5 Sonnet。Nova系列以其低廉的价格和高性...

视觉模型智能涌现后, Scaling Law 不会到头

近期,哈佛大学的一篇论文《Scaling Laws for Precision》引发了关于自然语言处理领域Scaling Law可能达到瓶颈的讨论。该论文指出,当前语言模型在大量数据上...

国产3D虚拟人版《Her》「杀向」迪拜

在GITEX GLOBAL展会上,中国公司Soul展示了其在AI社交领域的最新进展。Soul的展位设有三个互动屏幕,分别用于体验与3D数字人互动、创建多语言交流的3D数字人...

Boson李沐、Luma 宋佳铭:AI科学家能不能理解普通人对AI的需求,怎么理解?

在2024年的华源年会上,一场关于人工智能技术如何进入消费者市场的讨论吸引了众多关注。硅星人创始人骆轶航与BosonAI联合创始人李沐、Luma AI首席科学家宋佳...

全球首个人机交互端到端多模态大模型发布,RockAI CEO刘凡平:训推同步是自主学习的最佳方式|钛媒体AGI

岩芯数智RockAI在上海发布了其最新升级的Yan 1.3大模型,这是全球首个端到端的多模态大模型,能够处理图文及语音等多模态信息,并适用于无人机、机器人、PC、...

Jeff Dean回忆谷歌趣事:吴恩达激励自己继续研究,Hinton曾是最强「实习生」

Jeff Dean,谷歌的AI领域资深专家,自1999年加入谷歌以来,一直是公司在人工智能和机器学习领域的领军人物。他参与创立了Google Brain团队,并在2021年荣获IE...

万字长文解析OpenAI o1 Self-Play RL技术路线

OpenAI最近推出的Self-Play RL新模型o1在数理推理领域取得了显著成绩,并提出了train-time compute和test-time compute两个新的RL Scaling Law。o1是一个多模...

阿里重磅开源Qwen2-VL:能理解超20分钟视频,媲美GPT-4o!

阿里巴巴集团开源了其最新研发的视觉多模态模型Qwen2-VL,这一模型在多项性能指标上超越了OpenAI的GPT-4o和Anthropic的Claude3.5-Sonnet等知名闭源模型,成为...
1 2 3 5