多模态 | 第 23 页

智源 Emu3 证明多模态模型新范式：只需基于下一个 token 预测

智源研究院于2024年10月21日发布了原生多模态世界模型Emu3，这一模型仅通过预测下一个token，就能实现对文本、图像、视频三种模态数据的理解和生成，无需依赖...

AIGC动态

11个月前

SAM 2.1上新、Lingua代码库发布，一大波Meta开源工具来袭

Meta公司近期分享了一系列研究和模型，旨在推动高级机器智能（AMI）的发展，并促进开放科学和可复现性。这些研究涵盖了AMI的多个构建模块，如感知、语音和语...

AIGC动态

11个月前

长文本、语音、视觉、结构化数据全覆盖，中国移动九天善智多模态大模型震撼发布

中国移动在第十二届全球合作伙伴大会上发布了九天善智多模态基座大模型，标志着其在人工智能领域的全面升级。该模型以全栈国产化和复杂系统智能化为特点，展...

AIGC动态

11个月前

OpenAI 发布实时 API，AI 实时语音时代如何抢占风口？

今年的RTE大会上，实时互动与AI的结合将展现巨大潜力。OpenAI发布的实时API公开测试版，基于GPT-4o语音到语音的AI应用和智能体，标志着实时语音交互能力的新...

AI-Agent

11个月前

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

Ai2公司推出了一款名为Molmo的多模态人工智能模型，该模型在功能上类似于钢铁侠的智能助手“贾维斯”。Molmo能够通过一张照片识别自行车的颜色、品牌和二手售价...

AIGC动态

11个月前

给机器人装上「虫脑」？非Transformer液态神经网络终于来了！MIT CSAIL负责人创业成果

Liquid AI是一家专注于开发新型人工智能模型的初创公司，由MIT计算机科学与人工智能实验室（CSAIL）的前研究人员创立。该公司旨在超越现有的生成式预训练Tran...

AIGC动态

11个月前

MIT系初创打破Transformer霸权！液体基础模型刷新SOTA，非GPT架构首次显著超越Transformer

MIT系初创公司Liquid AI推出了一种新型多模态非Transformer模型——液体基础模型LFM，该模型在基准测试中超越了现有的Transformer模型，成为新的SOTA（State of...

AIGC动态

11个月前

Meta开源多模态模型——Llama 3.2

Meta公司最近发布了其首个多模态大语言模型（LLM）Llama-3.2，标志着Llama系列的重大升级。此次升级包括四个不同规模的模型，旨在满足不同应用场景的需求。Ll...

AIGC动态

11个月前

天下苦LangChain久矣

Ell 是一个新发布的语言模型编程库，旨在与 LangChain、Llama-Index 和 DSPy 等现有库竞争，甚至有可能取代它们。Ell 的核心维护者对 LangChain 的抽象表示不...

AIGC动态

11个月前

「群体智能」剑指AGI革命！国产架构挑战Transformer霸权，首款非Attention模型更新

国内AI初创团队RockAI提出了一种新的方法来实现通用人工智能（AGI），即通过“群体智能”来赋予每个设备智能，并实现类人交互。他们认为，要实现这一目标，需要...

AIGC动态

11个月前

标签：多模态

智源 Emu3 证明多模态模型新范式：只需基于下一个 token 预测

SAM 2.1上新、Lingua代码库发布，一大波Meta开源工具来袭

长文本、语音、视觉、结构化数据全覆盖，中国移动九天善智多模态大模型震撼发布

OpenAI 发布实时 API，AI 实时语音时代如何抢占风口？

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

给机器人装上「虫脑」？非Transformer液态神经网络终于来了！MIT CSAIL负责人创业成果

MIT系初创打破Transformer霸权！液体基础模型刷新SOTA，非GPT架构首次显著超越Transformer

Meta开源多模态模型——Llama 3.2

天下苦LangChain久矣

「群体智能」剑指AGI革命！国产架构挑战Transformer霸权，首款非Attention模型更新

热门网址

标签：多模态

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址