多模态 | 第 20 页

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

Llama 4 Behemoth作为教师模型，拥有2880亿个活跃参数和近2万亿个总参数，在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...

AIGC动态

1年前 (2025)

Meta深夜开源Llama 4！首次采用MoE，惊人千万token上下文，竞技场超越DeepSeek

Meta在周末发布了其最新AI模型系列Llama 4，包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这些模型经过大量未标注的文本、图像和视频数据训练，...

AIGC动态

1年前 (2025)

刚刚，Meta发布Llama 4系列模型

Meta今日发布了Llama 4系列模型，标志着其在人工智能领域的又一重要进展。Llama 4系列是首批开放权重的原生多模态模型，支持超长上下文，并首次采用了混合专...

AIGC动态

1年前 (2025)

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

在训练细节方面，Meta采用了全新的训练技术MetaP，通过设置关键模型超参数，实现了在不同批量大小、模型宽度和深度之间的良好扩展和泛化。Llama 4系列在200种...

AIGC动态

1年前 (2025)

Meta推出Llama 4：MoE构架、原生多模态、10M上下文，没有发布推理模型

Meta 创始人兼首席执行官马克·扎克伯格宣布推出全新 Llama 4 系列模型，包括两款即时可用的模型——Llama 4 Maverick 和 Llama 4 Scout，以及一款仍在训练中的...

AIGC动态

1年前 (2025)

10倍吞吐提升无损性能：多模态适用的KV cache量化策略来了，即插即用无需改原模型

多模态大语言模型在实际应用中展现出卓越性能，但其计算开销和显存占用问题仍然是关键瓶颈。KV cache机制通过显存换取计算效率，但随着输入数据规模的增大，...

AIGC动态

1年前 (2025)

GPT-4.5创造力比GPT-4o弱！浙大上海AI Lab发布新基准，寻找多模态创造力天花板

近来，GPT-4.5在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力，引发了关于多模态大模型（MLLMs）创造力天花板的讨论。现有的评测基准难...

AIGC动态

1年前 (2025)

第一个免费可用的智能Agent产品全量上线，中国公司智谱打造，推理模型比肩R1

国产AI领域迎来了一款名为「AutoGLM 沉思」的自主智能体产品，由中国公司智谱推出。这款产品不仅具备深度研究能力，还能动手操作，标志着AI技术从单纯的语言...

AI-Agent

1年前 (2025)

业界突破多模态泛化推理能力，OPPO研究院&港科广提出OThink-MR1技术

OPPO研究院与香港科技大学（广州）的研究人员提出了一项名为OThink-MR1的新技术，旨在通过动态强化学习提升多模态大模型的泛化推理能力。多模态大模型虽然能...

AIGC动态

1年前 (2025)

三星国行 Bixby 更新“语聊视界”，我们的生活离《Her》更近了一步？

三星 Galaxy S25 系列国行版本的 Bixby 语音助手于 3 月 26 日正式推出了“语聊视界”功能，这一功能基于多模态大模型，旨在提供超拟人的实时语音和视频聊天体...

AIGC动态

1年前 (2025)

标签：多模态

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

Meta深夜开源Llama 4！首次采用MoE，惊人千万token上下文，竞技场超越DeepSeek

刚刚，Meta发布Llama 4系列模型

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

Meta推出Llama 4：MoE构架、原生多模态、10M上下文，没有发布推理模型

10倍吞吐提升无损性能：多模态适用的KV cache量化策略来了，即插即用无需改原模型

GPT-4.5创造力比GPT-4o弱！浙大上海AI Lab发布新基准，寻找多模态创造力天花板

第一个免费可用的智能Agent产品全量上线，中国公司智谱打造，推理模型比肩R1

业界突破多模态泛化推理能力，OPPO研究院&港科广提出OThink-MR1技术

三星国行 Bixby 更新“语聊视界”，我们的生活离《Her》更近了一步？

热门网址

标签：多模态

AstronClaw

LibTV-AI视频创作

AI大学堂

热门网址