图像生成

1000万上下文！新开源多模态大模型，单个GPU就能运行

今年2月初，谷歌发布的Gemini 2.0 Pro支持200万上下文，震惊了整个大模型领域。然而，仅过了2个月，Meta最新开源的Llama 4 Scout就将上下文扩展至1000万，整...

AIGC动态

3个月前

Meta于4月5日发布了Llama4系列开源模型，包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这三种模型分别针对不同的使用需求，展示了Meta在人工智能...

AIGC动态

3个月前

Llama 4 Behemoth作为教师模型，拥有2880亿个活跃参数和近2万亿个总参数，在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...

AIGC动态

3个月前

Meta在周末发布了其最新AI模型系列Llama 4，包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这些模型经过大量未标注的文本、图像和视频数据训练，...

AIGC动态

3个月前

Meta今日发布了Llama 4系列模型，标志着其在人工智能领域的又一重要进展。Llama 4系列是首批开放权重的原生多模态模型，支持超长上下文，并首次采用了混合专...

AIGC动态

3个月前

在训练细节方面，Meta采用了全新的训练技术MetaP，通过设置关键模型超参数，实现了在不同批量大小、模型宽度和深度之间的良好扩展和泛化。Llama 4系列在200种...

AIGC动态

3个月前

多模态大语言模型在实际应用中展现出卓越性能，但其计算开销和显存占用问题仍然是关键瓶颈。KV cache机制通过显存换取计算效率，但随着输入数据规模的增大，...

AIGC动态

3个月前

Higgsfield AI最新推出的Motion Controls AI视频生成技术，标志着AI在电影级动作捕捉和视频生成领域取得了显著进展。该技术能够通过一张静态图像生成具有真实...

AIGC动态

3个月前

近来，GPT-4.5在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力，引发了关于多模态大模型（MLLMs）创造力天花板的讨论。现有的评测基准难...

AIGC动态

3个月前

豆包AI的文生图功能近期进行了显著升级，主要体现在四个方面：标题大字准确度提升至94%，小字生成能力也有所增强；语义理解和影视质感得到优化，镜头更具叙事...

AIGC动态

3个月前