图像生成

图像,绘画

Llama 4 详细评测:开源模型的全面倒退?

Meta最新发布的开源大模型Llama 4在技术社区引发了广泛争议。尽管其规格参数堪称“顶配开源”,包括两个混合专家(MoE)架构版本——Scout(109B总参数,17B活跃...

反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?

反向传播作为深度学习的主流方法,近年来因其生物学不合理性、内存消耗大以及并行计算受限等问题,逐渐受到质疑。Geoffrey Hinton等人一直致力于寻找替代方案...

AI爬虫肆虐,OpenAI等大厂不讲武德!开发者打造「神级武器」宣战

AI网络爬虫在互联网上的行为引发了广泛关注,尤其是在大模型时代,爬虫的威胁变得愈发严重。Triplegangers公司的案例揭示了这一问题的严重性:OpenAI的爬虫机...

1000万上下文!新开源多模态大模型,单个GPU就能运行

今年2月初,谷歌发布的Gemini 2.0 Pro支持200万上下文,震惊了整个大模型领域。然而,仅过了2个月,Meta最新开源的Llama 4 Scout就将上下文扩展至1000万,整...

1000万上下文+2880亿参数的Llama4,却让DeepSeek们松了一口气

Meta于4月5日发布了Llama4系列开源模型,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这三种模型分别针对不同的使用需求,展示了Meta在人工智能...

刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

Llama 4 Behemoth作为教师模型,拥有2880亿个活跃参数和近2万亿个总参数,在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...

Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek

Meta在周末发布了其最新AI模型系列Llama 4,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这些模型经过大量未标注的文本、图像和视频数据训练,...

刚刚,Meta发布Llama 4系列模型

Meta今日发布了Llama 4系列模型,标志着其在人工智能领域的又一重要进展。Llama 4系列是首批开放权重的原生多模态模型,支持超长上下文,并首次采用了混合专...

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

在训练细节方面,Meta采用了全新的训练技术MetaP,通过设置关键模型超参数,实现了在不同批量大小、模型宽度和深度之间的良好扩展和泛化。Llama 4系列在200种...

10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型

多模态大语言模型在实际应用中展现出卓越性能,但其计算开销和显存占用问题仍然是关键瓶颈。KV cache机制通过显存换取计算效率,但随着输入数据规模的增大,...
1 2 3 4 5 6 120