性能 | 第 3 页 | 学习AIGC

GPT-4.1偷偷开跑？神秘模型上线三天已被玩疯，网友发现大量OpenAI痕迹

Optimus Alpha作为一款新推出的大模型，在短时间内展现了惊人的处理能力，日Token处理量已超过340亿，位列Trending榜单第一。其表现不仅在编程任务中尤为突出...

AIGC动态

5个月前

Llama 4重测竞技场排名大跳水，网友：社区很难再信任Meta了

Llama 4模型在大模型竞技场中被曝作弊后，重新上架了非特供版模型，但其排名从第2位骤降至第32位。最初提交的“实验版”模型实际上是对人类偏好进行了优化，具...

AI-Agent

5个月前

为什么李飞飞团队经常cue通义千问？

近年来，人工智能领域的发展呈现出“更大、更多、更强”的趋势，特别是在大模型技术方面，中美两国的差距正在迅速缩小。根据斯坦福大学以人为本人工智能研究所...

AIGC动态

5个月前

【 ICLR 2025 】Adam 有了 mini 版：内存减半，吞吐量可提升 50%

在大语言模型训练中，内存开销是一个关键挑战，尤其是Adam优化器的高内存需求。为了解决这一问题，研究团队提出了一种轻量化优化器Adam-mini，通过分析Transf...

AIGC动态

5个月前

Llama 4 先后被 DeepSeek、英伟达暴击，Meta 不再是大模型开源“霸主”了

英伟达于4月8日发布了最新大语言模型Llama3.1 Nemotron Ultra 253B，该模型基于Meta的Llama-3.1-405B-Instruct构建，并通过神经架构搜索（NAS）技术进行了深...

AIGC动态

5个月前

反英伟达联盟的里程碑，UA Link 1.0：正式发布

UALink 1.0 规范的发布标志着人工智能计算领域的一个重要里程碑。该规范由 UALink 联盟于 2024 年 5 月成立，成员包括 AMD、AWS、博通、思科、谷歌、HPE、英...

AIGC动态

5个月前

斯坦福 AI 指数报告发布：2024 年美国 AI 私人投资约为中国的 12 倍、GPT-3.5级别模型推理成本下降 280 倍

斯坦福大学以人为本的人工智能研究所（HAI）发布的《2025年人工智能指数报告》显示，中美在人工智能领域的差距正在显著缩小。报告指出，过去一年中，美国的AI...

AIGC动态

5个月前

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

Llama 4 Behemoth作为教师模型，拥有2880亿个活跃参数和近2万亿个总参数，在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...

AIGC动态

5个月前

刚刚，Meta发布Llama 4系列模型

Meta今日发布了Llama 4系列模型，标志着其在人工智能领域的又一重要进展。Llama 4系列是首批开放权重的原生多模态模型，支持超长上下文，并首次采用了混合专...

AIGC动态

5个月前

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

法国AI创企Mistral AI最近开源了一款名为Mistral Small 3.1的多模态小模型，该模型在多个基准测试中表现优异，超越了Gemma 3和GPT-4o Mini等同类模型。Mistra...

AIGC动态

6个月前

标签：性能

GPT-4.1偷偷开跑？神秘模型上线三天已被玩疯，网友发现大量OpenAI痕迹

Llama 4重测竞技场排名大跳水，网友：社区很难再信任Meta了

为什么李飞飞团队经常cue通义千问？

【 ICLR 2025 】Adam 有了 mini 版：内存减半，吞吐量可提升 50%

Llama 4 先后被 DeepSeek、英伟达暴击，Meta 不再是大模型开源“霸主”了

反英伟达联盟的里程碑，UA Link 1.0：正式发布

斯坦福 AI 指数报告发布：2024 年美国 AI 私人投资约为中国的 12 倍、GPT-3.5级别模型推理成本下降 280 倍

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

刚刚，Meta发布Llama 4系列模型

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

热门网址

标签：性能

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址