标签:开源

Claude时代终结?LMArena实测DeepSeek R1编程得分超Opus 4,但月暗称其新模型更胜一筹

在当今以闭源模型为主导的AI技术领域,开源项目DeepSeek的最新版本DeepSeek-R1(0528)在多个关键领域超越了Claude Opus 4和GPT-4.1等顶级商业模型,成为开发...

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

DeepSeek新版R1在编程能力上取得了显著进展,尤其在网页编程领域,成功超越了Claude Opus 4,成为新的领军者。这一成就不仅展示了DeepSeek-R1-0528的强大性能...

Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿

月之暗面近期发布了开源代码模型Kimi-Dev-72B,该模型在软件工程任务基准测试SWE-bench Verified上取得了60.4%的成绩,创下开源模型新纪录,超越了包括DeepSe...

MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

MiniMax近期在X平台上预告了一整周的发布计划,首日推出了开源推理模型MiniMax M1,这一模型在多个评测集上表现优异,尤其在上下文处理能力上取得了显著突破...

苹果AI新进展:Qwen3已全面“登陆”苹果MLX框架

阿里巴巴Qwen团队于2024年6月16日宣布推出支持苹果MLX架构的Qwen3模型,这一举措标志着中国开源大模型在苹果设备上的本地化运行迈出了重要一步。Qwen3模型提...

o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark

经典小游戏如推箱子和俄罗斯方块已成为评估大模型性能的新基准。o3-pro模型在这两款游戏中的表现尤为突出,直接突破了现有基准的上限。推箱子的所有关卡均被o...

Day0迁移、一键部署,华为开源的昇思MindSpore成为大模型开发的“万能钥匙”

在AI大模型时代,行业逐渐形成一个共识:没有一个大模型可以一统天下。面对众多且不断更新的主流大模型和AI技术,开发者们面临的主要挑战是如何在一个统一的...

被“网暴”两个月后,Yann LeCun 携最新世界模型杀回!小扎千万美元激励抢人,Meta AI 内部权利之争开始

Meta 近日推出了其最新的“世界模型”V-JEPA 2,旨在提升 AI 在物理世界中的视觉理解与预测能力,从而增强 AI 主体的物理推理能力。这一模型被认为是实现高级机...

杨立昆亲自指导开源世界大模型,为AI Agent打造超级大脑

Meta近期开源了其最新的大模型V-JEPA 2,该模型在多个方面实现了显著的技术突破。V-JEPA 2通过使用100万小时的视频和100万张图像进行超大规模训练,旨在让AI...

Mistral的首个强推理模型:拥抱开源,推理速度快10倍

欧洲人工智能公司Mistral AI近期发布了全新的大语言模型系列Magistral,该系列展现了强大的推理能力,能够通过不断反思解决更复杂的任务。Magistral系列包含...
1 2 3 26