标签:开源
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
月之暗面近期发布了开源代码模型Kimi-Dev-72B,该模型在软件工程任务基准测试SWE-bench Verified上取得了60.4%的成绩,创下开源模型新纪录,超越了包括DeepSe...
MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
MiniMax近期在X平台上预告了一整周的发布计划,首日推出了开源推理模型MiniMax M1,这一模型在多个评测集上表现优异,尤其在上下文处理能力上取得了显著突破...
苹果AI新进展:Qwen3已全面“登陆”苹果MLX框架
阿里巴巴Qwen团队于2024年6月16日宣布推出支持苹果MLX架构的Qwen3模型,这一举措标志着中国开源大模型在苹果设备上的本地化运行迈出了重要一步。Qwen3模型提...
o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark
经典小游戏如推箱子和俄罗斯方块已成为评估大模型性能的新基准。o3-pro模型在这两款游戏中的表现尤为突出,直接突破了现有基准的上限。推箱子的所有关卡均被o...
Day0迁移、一键部署,华为开源的昇思MindSpore成为大模型开发的“万能钥匙”
在AI大模型时代,行业逐渐形成一个共识:没有一个大模型可以一统天下。面对众多且不断更新的主流大模型和AI技术,开发者们面临的主要挑战是如何在一个统一的...
被“网暴”两个月后,Yann LeCun 携最新世界模型杀回!小扎千万美元激励抢人,Meta AI 内部权利之争开始
Meta 近日推出了其最新的“世界模型”V-JEPA 2,旨在提升 AI 在物理世界中的视觉理解与预测能力,从而增强 AI 主体的物理推理能力。这一模型被认为是实现高级机...
杨立昆亲自指导开源世界大模型,为AI Agent打造超级大脑
Meta近期开源了其最新的大模型V-JEPA 2,该模型在多个方面实现了显著的技术突破。V-JEPA 2通过使用100万小时的视频和100万张图像进行超大规模训练,旨在让AI...
Mistral的首个强推理模型:拥抱开源,推理速度快10倍
欧洲人工智能公司Mistral AI近期发布了全新的大语言模型系列Magistral,该系列展现了强大的推理能力,能够通过不断反思解决更复杂的任务。Magistral系列包含...
新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了
Mistral AI发布了其首款推理模型Magistral,该模型旨在提升多语言推理能力和可解释性。Magistral分为两个版本:Magistral Small,一个24B参数的开源权重版本...
一家中国公司,做了苹果AI该做的事。
今年的WWDC主题演讲中,苹果并未推出令人激动的AI新特性,但AI已逐渐融入手机的各个功能,如相册、翻译、电话和搜索,且这些功能大多通过端侧AI实现。端侧模...