标签:模型
Claude时代终结?LMArena实测DeepSeek R1编程得分超Opus 4,但月暗称其新模型更胜一筹
在当今以闭源模型为主导的AI技术领域,开源项目DeepSeek的最新版本DeepSeek-R1(0528)在多个关键领域超越了Claude Opus 4和GPT-4.1等顶级商业模型,成为开发...
网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
DeepSeek新版R1在编程能力上取得了显著进展,尤其在网页编程领域,成功超越了Claude Opus 4,成为新的领军者。这一成就不仅展示了DeepSeek-R1-0528的强大性能...
请记住 MiniMax M1:MiniMax 用自己的方法追上R1们,直奔最强Agent模型而去
MiniMax M1 的发布标志着该公司在基础模型领域的一次重大突破。该模型采用了线性注意力 Lightning Attention 机制,并将其与传统的 softmax attention 相结合...
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
月之暗面近期发布了开源代码模型Kimi-Dev-72B,该模型在软件工程任务基准测试SWE-bench Verified上取得了60.4%的成绩,创下开源模型新纪录,超越了包括DeepSe...
微软分享三大王炸算法:突破大模型推理瓶颈,性能大涨
微软近日分享了其自研的三大创新算法——rStar-Math、LIPS和CPL,旨在增强大语言模型的推理能力,特别是在数学推理和思考链方面的表现。这些算法不仅适用于小参...
MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
MiniMax近期在X平台上预告了一整周的发布计划,首日推出了开源推理模型MiniMax M1,这一模型在多个评测集上表现优异,尤其在上下文处理能力上取得了显著突破...
苹果AI新进展:Qwen3已全面“登陆”苹果MLX框架
阿里巴巴Qwen团队于2024年6月16日宣布推出支持苹果MLX架构的Qwen3模型,这一举措标志着中国开源大模型在苹果设备上的本地化运行迈出了重要一步。Qwen3模型提...
AI进化三年,产业落地真拐点可能就在这场全球顶尖金融智能赛事里
AI 技术正在从模型性能的竞争转向实际应用价值的探索。随着生成式 AI 的快速发展,模型参数量和训练成本不断攀升,但性能提升并非终点,真正的挑战在于如何将...
复旦大学/上海创智学院邱锡鹏:Context Scaling,通往AGI的下一幕
人工智能领域正在经历一场深刻的变革,从传统的预训练模型向更复杂的情境智能(Contextual Intelligence)转变。2024年底,Ilya Sutskever的断言引发了业界对...
从天价咨询到免费AI,夸克能改变志愿填报这门生意吗?
高考结束后,填报志愿成为考生和家长面临的重要挑战。由于各省份志愿填报数量差异较大,从30个到120个不等,许多家庭选择寻求专业咨询服务,但这些服务往往价...