标签:大模型

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

开源大模型领域近期迎来了显著的技术进展,尤其是中国市场的竞争愈发激烈。Kimi K2作为一款备受关注的模型,其1T的总参数量在短时间内被Qwen3的新版本超越。Q...

大语言模型离“数学证明高手”还有多远?斯坦福、伯克利、MIT 团队提出 IneqMath 评测标准

大语言模型(LLM)在生成看似正确的结论时,往往缺乏严谨的推理过程,尤其是在数学证明领域。不等式问题因其结构简单、逻辑清晰,成为检验模型推理能力的理想...

朱啸虎:大模型会吃掉90%的Agent

朱啸虎在其个人小红书账号上提出“大模型会吃掉90%的Agent”的观点,认为当前的AI Agent创业与互联网早期的个人站长模式有相似之处。他通过对比两者,指出AI Ag...

微软开源2025 ICML获奖框架,终结大模型多轮对话严重缺陷

微软在2025年国际机器学习会议上发布了获奖论文CoLLabLLM,并开源了该创新框架。CoLLabLLM旨在解决大模型在多轮交互中的缺陷,通过多轮对话模拟和多轮感知奖...

2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多

资本兴趣从大模型转向具身智能的趋势愈发明显。2024年上半年,国内具身智能领域共发生130起融资事件,总融资金额预估超过200亿元人民币,远超2023年全年的90...

基于闪电注意力机制,创新高效开源大模型

MiniMax公司开源了基于闪电注意力机制的专家混合模型MiniMax-M1,该模型在架构、创新模块和训练框架上均实现了显著突破。MiniMax-M1总参数为4560亿,其中459...

Kimi K2发布两天即“封神”?80%成本优势追平Claude 4、打趴“全球最强AI”,架构与DeepSeek相似!

月之暗面最新发布的MoE架构基础模型Kimi K2在海外引发了广泛关注。该模型的总参数量达到1万亿,激活参数为32B,已在Kimi Web端和App端上线。Kimi K2在OpenRou...

碾压DeepSeek V3!开源AI Agent专属模型,1万亿参数、工具使用能力超强

月之暗面(MoonshotAI)近期开源了其最新的大模型Kimi-K2,这是一个混合专家模型,总参数达到1万亿,其中320亿参数处于激活状态,训练数据规模高达15.5Ttoken...

杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA

Kimi在172天后发布了全新的Kimi K2基础大模型,采用MoE架构,总参数达到1T,激活参数为32B,尤其在代码、Agent和数学推理任务上展现了领先能力。此次发布不仅...

深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?

月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格为 16 元人民币 / 百万 token 输出。此次发布赶在了全球大模型集中发布的风口浪...
1 2 3 4 62