标签:大模型
李开复:零一万物AI Agent可接入任何开源模型,不要低估DeepSeek的强大能力
李开复博士领导的零一万物公司近期发布了升级后的企业大模型一站式平台“万智”2.0版本,并推出了企业级Agent智能体产品。该产品以“超级员工”为核心定位,具备...
Meta开源创新大模型架构AU-Nets
在大模型领域,文本数据的分解和处理一直是研究的核心问题。传统的分词方法,如Byte Pair Encoding,通常将文本分割成固定粒度的单元,并构建静态词汇表供模...
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
开源大模型领域近期迎来了显著的技术进展,尤其是中国市场的竞争愈发激烈。Kimi K2作为一款备受关注的模型,其1T的总参数量在短时间内被Qwen3的新版本超越。Q...
大语言模型离“数学证明高手”还有多远?斯坦福、伯克利、MIT 团队提出 IneqMath 评测标准
大语言模型(LLM)在生成看似正确的结论时,往往缺乏严谨的推理过程,尤其是在数学证明领域。不等式问题因其结构简单、逻辑清晰,成为检验模型推理能力的理想...
朱啸虎:大模型会吃掉90%的Agent
朱啸虎在其个人小红书账号上提出“大模型会吃掉90%的Agent”的观点,认为当前的AI Agent创业与互联网早期的个人站长模式有相似之处。他通过对比两者,指出AI Ag...
微软开源2025 ICML获奖框架,终结大模型多轮对话严重缺陷
微软在2025年国际机器学习会议上发布了获奖论文CoLLabLLM,并开源了该创新框架。CoLLabLLM旨在解决大模型在多轮交互中的缺陷,通过多轮对话模拟和多轮感知奖...
2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多
资本兴趣从大模型转向具身智能的趋势愈发明显。2024年上半年,国内具身智能领域共发生130起融资事件,总融资金额预估超过200亿元人民币,远超2023年全年的90...
基于闪电注意力机制,创新高效开源大模型
MiniMax公司开源了基于闪电注意力机制的专家混合模型MiniMax-M1,该模型在架构、创新模块和训练框架上均实现了显著突破。MiniMax-M1总参数为4560亿,其中459...
Kimi K2发布两天即“封神”?80%成本优势追平Claude 4、打趴“全球最强AI”,架构与DeepSeek相似!
月之暗面最新发布的MoE架构基础模型Kimi K2在海外引发了广泛关注。该模型的总参数量达到1万亿,激活参数为32B,已在Kimi Web端和App端上线。Kimi K2在OpenRou...
碾压DeepSeek V3!开源AI Agent专属模型,1万亿参数、工具使用能力超强
月之暗面(MoonshotAI)近期开源了其最新的大模型Kimi-K2,这是一个混合专家模型,总参数达到1万亿,其中320亿参数处于激活状态,训练数据规模高达15.5Ttoken...