标签:大模型

朱啸虎:大模型会吃掉90%的Agent

朱啸虎在其个人小红书账号上提出“大模型会吃掉90%的Agent”的观点,认为当前的AI Agent创业与互联网早期的个人站长模式有相似之处。他通过对比两者,指出AI Ag...

微软开源2025 ICML获奖框架,终结大模型多轮对话严重缺陷

微软在2025年国际机器学习会议上发布了获奖论文CoLLabLLM,并开源了该创新框架。CoLLabLLM旨在解决大模型在多轮交互中的缺陷,通过多轮对话模拟和多轮感知奖...

2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多

资本兴趣从大模型转向具身智能的趋势愈发明显。2024年上半年,国内具身智能领域共发生130起融资事件,总融资金额预估超过200亿元人民币,远超2023年全年的90...

基于闪电注意力机制,创新高效开源大模型

MiniMax公司开源了基于闪电注意力机制的专家混合模型MiniMax-M1,该模型在架构、创新模块和训练框架上均实现了显著突破。MiniMax-M1总参数为4560亿,其中459...

Kimi K2发布两天即“封神”?80%成本优势追平Claude 4、打趴“全球最强AI”,架构与DeepSeek相似!

月之暗面最新发布的MoE架构基础模型Kimi K2在海外引发了广泛关注。该模型的总参数量达到1万亿,激活参数为32B,已在Kimi Web端和App端上线。Kimi K2在OpenRou...

碾压DeepSeek V3!开源AI Agent专属模型,1万亿参数、工具使用能力超强

月之暗面(MoonshotAI)近期开源了其最新的大模型Kimi-K2,这是一个混合专家模型,总参数达到1万亿,其中320亿参数处于激活状态,训练数据规模高达15.5Ttoken...

杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA

Kimi在172天后发布了全新的Kimi K2基础大模型,采用MoE架构,总参数达到1T,激活参数为32B,尤其在代码、Agent和数学推理任务上展现了领先能力。此次发布不仅...

深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?

月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格为 16 元人民币 / 百万 token 输出。此次发布赶在了全球大模型集中发布的风口浪...

全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

AI大模型在科研领域的应用日益广泛,但如何准确评估其科研能力仍是一个难题。为了解决这一问题,Ai2联合耶鲁大学和纽约大学推出了SciArena,这是一个专为科学...

阿里达摩院开源多模态医学大模型—灵枢

大模型在医疗领域的应用面临三大主要难题:医疗知识覆盖不足、幻觉风险高以及推理能力欠缺。为了解决这些问题,阿里巴巴达摩院的研究团队开源了统一多模态医...
1 2 3 4 61