标签:大模型
罗福莉执掌小米大模型首秀!定调下一代模型,全新MiMo-V2开源还横扫Agent第一梯队
罗福莉作为Xiaomi MiMo大模型负责人首次公开亮相,在2025小米人车家全生态合作伙伴大会上介绍了新一代开源大模型MiMo-V2-Flash。该模型采用混合专家(MoE)架...
郭毅可院士:AI带来「知识通胀」,击碎了传统教育的「前提假设」丨GAIR 2025
大模型技术正在从知识获取和教育范式两大根基上颠覆传统教育体系。香港科技大学首席副校长郭毅可在GAIR 2025大会的演讲中指出,当前教育面临的根本性挑战源于...
评测也很酷,Data Agent 自动化评测的三层框架与实战
在大模型技术快速发展的背景下,数据领域的应用如数仓开发、ChatBI问数和深度分析Agent等显著提升了效率,但如何科学评估这些应用的效果成为行业难题。字节跳...
万元奖金 + 免费算力加持,AIGC+大模型全场景开放!2025 AIGC 开发者大赛火热报名中~
2025 AIGC开发者大赛正式启动,聚焦人工智能生成内容(AIGC)与大模型技术的创新应用,旨在推动技术从概念走向实际落地。大赛由中科算网、算泥社区主办,AIGC...
AI算力新十年:技术革新、生态协同与商业闭环,共探「下一个寒武纪」之路丨GAIR 2025
GAIR 2025「AI 算力新十年」专场聚焦算力作为基础设施时代的核心议题,探讨技术路径、生态战略与商业逻辑如何穿越周期。论坛以“谁是下一个寒武纪”为主题,集...
GPT-5.2获封“最强打工人”,谷歌同日以Gemini“性价比”系列应战
OpenAI在成立十周年之际发布了GPT-5.2大模型,CEO萨姆·奥尔特曼在纪念文章中表达了对公司研发方向的强烈信心。尽管面临DeepSeek、Grok、Claude等竞争对手的追...
上海AI Lab胡侠:KV Cache压缩之后,可让价格2万美金的GPU发挥出20万美金的价值丨GAIR 2025
大模型在处理超长上下文方面已取得显著突破,部分模型如MiniMax-M1、Qwen2.5-1M已能支持百万Token级别的输入。然而,提升上下文长度仍面临巨大挑战,尤其在金...
基于 SGlang RBG + Mooncake 打造生产级云原生大模型推理平台
大语言模型(LLM)推理服务正迅速成为企业级应用的核心基础设施,其生产级落地需平衡性能、稳定性与成本。当前架构正从单体模式向分布式演进,主流路径包括Pr...
GAIR 2025 正式开幕:当AI变革行至产业深海,我们又将如何破暗寻光?
第八届GAIR全球人工智能与机器人大会在深圳举办,聚焦人工智能领域的前沿技术与产业变革。大会围绕大模型、AI算力、世界模型、数据与多模态、AI硬件等核心议...
大模型的第一性原理:(一)统计物理篇
2022年底至2025年间,大模型技术经历了从ChatGPT到Gemini 3的快速迭代,引发了对通用人工智能(AGI)的广泛讨论。白铂博士及其团队通过论文《Forget BIT, It ...




