标签:大模型

GPT-5.2获封“最强打工人”,谷歌同日以Gemini“性价比”系列应战

OpenAI在成立十周年之际发布了GPT-5.2大模型,CEO萨姆·奥尔特曼在纪念文章中表达了对公司研发方向的强烈信心。尽管面临DeepSeek、Grok、Claude等竞争对手的追...

上海AI Lab胡侠:KV Cache压缩之后,可让价格2万美金的GPU发挥出20万美金的价值丨GAIR 2025

大模型在处理超长上下文方面已取得显著突破,部分模型如MiniMax-M1、Qwen2.5-1M已能支持百万Token级别的输入。然而,提升上下文长度仍面临巨大挑战,尤其在金...

基于 SGlang RBG + Mooncake 打造生产级云原生大模型推理平台

大语言模型(LLM)推理服务正迅速成为企业级应用的核心基础设施,其生产级落地需平衡性能、稳定性与成本。当前架构正从单体模式向分布式演进,主流路径包括Pr...

GAIR 2025 正式开幕:当AI变革行至产业深海,我们又将如何破暗寻光?

第八届GAIR全球人工智能与机器人大会在深圳举办,聚焦人工智能领域的前沿技术与产业变革。大会围绕大模型、AI算力、世界模型、数据与多模态、AI硬件等核心议...

大模型的第一性原理:(一)统计物理篇

2022年底至2025年间,大模型技术经历了从ChatGPT到Gemini 3的快速迭代,引发了对通用人工智能(AGI)的广泛讨论。白铂博士及其团队通过论文《Forget BIT, It ...

倒计时15小时,第八届 GAIR 全球人工智能与机器人大会即将开幕

2025年全球人工智能与机器人大会(GAIR)第八届会议将于12月12日至13日在深圳举行,聚焦大模型、AI算力、世界模型等前沿议题。大会由高文院士指导,杨强院士...

斯坦福破解大模型千篇一律:口述采样唤醒 AI创造力

研究发现大语言模型在追求安全顺从的过程中正面临创造力枯竭的模式坍塌问题。东北大学、斯坦福大学和西弗吉尼亚大学的联合团队揭示了这一现象源于人类偏好数...

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

在量子位MEET2026智能未来大会上,来自学术界、产业界和投资界的近30位代表集中探讨了人工智能领域的最新进展与未来趋势。大会核心聚焦于AI从生成式向推理式...

我看 MiniMax 闫俊杰:「心舟」已过万重山

大模型技术的崛起为新一代中国技术创业者提供了打破传统桎梏的机遇,使他们能够将技术理想与商业价值更紧密地结合。MiniMax创始人闫俊杰与罗永浩的对话揭示了...

王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」

在开源模型全面崛起的背景下,医疗领域已成为大模型技术竞争的核心战场之一。OpenAI推出HealthBench评价体系,OpenEvidence等医疗AI公司获得资本青睐,反映出...
1 2 3 69