
文章摘要
2025年7月11日深夜,月之暗面公司突然开源了其万亿参数模型Kimi K2,这一举动迅速在AI领域引发了广泛关注。K2模型在代码和Agent任务上表现出色,很快与Grok 4一同出现在马斯克转发的热门模型趋势榜单上。与以往通过巨额广告预算推广不同,这次Kimi选择了一种更为开放和互动的方式,通过社交媒体和技术社区与外界分享K2的研发过程和技术细节。
在知乎等平台上,月之暗面的工程师和研究员们积极参与讨论,详细介绍了K2的架构和优化策略。例如,Infra团队的刘少伟指出K2在架构上复用了DeepSeek-V3,并采用了“fewer heads, more experts”的策略,以在相似成本下获得更低的loss。研究员Flood Sung则强调了MuonClip优化器带来的显著效果,以及团队在Agent能力上的突破,他们建立了一个大规模自动化数据生产工厂,以提升模型的思维能力。研究员Dylan则坦诚地表示,K2虽然具备灵性,但仍有许多不足之处,这种开放的态度让K2的形象更加立体。
Kimi团队的技术分享不仅在国内外技术社区中引发了热烈讨论,还吸引了海外开发者的关注。一些海外开发者开始翻译Kimi团队成员的文章,并分享到社区中,这种话语权的微妙变化反映了Kimi在技术传播上的成功。此外,Kimi团队还通过社交媒体展示了公司的文化品味,例如将会议室命名为传奇乐队,并在产品设计中追求独特的美学标准。这种文化品味不仅体现在产品设计上,还延伸到了App Store的版本更新历史中,甚至引用了哲学家维特根斯坦和记者菲利普·格雷厄姆的话。
Kimi团队的这场线上“团建”持续了数天,既有来自Infra和算法团队的技术硬核分享,也有贯穿在各个细节里的文化品味。团队成员们通过社交媒体刷屏式地转发各类KOL和开发者对K2的赞赏,表达了对K2的自豪感和喜悦。研究员“熊狸”在博客中提到,尽管DeepSeek-R1的爆火曾让外界质疑Kimi的实力,但团队认为这证明了硬实力是最好的推广方式,只要模型做得好,就会获得市场认可。他还提到,Kimi在2025年的反思会上提出了激进的建议,并集中资源搞基础算法和K2,以追求智能的上限。
K2的发布不仅展示了月之暗面在AI技术上的实力,也通过开放的技术分享和文化品味,重新定义了技术传播的方式。这种方式不仅让Kimi团队在技术社区中获得了广泛认可,也让公司内部重新焕发了活力。K2对于月之暗面来说,不仅是一个模型,更是一个让团队重新“活”起来的契机。
原文和模型
【原文链接】 阅读原文 [ 2083字 | 9分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★