标签:In Context RL

Kimi官方复盘:k1.5复现o1的思考过程

Kimi的多模态思考模型k1.5发布后,技术人员在知乎上分享了复现o1的关键思考过程。他们首先认识到Long CoT的有效性,并反思了Long Context的重要性。尽管Long ...