标签:数据混合

450美元训练一个「o1-preview」?UC伯克利开源32B推理模型Sky-T1,AI社区沸腾了

加州大学伯克利分校天空计算实验室的研究团队NovaSky发布了Sky-T1-32B-Preview,这是一个32B推理模型,其训练成本不到450美元,显示出高级推理能力的复制可以...

大模型「强崩溃」!Meta新作:合成数据有「剧毒」,1%即成LLM杀手

近期,来自Meta、纽约大学和加州大学洛杉矶分校(UCLA)的研究团队在一篇论文中探讨了合成数据对大型语言模型(LLM)的影响。研究发现,即使合成数据在总数据...