标签:自动课程

小扎「梦之队」首批论文上线!LLM自举进化,单步性能狂飙22%

Meta超级实验室「Meta Superintelligence Labs,MSL」的三位成员上传ArXiv论文,探索利用强化学习(RL)高效微调大语言模型(LLM),使LLM在推理时实现迭代自...