标签：AI法律助理

OpenAI发布季第二天：强化微调，少量样本就能训练自己的专家模型

OpenAI在其12天计划的第2天发布了一项名为Reinforcement Fine-Tuning（RFT）的新技术，这是一种通过强化学习对模型进行定制的技术。RFT允许开发者使用强化学...

AIGC动态

1年前 (2024)