标签:GPT-3

WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律

2020年,1750亿参数规模的GPT-3模型问世,其训练成本高昂,需要使用1000张英伟达A100 GPU,花费81.6万美元,耗时22天。然而,到了2024年,只需2B参数规模的大...