标签:量化策略

大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当

微软研究院最近推出了首个FP4精度的大模型训练框架,这一技术能够在保持与FP8和BF16相当的训练效果的同时,显著减少所需的存储和计算资源。该框架支持高达130...