逐张量缩放
FP8训练技术突破:8位浮点加速大模型,精度无损效率翻倍!

FP8训练技术突破:8位浮点加速大模型,精度无损效率翻倍!

2025-07-04