512GPU RL狂飙!Meta开源PyTorch神技,效率4倍!

2026-01-10 04:44:18AI工具

快讯:Meta PyTorch团队开源`torchforge`,革新大型语言模型(LLMs)大规模强化学习(RL)微调。该库结合`Weaver`弱验证器与`Monarch`编排器,构建完整RL基础设施。Meta携手斯坦福大学和CoreWeave,在512块GPU集群上验证`torchforge`,成功运行前所未有的GRPO算法。实践证明,其简化了RL基础设施,大幅提升训练稳定性与效率。基于`Weaver`的RL训练无需人工标注,在MATH500等基准测试中取得显著性能提升,有效缩小了与人工标注训练的差距,加速全球AI研究。

发布于 2026-01-10
人民币汇率走势
CNY
亚马逊热销榜
共 0 SKU 上次更新 NaN:NaN:NaN
类目: 切换分类
暂无数据
暂无数据
关注我们
NMedia
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。