强化学习
OE并发部署实操:效率翻倍!极速搞定2000+并发训练

OE并发部署实操:效率翻倍!极速搞定2000+并发训练

2026-01-21
7B模型GRPO逆袭14B!小模型也懂统筹,日程规划AI惊艳

7B模型GRPO逆袭14B!小模型也懂统筹,日程规划AI惊艳

2026-01-20
512GPU RL狂飙!Meta开源PyTorch神技,效率4倍!

512GPU RL狂飙!Meta开源PyTorch神技,效率4倍!

2026-01-10
PPO算法:LLM炼成神器的秘密,防作弊,速增效!

PPO算法:LLM炼成神器的秘密,防作弊,速增效!

2025-12-27
`torchforge`破局!大模型RL训练简化,驾驭700亿参数。

`torchforge`破局!大模型RL训练简化,驾驭700亿参数。

2025-10-23
NV大模型后训练极速!40%提速搞定亿级参数

NV大模型后训练极速!40%提速搞定亿级参数

2025-08-22
OpenAI重金激励AI人才!Meta豪掷1亿美金抢夺,AI推理成跨境新风口?

OpenAI重金激励AI人才!Meta豪掷1亿美金抢夺,AI推理成跨境新风口?

2025-08-03
NVIDIA开源神器NeMo-RL:1.5B模型训练竟超OpenAI O1

NVIDIA开源神器NeMo-RL:1.5B模型训练竟超OpenAI O1

2025-07-10