Unleashing Efficient Asynchronous RL Post-Training via Staleness-Constrained Rollout Coordination

Published in arXiv preprint, 2026

Haoyang Li, Sheng Lin, Fangcheng Fu, Yuming Zhou, Xiaodong Ji, Yanfeng Zhao, Lefeng Wang, Jie Jiang, Bin Cui