Reinforcement Learning - a darylmooreNC Collection

darylmooreNC 's Collections

Multi-Agent Infrastructure

LLM Training Methodologies

LLM Architectures

Agentic AI Training and Tuning

Reinforcement Learning

Sports Predictive Modeling

Large Language Models

Reinforcement Learning

updated 17 days ago

Demystifying Reinforcement Learning in Agentic Reasoning

Paper • 2510.11701 • Published Oct 13 • 31
LoongRL:Reinforcement Learning for Advanced Reasoning over Long Contexts

Paper • 2510.19363 • Published Oct 22 • 61
Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning

Paper • 2510.25992 • Published Oct 29 • 44
Teaching Pretrained Language Models to Think Deeper with Retrofitted Recurrence

Paper • 2511.07384 • Published 26 days ago • 16
MarsRL: Advancing Multi-Agent Reasoning System via Reinforcement Learning with Agentic Pipeline Parallelism

Paper • 2511.11373 • Published 23 days ago • 12
TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework

Paper • 2511.05385 • Published 30 days ago
Souper-Model: How Simple Arithmetic Unlocks State-of-the-Art LLM Performance

Paper • 2511.13254 • Published 20 days ago • 134