TOCCI ZHU's picture

1

TOCCI ZHU

soberzhu

AI & ML interests

None yet

Recent Activity

authored a paper 8 days ago

Bridging SFT and RL: Dynamic Policy Optimization for Robust Reasoning

upvoted a paper 9 days ago

Bridging SFT and RL: Dynamic Policy Optimization for Robust Reasoning

View all activity

Organizations

None yet

authored a paper 8 days ago

Bridging SFT and RL: Dynamic Policy Optimization for Robust Reasoning

Paper • 2604.08926 • Published 12 days ago • 1

upvoted a paper 9 days ago

Bridging SFT and RL: Dynamic Policy Optimization for Robust Reasoning

Paper • 2604.08926 • Published 12 days ago • 1