Yang Li's picture

Yang Li

yli-ml

·

AI & ML interests

None yet

Recent Activity

submitted a paper 4 days ago

Learning from Language Feedback via Variational Policy Distillation

upvoted a paper 4 days ago

Learning from Language Feedback via Variational Policy Distillation

updated a dataset 5 months ago

yli-ml/router-generation

View all activity

Organizations

submitted a paper to Daily Papers 4 days ago

Learning from Language Feedback via Variational Policy Distillation

Paper • 2605.15113 • Published 7 days ago • 10

upvoted a paper 4 days ago

Learning from Language Feedback via Variational Policy Distillation

Paper • 2605.15113 • Published 7 days ago • 10

updated a dataset 5 months ago

yli-ml/router-generation

Updated Jan 8 • 6

published a dataset 5 months ago

yli-ml/router-generation

Updated Jan 8 • 6

updated a model 10 months ago

yli-ml/phi1.5-tofu-ft

Updated Jul 20, 2025

published a model 10 months ago

yli-ml/phi1.5-tofu-ft

Updated Jul 20, 2025

commented a paper about 1 year ago

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

Paper • 2504.20571 • Published Apr 29, 2025 • 99 •

New activity in hendrycks/competition_math over 1 year ago

🚩 Report: Legal issue(s)

#5 opened over 1 year ago by