lyf's picture

4

lyf

chaojidouding

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

upvoted a paper 19 days ago

Real-Time Aligned Reward Model beyond Semantics

upvoted a paper 19 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

View all activity

Organizations

None yet

upvoted a paper 6 days ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published 20 days ago • 248

upvoted 2 papers 19 days ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published about 1 month ago • 13

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 20 days ago • 272

upvoted a paper about 2 months ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 155