Jiwon Jeon

jwjeonn

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Rebellious Student: Reversing Teacher Signals for Reasoning Exploration with Self-Distilled RLVR

updated a model 6 days ago

jwjeonn/GRPO-Qwen-Qwen3-4B-dapo_math

published a model 6 days ago

jwjeonn/GRPO-Qwen-Qwen3-4B-dapo_math

View all activity

Organizations

None yet

upvoted a paper 2 days ago

Rebellious Student: Reversing Teacher Signals for Reasoning Exploration with Self-Distilled RLVR

Paper • 2605.10781 • Published 4 days ago • 14

updated a model 6 days ago

jwjeonn/GRPO-Qwen-Qwen3-4B-dapo_math

Updated 6 days ago

published a model 6 days ago

jwjeonn/GRPO-Qwen-Qwen3-4B-dapo_math

Updated 6 days ago

updated 2 models 8 days ago

jwjeonn/SDPO-Qwen-Qwen3-4B-deepscaler_math-reprompt-tur0.0

Updated 8 days ago

jwjeonn/SDPO-Qwen-Qwen3-4B-dapo_math-reprompt-tur0.0

Updated 8 days ago

published a model 8 days ago

jwjeonn/SDPO20-kl-sdpobottom20-Qwen3-4B-dapo_math-origPrompt

Updated 8 days ago

updated a model 8 days ago

jwjeonn/SDPO20-kl-sdpobottom20-Qwen3-4B-dapo_math-origPrompt

Updated 8 days ago

updated a model 15 days ago

jwjeonn/iterWsdpo_review-grpo20-maxbuff2000-sdpoepoch2-Qwen3-4B-dapo_math-reprompt-tur0.0_persist

Updated 15 days ago

published a model 15 days ago

jwjeonn/iterWsdpo_review-grpo20-maxbuff2000-sdpoepoch2-Qwen3-4B-dapo_math-reprompt-tur0.0_persist

Updated 15 days ago

updated a model 15 days ago

jwjeonn/IterWSDPO-grpo20-sdpo20-Qwen3-4B-dapo_math-org-prompt-tur0.0

Updated 15 days ago

published a model 15 days ago

jwjeonn/IterWSDPO-grpo20-sdpo20-Qwen3-4B-dapo_math-org-prompt-tur0.0

Updated 15 days ago

updated a model 15 days ago

jwjeonn/GRPO-Qwen-Qwen3-4B-dapo_math-reprompt

Updated 15 days ago

published a model 15 days ago

jwjeonn/GRPO-Qwen-Qwen3-4B-dapo_math-reprompt

Updated 15 days ago

updated a model 15 days ago

jwjeonn/GRPO-Qwen-Qwen3-4B-Instruct-2507-dapo_math-reprompt

Updated 15 days ago

published 2 models 15 days ago

jwjeonn/GRPO-Qwen-Qwen3-4B-Instruct-2507-dapo_math-reprompt

Updated 15 days ago

jwjeonn/SDPO-Qwen-Qwen3-4B-deepscaler_math-reprompt-tur0.0

Updated 8 days ago

updated a model 15 days ago

jwjeonn/IterSDPO-grpo30-sdpo10-Qwen3-4B-deepscaler_math

Updated 15 days ago

published 2 models 15 days ago

jwjeonn/IterSDPO-grpo30-sdpo10-Qwen3-4B-deepscaler_math

Updated 15 days ago

jwjeonn/SDPO-Qwen-Qwen3-4B-Instruct-2507-dapo_math-reprompt-tur0.0

Updated 15 days ago

updated a model 15 days ago

jwjeonn/SDPO-Qwen-Qwen3-4B-dapo_math-tur0.0

Updated 15 days ago

Jiwon Jeon

AI & ML interests

Recent Activity

Organizations

jwjeonn's activity