2 1

Dongyoon Hahm

Hahmdong

https://hahmdy.github.io

HahmDY

AI & ML interests

AI Safety

Recent Activity

updated a model 4 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

published a model 4 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

updated a model 4 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

View all activity

Organizations

None yet

updated a model 4 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

4B • Updated 4 days ago • 30

published a model 4 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

4B • Updated 4 days ago • 30

updated a model 4 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

4B • Updated 4 days ago • 48

published a model 4 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

4B • Updated 4 days ago • 48

upvoted a paper 6 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 10 days ago • 7

submitted a paper to Daily Papers 6 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 10 days ago • 7

authored a paper 7 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 10 days ago • 7

updated a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased150-to-good50

3B • Updated 23 days ago • 19

published a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased150-to-good50

3B • Updated 23 days ago • 19

updated a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased100-to-good100

3B • Updated 23 days ago • 19

published a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased100-to-good100

3B • Updated 23 days ago • 19

updated a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased50-to-good150

3B • Updated 23 days ago • 18

published a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased50-to-good150

3B • Updated 23 days ago • 18

updated a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean

3B • Updated 23 days ago • 19

published a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean

3B • Updated 23 days ago • 19

updated a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean-length-0.9

3B • Updated 23 days ago • 17

published a model 23 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean-length-0.9

3B • Updated 23 days ago • 17

updated 3 models 23 days ago

Dongyoon Hahm

AI & ML interests

Recent Activity

Organizations

Hahmdong's activity