Edward Beeching's picture

Edward Beeching PRO

edbeeching

HuggingFaceH4

·

https://edbeeching.github.io/

edbeeching

AI & ML interests

None yet

Organizations

edbeeching 's models 390

edbeeching/DeepSeek-R1-Distill-Qwen-1.5-GRPO

2B • Updated Feb 7, 2025

edbeeching/DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Updated Jan 30, 2025

edbeeching/DeepSeek-R1-Distill-Qwen-7B-GRPO

Updated Jan 30, 2025

edbeeching/gkd-model-compile

Updated Oct 17, 2024

edbeeching/gkd-model-no-compile

Updated Oct 17, 2024

edbeeching/EleutherAI_pythia-2.8b

Text Generation • 3B • Updated Aug 1, 2024 • 5

edbeeching/dpo_tldr_1b

Text Generation • 1B • Updated Aug 1, 2024 • 3

edbeeching/EleutherAI_pythia-6.9b

Updated Jul 26, 2024

edbeeching/online_dpo_tldr_6.9b

Text Generation • 7B • Updated Jul 25, 2024 • 3

edbeeching/dpo_tldr_6.9b

Updated Jul 25, 2024

edbeeching/vsft-llava_builder_Meta-Llama-3-8B

Image-Text-to-Text • 8B • Updated Apr 23, 2024 • 5

edbeeching/vsft-llava_builder-meta-Llama-3-8B

Updated Apr 23, 2024

edbeeching/vsft-llava_builder_zephyr-7b-beta

Image-Text-to-Text • 8B • Updated Apr 20, 2024 • 4

edbeeching/vsft-llava_builder

Updated Apr 19, 2024

edbeeching/atari_2B_atari_stargunner_2222

Reinforcement Learning • Updated Apr 16, 2024 • 4

edbeeching/atari_2B_atari_stargunner_1111

Reinforcement Learning • Updated Apr 16, 2024 • 2

edbeeching/atari_2B_atari_spaceinvaders_2222

Reinforcement Learning • Updated Apr 16, 2024 • 2

edbeeching/atari_2B_atari_spaceinvaders_1111

Reinforcement Learning • Updated Apr 16, 2024 • 4

edbeeching/atari_2B_atari_solaris_2222

Reinforcement Learning • Updated Apr 16, 2024 • 1

edbeeching/atari_2B_atari_solaris_1111

Reinforcement Learning • Updated Apr 16, 2024 • 2

edbeeching/atari_2B_atari_skiing_2222

Reinforcement Learning • Updated Apr 16, 2024 • 1

edbeeching/atari_2B_atari_skiing_1111

Reinforcement Learning • Updated Apr 16, 2024 • 3

edbeeching/atari_2B_atari_seaquest_2222

Reinforcement Learning • Updated Apr 16, 2024 • 2

edbeeching/atari_2B_atari_seaquest_1111

Reinforcement Learning • Updated Apr 16, 2024 • 2

edbeeching/atari_2B_atari_robotank_2222

Reinforcement Learning • Updated Apr 16, 2024 • 2

edbeeching/atari_2B_atari_robotank_1111

Reinforcement Learning • Updated Apr 16, 2024 • 6

edbeeching/atari_2B_atari_roadrunner_2222

Reinforcement Learning • Updated Apr 16, 2024 • 4

edbeeching/atari_2B_atari_roadrunner_1111

Reinforcement Learning • Updated Apr 16, 2024 • 2

edbeeching/atari_2B_atari_riverraid_2222

Reinforcement Learning • Updated Apr 16, 2024 • 3

edbeeching/atari_2B_atari_riverraid_1111

Reinforcement Learning • Updated Apr 16, 2024 • 4