18 19

池田湊

abigailwilliams

AI & ML interests

None yet

Recent Activity

liked a model 3 days ago

meta-llama/Meta-Llama-3-8B

upvoted a paper 4 days ago

Thinking Before Constraining: A Unified Decoding Framework for Large Language Models

liked a dataset 5 days ago

GatoCulotto/idm

View all activity

Organizations

None yet

liked a model 3 days ago

meta-llama/Meta-Llama-3-8B

Text Generation • 8B • Updated Sep 27, 2024 • 1.39M • • 6.57k

upvoted a paper 4 days ago

Thinking Before Constraining: A Unified Decoding Framework for Large Language Models

Paper • 2601.07525 • Published 11 days ago • 10

liked a dataset 5 days ago

GatoCulotto/idm

Updated 35 minutes ago • 10.1k • 5

upvoted a paper 5 days ago

On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters

Paper • 2606.02437 • Published 7 days ago • 220

liked a dataset 7 days ago

natgillin/translations

Viewer • Updated about 20 hours ago • 5.82B • 20k • 5

upvoted a paper 7 days ago

Gamma-World: Generative Multi-Agent World Modeling Beyond Two Players

Paper • 2605.28816 • Published 12 days ago • 420

liked 2 models 13 days ago

openbmb/BitCPM-CANN-8B

Text Generation • Updated 14 days ago • 6.66k • 99

tencent/Hy-MT2-1.8B

Translation • 2B • Updated 12 days ago • 22.9k • • 1.1k

liked a model 15 days ago

tencent/Hy-MT2-7B

Translation • 8B • Updated 12 days ago • 13k • 179

upvoted a paper 15 days ago

Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

Paper • 2605.06169 • Published May 7 • 233

upvoted a paper 16 days ago

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Paper • 2605.11609 • Published 27 days ago • 195

liked a dataset 16 days ago

gionuibk/aetheris-experiences

Viewer • Updated 1 day ago • 1.34k • 12k • 2

liked a dataset 17 days ago

icdn11/content-20260519f00e

Viewer • Updated 14 days ago • 50.1k • 5.7k • 2

upvoted a paper 19 days ago

SkillsVote: Lifecycle Governance of Agent Skills from Collection, Recommendation to Evolution

Paper • 2605.18401 • Published 21 days ago • 126

liked a model 20 days ago

usr10001/tde15b-random-1558m-step8000

2B • Updated 20 days ago • 17 • 1

upvoted a paper 24 days ago

Context Training with Active Information Seeking

Paper • 2605.13050 • Published 26 days ago • 7

liked 2 models 27 days ago

openbmb/MiniCPM-V-4.6

Image-Text-to-Text • 1B • Updated 3 days ago • 596k • 1.1k

lllyasviel/ControlNet

Updated Feb 25, 2023 • 1 • 3.82k

liked a model about 1 month ago

SHIHICOOKIE02/qwen-math-rl-grpo

Updated May 1 • 1

upvoted a paper about 2 months ago

LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model

Paper • 2604.20796 • Published Apr 22 • 243

池田湊

AI & ML interests

Recent Activity

Organizations

abigailwilliams's activity