⚔️ BigCodeArena - a bigcode Collection

bigcode 's Collections

⚔️ BigCodeArena

💫 StarCoder2

🌸BigCodeBench

✨Astraios-15B

⚔️ BigCodeArena

updated Mar 2

Unveiling More Reliable Human Preferences in Code Generation via Execution

Running

Agents

37

BigCodeArena

🚀

37

Compare two AI models by sending them code and seeing their responses
BigCodeArena: Unveiling More Reliable Human Preferences in Code Generation via Execution

Paper • 2510.08697 • Published Oct 9, 2025 • 40
bigcode/bigcodearena-raw-14k

Viewer • Updated Oct 13, 2025 • 14.1k • 24 • 2
bigcode/bigcodearena-preference-5k

Viewer • Updated Oct 13, 2025 • 4.73k • 63 • 1
bigcode/bigcodereward

Viewer • Updated Oct 15, 2025 • 4.73k • 447 • 2
bigcode/bigcodereward-experiment-results

Viewer • Updated Oct 13, 2025 • 141k • 119
bigcode/autocodearena-v0

Viewer • Updated Oct 15, 2025 • 600 • 28 • 2