benchmark lmlmcat/cmmlu Updated Jul 13, 2023 β’ 24.4k β’ 73 nlp-waseda/JMMLU Updated Feb 27, 2024 β’ 403 β’ 10 HAERAE-HUB/KMMLU Viewer β’ Updated Mar 5, 2024 β’ 244k β’ 12.9k β’ 95 openai/openai_humaneval Viewer β’ Updated Jan 4, 2024 β’ 164 β’ 107k β’ 354
benchmark lmlmcat/cmmlu Updated Jul 13, 2023 β’ 24.4k β’ 73 nlp-waseda/JMMLU Updated Feb 27, 2024 β’ 403 β’ 10 HAERAE-HUB/KMMLU Viewer β’ Updated Mar 5, 2024 β’ 244k β’ 12.9k β’ 95 openai/openai_humaneval Viewer β’ Updated Jan 4, 2024 β’ 164 β’ 107k β’ 354