10 15 35

Zhouliang Yu

zhouliang

https://zhouliang-yu.github.io

zhouliang-yu

AI & ML interests

Model-Based AI, Reinforcement Learning, Autoformalization

Recent Activity

liked a dataset about 17 hours ago

BytedTsinghua-SIA/CUDA-Agent-Ops-6K

liked a dataset 5 days ago

Goedel-LM/SFT_dataset_v2

liked a dataset 7 days ago

lm-provers/ProofBench

View all activity

Organizations

liked a dataset about 17 hours ago

BytedTsinghua-SIA/CUDA-Agent-Ops-6K

Viewer • Updated 4 days ago • 6k • 62 • 18

liked a dataset 5 days ago

Goedel-LM/SFT_dataset_v2

Viewer • Updated 1 day ago • 1.75M • 395 • 26

liked 3 datasets 7 days ago

liked a dataset 13 days ago

lm-provers/FineProofs-SFT

Viewer • Updated 17 days ago • 12.1k • 359 • 36

upvoted a paper 18 days ago

Reasoning Cache: Continual Improvement Over Long Horizons via Short-Horizon RL

Paper • 2602.03773 • Published 28 days ago • 11

liked a dataset 20 days ago

FrenzyMath/Herald_proofs

Viewer • Updated May 13, 2025 • 44.6k • 103 • 3

liked a dataset 23 days ago

INSAIT-Institute/OPC

Viewer • Updated Jul 15, 2025 • 4.93k • 103 • 13

liked a dataset 24 days ago

wenjiema02/ProofBench

Viewer • Updated Oct 14, 2025 • 899 • 118 • 7

upvoted a paper 26 days ago

Steering LLMs via Scalable Interactive Oversight

Paper • 2602.04210 • Published 28 days ago • 18

upvoted an article 27 days ago

Article

What's Automatic Differentiation?

Mar 19, 2024

•

liked 2 datasets about 1 month ago

ulamai/UnsolvedMath

Updated 27 days ago • 137 • 23

phanerozoic/Lean4-Mathlib

Viewer • Updated Jan 10 • 193k • 102 • 2

liked a dataset 2 months ago

nvidia/Nemotron-Math-Proofs-v1

Viewer • Updated Jan 5 • 925k • 900 • 102

published a dataset 4 months ago

zhouliang/DEMIMathAnalysis

Viewer • Updated Feb 27, 2025 • 88 • 5

upvoted a paper 4 months ago

P1: Mastering Physics Olympiads with Reinforcement Learning

Paper • 2511.13612 • Published Nov 17, 2025 • 134

liked a model 4 months ago

nvidia/OpenMath-Nemotron-1.5B

Text Generation • 2B • Updated Apr 30, 2025 • 3.78k • • 28

authored a paper 5 months ago

SimKO: Simple Pass@K Policy Optimization

Paper • 2510.14807 • Published Oct 16, 2025 • 11

upvoted a paper 5 months ago