21 66 70

Yuhang Zang PRO

yuhangzang

https://yuhangzang.github.io/

AI & ML interests

🤗 HuggingFace is all you need

Recent Activity

authored a paper 3 days ago

ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning

upvoted a paper 3 days ago

ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning

upvoted a paper 5 days ago

ViSAudio: End-to-End Video-Driven Binaural Spatial Audio Generation

View all activity

Organizations

authored a paper 3 days ago

ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning

Paper • 2512.05111 • Published 3 days ago • 42

upvoted a paper 3 days ago

ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning

Paper • 2512.05111 • Published 3 days ago • 42

upvoted a paper 5 days ago

ViSAudio: End-to-End Video-Driven Binaural Spatial Audio Generation

Paper • 2512.03036 • Published 5 days ago • 20

updated 2 models 13 days ago

internlm/Spatial-SSRL-Qwen3VL-4B

Image-Text-to-Text • 5B • Updated 13 days ago • 335 • 8

internlm/Spatial-SSRL-7B

Image-Text-to-Text • 8B • Updated 13 days ago • 286 • 9

liked a model 13 days ago

internlm/Spatial-SSRL-Qwen3VL-4B

Image-Text-to-Text • 5B • Updated 13 days ago • 335 • 8

authored 2 papers 14 days ago

LSVOS 2025 Challenge Report: Recent Advances in Complex Video Object Segmentation

Paper • 2510.11063 • Published Oct 13 • 1

Think Visually, Reason Textually: Vision-Language Synergy in ARC

Paper • 2511.15703 • Published 18 days ago • 8

updated a dataset 14 days ago

internlm/Spatial-SSRL-81k

Preview • Updated 14 days ago • 702 • 4

published a model 14 days ago

internlm/Spatial-SSRL-Qwen3VL-4B

Image-Text-to-Text • 5B • Updated 13 days ago • 335 • 8

upvoted a paper 15 days ago

Think Visually, Reason Textually: Vision-Language Synergy in ARC

Paper • 2511.15703 • Published 18 days ago • 8

New activity in huggingface/HuggingDiscussions 17 days ago

[FEEDBACK] Daily Papers

🔥 ❤️ 21

165

#32 opened over 1 year ago by

kramp

liked a model 25 days ago

baidu/ERNIE-4.5-VL-28B-A3B-Thinking

Image-Text-to-Text • 30B • Updated 5 days ago • 48k • 507

New activity in internlm/STAR-Bench 28 days ago

Improve dataset card: Add task categories, language, tags, paper links, sample usage, and citation

#2 opened about 1 month ago by

nielsr

authored a paper about 1 month ago

Spatial-SSRL: Enhancing Spatial Understanding via Self-Supervised Reinforcement Learning

Paper • 2510.27606 • Published Oct 31 • 27

liked a Space about 1 month ago

Spatial-SSRL Spatial Reasoning

🌍

Spatial reasoning with vision-language models

published a Space about 1 month ago

Spatial-SSRL Spatial Reasoning

🌍

Spatial reasoning with vision-language models

updated a Space about 1 month ago

Spatial-SSRL Spatial Reasoning

🌍

Spatial reasoning with vision-language models

New activity in internlm/Spatial-SSRL-81k about 1 month ago

Upload task4.png

#3 opened about 1 month ago by

baliyebang

updated a dataset about 1 month ago

internlm/Spatial-SSRL-81k

Preview • Updated 14 days ago • 702 • 4

Yuhang Zang PRO

AI & ML interests

Recent Activity

Organizations

yuhangzang's activity

[FEEDBACK] Daily Papers

Improve dataset card: Add task categories, language, tags, paper links, sample usage, and citation

Spatial-SSRL Spatial Reasoning

Spatial-SSRL Spatial Reasoning

Spatial-SSRL Spatial Reasoning

Upload task4.png