7 30 33

Zhongwei Zhang

zzwustc

zzw-ustc

AI & ML interests

AIGC

Recent Activity

upvoted a paper about 7 hours ago

Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal Language Models

upvoted a paper about 11 hours ago

MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation

upvoted a paper about 14 hours ago

minWM: A Full-Stack Open-Source Framework for Real-Time Interactive Video World Models

View all activity

Organizations

upvoted a paper about 7 hours ago

Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal Language Models

Paper • 2606.03988 • Published 8 days ago • 111

upvoted a paper about 11 hours ago

MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation

Paper • 2606.09056 • Published 3 days ago • 4

upvoted a paper about 14 hours ago

minWM: A Full-Stack Open-Source Framework for Real-Time Interactive Video World Models

Paper • 2605.30263 • Published 14 days ago • 58

upvoted a paper 1 day ago

CoVEBench: Can Video Editing Models Handle Complex Instructions?

Paper • 2606.08415 • Published 4 days ago • 46

liked 2 datasets 1 day ago

NJU-LINK/CoVEBench

Viewer • Updated 1 day ago • 626 • 489 • 2

zeqixiao/worldmem_minecraft_dataset

Viewer • Updated Dec 2, 2025 • 12.8k • 8.33k • 2

liked a Space 12 days ago

VGGT-Omega Demo

🌀

3D reconstruction from images/video with VGGT-Omega

upvoted 4 papers 14 days ago

SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer

Paper • 2605.15178 • Published 28 days ago • 86

AnyFlow: Any-Step Video Diffusion Model with On-Policy Flow Map Distillation

Paper • 2605.13724 • Published 29 days ago • 101

LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation

Paper • 2605.18739 • Published 24 days ago • 113

SenseNova-U1: Unifying Multimodal Understanding and Generation with NEO-unify Architecture

Paper • 2605.12500 • Published 30 days ago • 191

authored a paper 27 days ago

Region-Constraint In-Context Generation for Instructional Video Editing

Paper • 2512.17650 • Published Dec 19, 2025 • 53

liked a model 28 days ago

nvidia/Lyra-2.0

Image-to-3D • Updated 30 days ago • 753 • 327

updated a model 28 days ago

HiDream-ai/ReCo

Updated 28 days ago • 23

updated 2 datasets 28 days ago

HiDream-ai/ReCo-Data

Viewer • Updated 28 days ago • 1.16M • 7.61k • 96

HiDream-ai/ReCo-Bench

Updated 28 days ago • 276 • 10

liked a Space about 1 month ago

HiDream O1 Image

🚀

135

Generate custom images from text prompts

liked a model about 1 month ago

HiDream-ai/HiDream-O1-Image

Image-Text-to-Image • 9B • Updated 26 days ago • 24.9k • 466

liked a dataset about 1 month ago

HiDream-ai/ReactID-Data

Updated Apr 8 • 50 • 6

liked a model 2 months ago

Skywork/Matrix-Game-3.0

Image-Text-to-Video • Updated Apr 28 • 280 • 123