5 5 8

hankai

hankaixyz

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

Diffusion In Diffusion: Reclaiming Global Coherence in Semi-Autoregressive Diffusion

submitted a paper 1 day ago

Diffusion In Diffusion: Reclaiming Global Coherence in Semi-Autoregressive Diffusion

upvoted a paper about 1 month ago

VersatileFFN: Achieving Parameter Efficiency in LLMs via Adaptive Wide-and-Deep Reuse

View all activity

Organizations

None yet

authored a paper 1 day ago

Diffusion In Diffusion: Reclaiming Global Coherence in Semi-Autoregressive Diffusion

Paper • 2601.13599 • Published 9 days ago • 4

submitted a paper to Daily Papers 1 day ago

Diffusion In Diffusion: Reclaiming Global Coherence in Semi-Autoregressive Diffusion

Paper • 2601.13599 • Published 9 days ago • 4

upvoted a paper about 1 month ago

VersatileFFN: Achieving Parameter Efficiency in LLMs via Adaptive Wide-and-Deep Reuse

Paper • 2512.14531 • Published Dec 16, 2025 • 14

submitted a paper to Daily Papers about 1 month ago

VersatileFFN: Achieving Parameter Efficiency in LLMs via Adaptive Wide-and-Deep Reuse

Paper • 2512.14531 • Published Dec 16, 2025 • 14

authored 3 papers 2 months ago

Kangaroo: Lossless Self-Speculative Decoding via Double Early Exiting

Paper • 2404.18911 • Published Apr 29, 2024 • 30

Revealing the Power of Post-Training for Small Language Models via Knowledge Distillation

Paper • 2509.26497 • Published Sep 30, 2025

ROOT: Robust Orthogonalized Optimizer for Neural Network Training

Paper • 2511.20626 • Published Nov 25, 2025 • 43

upvoted a paper 2 months ago

ROOT: Robust Orthogonalized Optimizer for Neural Network Training

Paper • 2511.20626 • Published Nov 25, 2025 • 43

commented a paper 2 months ago

ROOT: Robust Orthogonalized Optimizer for Neural Network Training

Paper • 2511.20626 • Published Nov 25, 2025 • 43 •

liked a model 3 months ago

Lpzhan/openPangu-embedded-gguf

1B • Updated Nov 6, 2025 • 16 • 2

New activity in facebook/MobileLLM-Pro 3 months ago

Seems lagging behind Pangu-1B

🔥 👀 5

#4 opened 3 months ago by

hankaixyz

upvoted a paper 5 months ago

Benchmarking Optimizers for Large Language Model Pretraining

Paper • 2509.01440 • Published Sep 1, 2025 • 25

liked 3 models 5 months ago

liked a model 6 months ago

PIKA665/openPangu-Embedded-1B

1B • Updated Aug 4, 2025 • 1 • 1

liked a model 7 months ago

IntervitensInc/pangu-pro-moe-model

Text Generation • 72B • Updated Jul 9, 2025 • 129 • 45

upvoted a paper over 1 year ago

Kangaroo: Lossless Self-Speculative Decoding via Double Early Exiting

Paper • 2404.18911 • Published Apr 29, 2024 • 30

upvoted a paper almost 2 years ago

DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models

Paper • 2403.00818 • Published Feb 26, 2024 • 19

liked a model almost 2 years ago

jamesHD2001/DenseMamba-1.3B

Updated Apr 11, 2024 • 2 • 1

hankai

AI & ML interests

Recent Activity

Organizations

hankaixyz's activity

Seems lagging behind Pangu-1B