Yu li's picture

Yu li

Yukkkop

·

AI & ML interests

None yet

Recent Activity

liked a model about 4 hours ago

nvidia/Nemotron-Cascade-2-30B-A3B

liked a Space about 8 hours ago

remyxai/remyx-explorer

liked a model about 8 hours ago

Danrisi/Samsung_Qwen2512

View all activity

Organizations

None yet

upvoted a collection about 23 hours ago

✨ free demo spaces

HF Spaces for demoing chat completion models—no ZeroGPU, WebGPU, or BYOK included. Thank you so much to these devs! • 15 items • Updated 21 days ago • 3

upvoted 3 papers about 24 hours ago

Horizon-LM: A RAM-Centric Architecture for LLM Training

Paper • 2602.04816 • Published Feb 4 • 18

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

Paper • 2602.10388 • Published Feb 11 • 244

UniWeTok: An Unified Binary Tokenizer with Codebook Size 2^{128} for Unified Multimodal Large Language Model

Paper • 2602.14178 • Published Feb 15 • 14

upvoted a paper 19 days ago

STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published Jan 14 • 195

upvoted a paper 24 days ago

tttLRM: Test-Time Training for Long Context and Autoregressive 3D Reconstruction

Paper • 2602.20160 • Published 27 days ago • 10

upvoted a paper 26 days ago

Llama-3.1-FoundationAI-SecurityLLM-Reasoning-8B Technical Report

Paper • 2601.21051 • Published Jan 28 • 14

upvoted a collection 29 days ago

Creative Writing Datasets

High-quality creative writing and storytelling data. • 36 items • Updated about 16 hours ago • 6

upvoted 2 papers 29 days ago

RynnBrain: Open Embodied Foundation Models

Paper • 2602.14979 • Published Feb 13 • 43

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Paper • 2602.13515 • Published Feb 13 • 44

upvoted 2 collections about 1 month ago

2026 February 🏮 - China Open Source Highlights

30 items • Updated 11 days ago • 11

2026 January⛄️ - China Open Source Highlights

38 items • Updated Feb 3 • 6

upvoted 8 papers about 1 month ago

DiffusionRenderer: Neural Inverse and Forward Rendering with Video Diffusion Models

Paper • 2501.18590 • Published Jan 30, 2025 • 1

REAP the Experts: Why Pruning Prevails for One-Shot MoE compression

Paper • 2510.13999 • Published Oct 15, 2025 • 15

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

Paper • 2602.08676 • Published Feb 9 • 70

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

Paper • 2602.05027 • Published Feb 4 • 62

DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation

Paper • 2601.22904 • Published Jan 30 • 15

PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Paper • 2602.02493 • Published Feb 2 • 46

Beyond Output Critique: Self-Correction via Task Distillation

Paper • 2602.00871 • Published Jan 31 • 2

Self-Improving Pretraining: using post-trained models to pretrain better models

Paper • 2601.21343 • Published Jan 29 • 17