paper-reading - a kiyoxi2022 Collection

kiyoxi2022 's Collections

photo-concept-bucket

paper-reading

updated about 12 hours ago

Code as Agent Harness

Paper • 2605.18747 • Published 12 days ago • 210
SenseNova-U1: Unifying Multimodal Understanding and Generation with NEO-unify Architecture

Paper • 2605.12500 • Published 18 days ago • 191
From Context to Skills: Can Language Models Learn from Context Skillfully?

Paper • 2604.27660 • Published 27 days ago • 166
PhysBrain 1.0 Technical Report

Paper • 2605.15298 • Published 16 days ago • 143
AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration

Paper • 2605.20025 • Published 11 days ago • 185
MMSkills: Towards Multimodal Skills for General Visual Agents

Paper • 2605.13527 • Published 16 days ago • 118
Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Paper • 2605.06130 • Published 23 days ago • 111
LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation

Paper • 2605.18739 • Published 12 days ago • 111
Qwen-Image-2.0 Technical Report

Paper • 2605.10730 • Published 19 days ago • 110
Enhancing Train-Free Infinite-Frame Generation for Consistent Long Videos

Paper • 2605.18233 • Published 12 days ago • 91
UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors

Paper • 2605.00658 • Published 29 days ago • 84
Lance: Unified Multimodal Modeling by Multi-Task Synergy

Paper • 2605.18678 • Published 12 days ago • 76
PiD: Fast and High-Resolution Latent Decoding with Pixel Diffusion

Paper • 2605.23902 • Published 8 days ago • 41
Qwen/Qwen-Image-Bench

Image-Text-to-Text • 27B • Updated 2 days ago • 202 • 27
CapArena: Benchmarking and Analyzing Detailed Image Captioning in the LLM Era

Paper • 2503.12329 • Published Mar 16, 2025 • 28
baidu/ERNIE-Image

Text-to-Image • Updated Apr 17 • 11.3k • • 636
GenClaw: Code-Driven Agentic Image Generation

Paper • 2605.30248 • Published 2 days ago • 26
ByteDance-Seed/Cola-DLM

Text Generation • Updated 15 days ago • 34
deepseek-ai/DeepSeek-V4-Pro

Text Generation • 862B • Updated 24 days ago • 5.84M • • 4.44k