Audio Tasks - a alecccdd Collection

alecccdd 's Collections

Impressive Large Models

Vision Tasks (Watermark)

Vision Tasks (Humans)

Vision Datasets

Vision Datasets (Human)

Diffusion Tasks

Text Generation

Text Datasets (Reasoning)

Text Datasets (Grammar)

small & highly efficient

Audio Tasks

updated 12 days ago

Soul-AILab/SoulX-Podcast-1.7B

Text-to-Speech • Updated Dec 18, 2025 • 273 • 231
bosonai/higgs-audio-v2-generation-3B-base

Text-to-Speech • Updated Jul 28, 2025 • 198k • 658
Running

32

Vocal Isolator

🗣

32

Isolate vocals from audio files
nvidia/personaplex-7b-v1

Audio-to-Audio • Updated 10 days ago • 538k • 2.19k
FlashLabs/Chroma-4B

Any-to-Any • Updated 28 days ago • 6.32k • 336
Running on Zero

Featured

1.54k

Qwen3-TTS Demo

🎙

1.54k

Generate custom speech from text, voice descriptions, or samples
Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice

Text-to-Speech • Updated 27 days ago • 1.03M • 1.19k
ACE-Step/acestep-v15-base

Text-to-Audio • 2B • Updated 19 days ago • 8.19k • 50
kugelaudio/kugelaudio-0-open

Text-to-Speech • Updated 19 days ago • 93k • 165
OpenMOSS-Team/MOSS-TTS

Text-to-Speech • 8B • Updated 12 days ago • 61.4k • 322