Audio - a Ryukijano Collection

Ryukijano 's Collections

STEM

Vision_transformer_robotics

VILA

Diffusion models

Neural Rendering

Deep Reinforcement Learning

LLMs

Computer vision

Audio

Multi modal foundational models

Text_to_video diffusion

Vision_language_models

Text-3D

2D->3D

Audio

updated Nov 13, 2024

EVA-GAN: Enhanced Various Audio Generation via Scalable Generative Adversarial Networks

Paper • 2402.00892 • Published Jan 31, 2024 • 14
Running on Zero

Featured

279

MusicGen Streaming

🔥

279

Generate music from text prompts
Runtime error

145

Whisper JAX

👀

145

Transcribe or translate audio from microphone, file, or YouTube
Audio Mamba: Bidirectional State Space Model for Audio Representation Learning

Paper • 2406.03344 • Published Jun 5, 2024 • 22
gpt-omni/mini-omni

Text-to-Speech • Updated Sep 4, 2024 • 1 • 435
nyuuzyou/suno

Preview • Updated Nov 20, 2024 • 98 • 72
Running on Zero

Featured

103

Giant Music Transformer

🦖

103

Fast multi-instrumental music transformer