Spaces:

LucanDerLurch
/

Wan2.2-mini

Sleeping

App Files Files Community

LucanDerLurch commited on 12 days ago

Commit

eff5802

verified ·

1 Parent(s): c561608

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -30

app.py CHANGED Viewed

@@ -6,7 +6,6 @@ import gc
 import traceback
 MODEL_ID = "ali-vilab/i2vgen-xl"
-# Turbo LoRA für SDXL (funktioniert mit I2VGen-XL)
 LORA_ID = "latent-consistency/lcm-lora-sdxl"
 pipe = None
@@ -14,36 +13,27 @@ pipe = None
 def load_model_safely():
     global pipe
     if pipe is not None:
-        return pipe, "Modell ist schon da."
     log = "System Start...\n"
     print("Lade Modell...")
     try:
-        # 1. Pipeline laden (Standard float32 für CPU)
         pipe = I2VGenXLPipeline.from_pretrained(
             MODEL_ID,
             torch_dtype=torch.float32,
             variant="fp16"
         )
-        # 2. LCM TURBO ZÜNDEN
         log += "🚀 Lade LCM Turbo LoRA...\n"
         try:
-            # LoRA laden
             pipe.load_lora_weights(LORA_ID)
-            # WICHTIG: fuse_lora() verschmilzt die LoRA mit dem Modell.
-            # Das spart RAM, weil wir keine separaten Gewichte halten müssen.
             pipe.fuse_lora()
-            # Scheduler auf LCM ändern (das macht es schnell)
             pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
-            log += "✅ LCM Turbo ist AKTIV! (Nutze 6 Steps)\n"
         except Exception as e:
-            log += f"⚠️ Turbo Fehler: {e}\n(Mache langsam weiter...)\n"
-        # 3. RAM sparen (Offloading)
         try:
             pipe.enable_model_cpu_offload()
             log += "✅ Model Offloading aktiv.\n"
@@ -52,7 +42,7 @@ def load_model_safely():
                 pipe.enable_sequential_cpu_offload()
                 log += "✅ Sequential Offloading aktiv.\n"
             except:
-                log += "❌ RAM WARNUNG: Kein Offloading möglich.\n"
         pipe.enable_vae_slicing()
         pipe.enable_vae_tiling()
@@ -62,14 +52,17 @@ def load_model_safely():
     except Exception as e:
         return None, f"Absturz beim Laden: {e}\n{traceback.format_exc()}"
-def generate_video(image_in, prompt, negative_prompt):
     global pipe
     log_messages = ""
     if image_in is None:
         return None, "Kein Bild!"
-    # Lade Modell erst beim Klick
     if pipe is None:
         model, msg = load_model_safely()
         log_messages += msg
@@ -81,18 +74,24 @@ def generate_video(image_in, prompt, negative_prompt):
     gc.collect()
     try:
-        # TURBO SETUP
-        steps = 6         # LCM braucht extrem wenig Steps
-        guidance = 1.2    # LCM braucht WENIG Guidance (1.0 - 1.5). Nicht höher!
-        target_size = 448 # 448px ist das Minimum für I2VGen
-        log_messages += f"Generiere mit {steps} Steps (Turbo)... Bitte warten.\n"
-        # Bild skalieren
         image_in = image_in.resize((target_size, target_size))
         generator = torch.manual_seed(42)
         output = pipe(
             prompt=prompt,
             image=image_in,
@@ -102,7 +101,8 @@ def generate_video(image_in, prompt, negative_prompt):
             guidance_scale=guidance,
             height=target_size,
             width=target_size,
-            generator=generator
         ).frames[0]
         video_path = "turbo_output.mp4"
@@ -112,21 +112,18 @@ def generate_video(image_in, prompt, negative_prompt):
         return video_path, log_messages
     except Exception as e:
-        err = str(e)
-        if "Out of memory" in err or "Killed" in err:
-            return None, log_messages + "\n❌ RAM ABSTURZ: Die LoRA war der Tropfen zu viel für die 16GB."
-        return None, log_messages + f"\n❌ Fehler: {err}"
 with gr.Blocks() as demo:
     gr.Markdown("# I2VGen-XL ⚡ LCM TURBO")
-    gr.Markdown("Nur 6 Steps statt 20. Wenn es klappt: Mega schnell. Wenn RAM voll: Absturz.")
     with gr.Row():
         with gr.Column():
             img = gr.Image(type="pil", label="Bild")
             txt = gr.Textbox(label="Prompt", value="fireworks in the sky")
             neg = gr.Textbox(value="distortion, blurry", label="Negative")
-            btn = gr.Button("Turbo Start (ca. 2 Min)")
     with gr.Row():
         vid = gr.Video(label="Video")

 import traceback
 MODEL_ID = "ali-vilab/i2vgen-xl"
 LORA_ID = "latent-consistency/lcm-lora-sdxl"
 pipe = None
 def load_model_safely():
     global pipe
     if pipe is not None:
+        return pipe, "Modell ist bereit."
     log = "System Start...\n"
     print("Lade Modell...")
     try:
         pipe = I2VGenXLPipeline.from_pretrained(
             MODEL_ID,
             torch_dtype=torch.float32,
             variant="fp16"
         )
         log += "🚀 Lade LCM Turbo LoRA...\n"
         try:
             pipe.load_lora_weights(LORA_ID)
             pipe.fuse_lora()
             pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
+            log += "✅ LCM Turbo ist AKTIV!\n"
         except Exception as e:
+            log += f"⚠️ Turbo Fehler: {e}\n"
         try:
             pipe.enable_model_cpu_offload()
             log += "✅ Model Offloading aktiv.\n"
                 pipe.enable_sequential_cpu_offload()
                 log += "✅ Sequential Offloading aktiv.\n"
             except:
+                log += "❌ RAM WARNUNG: Kein Offloading.\n"
         pipe.enable_vae_slicing()
         pipe.enable_vae_tiling()
     except Exception as e:
         return None, f"Absturz beim Laden: {e}\n{traceback.format_exc()}"
+# HIER IST DIE MAGIE: Das Argument "progress=gr.Progress()"
+def generate_video(image_in, prompt, negative_prompt, progress=gr.Progress()):
     global pipe
     log_messages = ""
     if image_in is None:
         return None, "Kein Bild!"
+    # Initialisierung des Balkens
+    progress(0, desc="Lade Modell (kann dauern)...")
     if pipe is None:
         model, msg = load_model_safely()
         log_messages += msg
     gc.collect()
     try:
+        steps = 6
+        guidance = 1.2
+        target_size = 448
+        log_messages += f"Starte Generierung ({steps} Steps)...\n"
         image_in = image_in.resize((target_size, target_size))
         generator = torch.manual_seed(42)
+        # --- DER FORTSCHRITTS-SPION ---
+        # Diese Funktion wird NACH JEDEM STEP aufgerufen
+        def callback_fn(pipe, step_index, timestep, callback_kwargs):
+            current = step_index + 1
+            # Aktualisiert den Balken oben im Bild
+            progress((current, steps), desc=f"Step {current} von {steps} fertig...")
+            return callback_kwargs
+        # ------------------------------
         output = pipe(
             prompt=prompt,
             image=image_in,
             guidance_scale=guidance,
             height=target_size,
             width=target_size,
+            generator=generator,
+            callback_on_step_end=callback_fn  # Hier binden wir den Spion ein
         ).frames[0]
         video_path = "turbo_output.mp4"
         return video_path, log_messages
     except Exception as e:
+        return None, log_messages + f"\n❌ Fehler: {e}"
 with gr.Blocks() as demo:
     gr.Markdown("# I2VGen-XL ⚡ LCM TURBO")
+    gr.Markdown("Jetzt mit Live-Fortschrittsanzeige!")
     with gr.Row():
         with gr.Column():
             img = gr.Image(type="pil", label="Bild")
             txt = gr.Textbox(label="Prompt", value="fireworks in the sky")
             neg = gr.Textbox(value="distortion, blurry", label="Negative")
+            btn = gr.Button("Turbo Start")
     with gr.Row():
         vid = gr.Video(label="Video")