Spaces:

LucanDerLurch
/

Wan2.2-mini

Running

App Files Files Community

LucanDerLurch commited on 12 days ago

Commit

1e8df5f

verified ·

1 Parent(s): f82f9b6

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -21

app.py CHANGED Viewed

@@ -6,7 +6,8 @@ import gc
 import traceback
 MODEL_ID = "ali-vilab/i2vgen-xl"
-LORA_ID = "latent-consistency/lcm-lora-sdxl" # Die Turbo-Impfung
 pipe = None
@@ -16,6 +17,7 @@ def load_model_safely():
         return pipe, "Modell bereits geladen."
     log = "Lade Modell...\n"
     try:
         # 1. Basis Modell laden
@@ -25,20 +27,23 @@ def load_model_safely():
             variant="fp16"
         )
-        # 2. TURBO (LCM) LADEN
-        log += "💉 Injiziere LCM Turbo LoRA...\n"
         try:
-            # Wir laden den Adapter. Das braucht etwas RAM!
-            pipe.load_lora_weights(LORA_ID, adapter_name="lcm")
-            pipe.fuse_lora() # Verschmilzt LoRA mit Modell für Speed
-            # WICHTIG: Scheduler auf LCM ändern
             pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
-            log += "✅ Turbo aktiviert (LCM Scheduler & LoRA geladen).\n"
         except Exception as e:
-            log += f"⚠️ Turbo fehlgeschlagen (RAM voll?): {e}\nWir machen langsam weiter.\n"
-        # 3. Speicher Optimierung
         try:
             pipe.enable_model_cpu_offload()
             log += "✅ Model Offloading aktiv.\n"
@@ -47,7 +52,7 @@ def load_model_safely():
                 pipe.enable_sequential_cpu_offload()
                 log += "✅ Sequential Offloading aktiv.\n"
             except:
-                log += "❌ RAM WARNUNG: Kein Offloading möglich.\n"
         pipe.enable_vae_slicing()
         pipe.enable_vae_tiling()
@@ -55,7 +60,7 @@ def load_model_safely():
         return pipe, log
     except Exception as e:
-        return None, f"Absturz beim Laden: {e}"
 def generate_video(image_in, prompt, negative_prompt):
     global pipe
@@ -75,12 +80,16 @@ def generate_video(image_in, prompt, negative_prompt):
     gc.collect()
     try:
-        # TURBO SETUP:
-        target_size = 448 # Wir hoffen, dass 448 mit LoRA noch passt
-        steps = 6         # LCM braucht nur 4-8 Steps!
-        guidance = 1.5    # LCM braucht niedrigen Guidance Scale (1.0 - 2.0)
-        log_messages += f"Generiere Turbo-Video (Nur {steps} Steps!)...\n"
         image_in = image_in.resize((target_size, target_size))
@@ -92,7 +101,7 @@ def generate_video(image_in, prompt, negative_prompt):
             negative_prompt=negative_prompt,
             num_frames=16,
             num_inference_steps=steps,
-            guidance_scale=guidance,
             height=target_size,
             width=target_size,
             generator=generator
@@ -108,15 +117,15 @@ def generate_video(image_in, prompt, negative_prompt):
         return None, log_messages + f"\n❌ Fehler: {e}"
 with gr.Blocks() as demo:
-    gr.Markdown("# I2VGen-XL ⚡ TURBO (LCM)")
-    gr.Markdown("Mit LCM LoRA: Nur 6 Steps nötig! (Hoffen wir, dass der RAM reicht)")
     with gr.Row():
         with gr.Column():
             img = gr.Image(type="pil", label="Bild")
             txt = gr.Textbox(label="Prompt", value="clouds moving, cinematic")
             neg = gr.Textbox(value="distortion, blurry", label="Negative")
-            btn = gr.Button("Turbo Start (6 Steps)")
     with gr.Row():
         vid = gr.Video(label="Video")

 import traceback
 MODEL_ID = "ali-vilab/i2vgen-xl"
+# Das ist der Turbo-Booster für SDXL-basierte Modelle (wie I2VGen-XL)
+LORA_ID = "latent-consistency/lcm-lora-sdxl"
 pipe = None
         return pipe, "Modell bereits geladen."
     log = "Lade Modell...\n"
+    print("Starte Ladevorgang...")
     try:
         # 1. Basis Modell laden
             variant="fp16"
         )
+        # 2. LCM TURBO ZÜNDEN
+        log += "🚀 Lade LCM LoRA...\n"
         try:
+            # LoRA laden
+            pipe.load_lora_weights(LORA_ID)
+            # WICHTIG: fuse_lora() verschmilzt die Gewichte.
+            # Das verhindert, dass wir doppelten RAM für Modell + LoRA brauchen.
+            pipe.fuse_lora()
+            # Scheduler austauschen gegen LCM
             pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
+            log += "✅ LCM Turbo aktiviert! (Steps reduziert auf 4-8)\n"
         except Exception as e:
+            log += f"⚠️ LoRA Fehler: {e}\nEs geht ohne Turbo weiter (langsam).\n"
+        # 3. Speicher-Optimierung
         try:
             pipe.enable_model_cpu_offload()
             log += "✅ Model Offloading aktiv.\n"
                 pipe.enable_sequential_cpu_offload()
                 log += "✅ Sequential Offloading aktiv.\n"
             except:
+                log += "❌ RAM Warnung: Kein Offloading.\n"
         pipe.enable_vae_slicing()
         pipe.enable_vae_tiling()
         return pipe, log
     except Exception as e:
+        return None, f"Absturz beim Laden: {e}\n{traceback.format_exc()}"
 def generate_video(image_in, prompt, negative_prompt):
     global pipe
     gc.collect()
     try:
+        # LCM EINSTELLUNGEN
+        # Steps: 6 (statt 20-50)
+        # Guidance: 1.5 (LCM braucht sehr niedrige Werte, sonst Bildmatsch)
+        steps = 6
+        guidance = 1.5
+        # Auflösung: Wir bleiben bei 448px für Stabilität
+        target_size = 448
+        log_messages += f"Generiere mit {steps} Steps (Turbo Modus)...\n"
         image_in = image_in.resize((target_size, target_size))
             negative_prompt=negative_prompt,
             num_frames=16,
             num_inference_steps=steps,
+            guidance_scale=guidance, # WICHTIG: Niedrig halten bei LCM!
             height=target_size,
             width=target_size,
             generator=generator
         return None, log_messages + f"\n❌ Fehler: {e}"
 with gr.Blocks() as demo:
+    gr.Markdown("# I2VGen-XL ⚡ LCM TURBO")
+    gr.Markdown("Nutzt LCM LoRA für extreme Geschwindigkeit (6 Steps).")
     with gr.Row():
         with gr.Column():
             img = gr.Image(type="pil", label="Bild")
             txt = gr.Textbox(label="Prompt", value="clouds moving, cinematic")
             neg = gr.Textbox(value="distortion, blurry", label="Negative")
+            btn = gr.Button("Turbo Start (ca. 2-3 Min)")
     with gr.Row():
         vid = gr.Video(label="Video")