Spaces:

Frenchizer
/

space_1

Sleeping

App Files Files Community

Frenchizer commited on Jan 11

Commit

a4ea3eb

verified ·

1 Parent(s): ce28322

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -48

app.py CHANGED Viewed

@@ -1,12 +1,3 @@
-import gradio as gr
-import onnxruntime as ort
-from transformers import AutoTokenizer
-import numpy as np
-MODEL_FILE = "./model.onnx"
-session = ort.InferenceSession(MODEL_FILE)
-tokenizer = AutoTokenizer.from_pretrained("Helsinki-NLP/opus-mt-en-fr")
 def gradio_predict(input_text):
     try:
         # Tokenize input text
@@ -17,53 +8,47 @@ def gradio_predict(input_text):
             truncation=True,
             max_length=512
         )
         # Prepare inputs
         input_ids = tokenized_input["input_ids"].astype(np.int64)
         attention_mask = tokenized_input["attention_mask"].astype(np.int64)
-        # Use a specific token ID for decoder start (for Helsinki-NLP models)
-        decoder_start_token_id = 59513  # This is the typical start token for Helsinki-NLP models
         decoder_input_ids = np.array([[decoder_start_token_id]], dtype=np.int64)
-        print("Initial shapes:")
-        print(f"input_ids shape: {input_ids.shape}")
-        print(f"attention_mask shape: {attention_mask.shape}")
-        print(f"decoder_input_ids shape: {decoder_input_ids.shape}")
-        # Run initial inference
-        outputs = session.run(
-            None,
-            {
-                "input_ids": input_ids,
-                "attention_mask": attention_mask,
-                "decoder_input_ids": decoder_input_ids
-            }
-        )
-        # Get logits and convert to token ids
-        logits = outputs[0]
-        token_ids = np.argmax(logits[0], axis=-1)
-        # Find end of sequence (using pad token since eos might also be None)
-        end_idx = np.where(token_ids == tokenizer.pad_token_id)[0]
-        if len(end_idx) > 0:
-            token_ids = token_ids[:end_idx[0]]
         # Decode the sequence
-        translated_text = tokenizer.decode(token_ids, skip_special_tokens=True)
         return translated_text
     except Exception as e:
         print(f"Detailed error: {str(e)}")
         import traceback
         print(traceback.format_exc())
         return f"Error during translation: {str(e)}"
-# Gradio interface for the web app
-gr.Interface(
-    fn=gradio_predict,
-    inputs="text",
-    outputs="text",
-    live=True
-).launch()

 def gradio_predict(input_text):
     try:
         # Tokenize input text
             truncation=True,
             max_length=512
         )
         # Prepare inputs
         input_ids = tokenized_input["input_ids"].astype(np.int64)
         attention_mask = tokenized_input["attention_mask"].astype(np.int64)
+        # Initialize decoder input with start token
+        decoder_start_token_id = tokenizer.cls_token_id or tokenizer.pad_token_id  # Use cls or pad as a fallback
         decoder_input_ids = np.array([[decoder_start_token_id]], dtype=np.int64)
+        # Iterative decoding loop
+        max_decoder_length = 512  # Adjust as needed
+        for _ in range(max_decoder_length):
+            # Perform inference
+            outputs = session.run(
+                None,
+                {
+                    "input_ids": input_ids,
+                    "attention_mask": attention_mask,
+                    "decoder_input_ids": decoder_input_ids,
+                }
+            )
+            # Get logits and predicted token
+            logits = outputs[0]
+            next_token_id = np.argmax(logits[:, -1, :], axis=-1).item()
+            # Append the predicted token to decoder input
+            decoder_input_ids = np.concatenate(
+                [decoder_input_ids, np.array([[next_token_id]], dtype=np.int64)], axis=1
+            )
+            # Stop if end-of-sequence token is generated
+            if next_token_id == tokenizer.eos_token_id:
+                break
         # Decode the sequence
+        translated_text = tokenizer.decode(decoder_input_ids[0], skip_special_tokens=True)
         return translated_text
     except Exception as e:
         print(f"Detailed error: {str(e)}")
         import traceback
         print(traceback.format_exc())
         return f"Error during translation: {str(e)}"