Spaces:

optimum
/

auto-benchmark

Running

App Files Files Community

IlyasMoutawwakil HF Staff commited on Sep 26, 2024

Commit

778bc8e

1 Parent(s): 063cbeb

openvino only

Browse files

Files changed (3) hide show

app.py +21 -20
benchmark.log +0 -41
requirements.txt +1 -1

app.py CHANGED Viewed

@@ -10,17 +10,17 @@ from config_store import (
     get_inference_config,
     get_openvino_config,
     get_pytorch_config,
-    get_ipex_config,
 )
 from optimum_benchmark.launchers.base import Launcher  # noqa
 from optimum_benchmark.backends.openvino.utils import TASKS_TO_OVMODEL
 from optimum_benchmark.backends.transformers_utils import TASKS_TO_MODEL_LOADERS
-from optimum_benchmark.backends.ipex.utils import TASKS_TO_IPEXMODEL
 from optimum_benchmark import (
     BenchmarkConfig,
     PyTorchConfig,
     OVConfig,
-    IPEXConfig,
     ProcessConfig,
     InferenceConfig,
     Benchmark,
@@ -31,21 +31,22 @@ from optimum_benchmark.logging_utils import setup_logging
 DEVICE = "cpu"
 LAUNCHER = "process"
 SCENARIO = "inference"
-BACKENDS = ["openvino", "pytorch", "ipex"]
 MODELS = [
     "google-bert/bert-base-uncased",
     "openai-community/gpt2",
 ]
 TASKS = (
     set(TASKS_TO_OVMODEL.keys())
-    & set(TASKS_TO_IPEXMODEL.keys())
     & set(TASKS_TO_MODEL_LOADERS.keys())
 )
 def run_benchmark(kwargs, oauth_token: gr.OAuthToken):
     if oauth_token.token is None:
-        raise gr.Error("Please login to be able to run the benchmark.")
     timestamp = time.strftime("%Y-%m-%d-%H-%M-%S")
     username = whoami(oauth_token.token)["name"]
@@ -60,7 +61,7 @@ def run_benchmark(kwargs, oauth_token: gr.OAuthToken):
         "inference": {},
         "openvino": {},
         "pytorch": {},
-        "ipex": {},
     }
     for key, value in kwargs.items():
@@ -91,17 +92,17 @@ def run_benchmark(kwargs, oauth_token: gr.OAuthToken):
         device=DEVICE,
         **configs["pytorch"],
     )
-    configs["ipex"] = IPEXConfig(
-        task=task,
-        model=model,
-        device=DEVICE,
-        **configs["ipex"],
-    )
     outputs = {
         "openvino": "Running benchmark for OpenVINO backend",
         "pytorch": "Running benchmark for PyTorch backend",
-        "ipex": "Running benchmark for IPEX backend",
     }
     yield tuple(outputs[b] for b in BACKENDS)
@@ -199,8 +200,8 @@ def build_demo():
                 openvino_config = get_openvino_config()
             with gr.Accordion(label="PyTorch Config", open=False, visible=True):
                 pytorch_config = get_pytorch_config()
-            with gr.Accordion(label="IPEX Config", open=False, visible=True):
-                ipex_config = get_ipex_config()
         backends.change(
             inputs=backends,
@@ -218,8 +219,8 @@ def build_demo():
                 openvino_output = gr.Markdown()
             with gr.Accordion(label="PyTorch Output", open=True, visible=True):
                 pytorch_output = gr.Markdown()
-            with gr.Accordion(label="IPEX Output", open=True, visible=True):
-                ipex_output = gr.Markdown()
         backends.change(
             inputs=backends,
@@ -239,12 +240,12 @@ def build_demo():
                 *inference_config.values(),
                 *openvino_config.values(),
                 *pytorch_config.values(),
-                *ipex_config.values(),
             },
             outputs={
                 openvino_output,
                 pytorch_output,
-                ipex_output,
             },
             concurrency_limit=1,
         )

     get_inference_config,
     get_openvino_config,
     get_pytorch_config,
+    # get_ipex_config,
 )
 from optimum_benchmark.launchers.base import Launcher  # noqa
 from optimum_benchmark.backends.openvino.utils import TASKS_TO_OVMODEL
 from optimum_benchmark.backends.transformers_utils import TASKS_TO_MODEL_LOADERS
+# from optimum_benchmark.backends.ipex.utils import TASKS_TO_IPEXMODEL
 from optimum_benchmark import (
     BenchmarkConfig,
     PyTorchConfig,
     OVConfig,
+    # IPEXConfig,
     ProcessConfig,
     InferenceConfig,
     Benchmark,
 DEVICE = "cpu"
 LAUNCHER = "process"
 SCENARIO = "inference"
+BACKENDS = ["openvino", "pytorch"]
 MODELS = [
     "google-bert/bert-base-uncased",
     "openai-community/gpt2",
 ]
 TASKS = (
     set(TASKS_TO_OVMODEL.keys())
+    # & set(TASKS_TO_IPEXMODEL.keys())
     & set(TASKS_TO_MODEL_LOADERS.keys())
 )
 def run_benchmark(kwargs, oauth_token: gr.OAuthToken):
     if oauth_token.token is None:
+        gr.Error("Please login to be able to run the benchmark.")
+        return tuple(None for _ in BACKENDS)
     timestamp = time.strftime("%Y-%m-%d-%H-%M-%S")
     username = whoami(oauth_token.token)["name"]
         "inference": {},
         "openvino": {},
         "pytorch": {},
+        # "ipex": {},
     }
     for key, value in kwargs.items():
         device=DEVICE,
         **configs["pytorch"],
     )
+    # configs["ipex"] = IPEXConfig(
+    #     task=task,
+    #     model=model,
+    #     device=DEVICE,
+    #     **configs["ipex"],
+    # )
     outputs = {
         "openvino": "Running benchmark for OpenVINO backend",
         "pytorch": "Running benchmark for PyTorch backend",
+        # "ipex": "Running benchmark for IPEX backend",
     }
     yield tuple(outputs[b] for b in BACKENDS)
                 openvino_config = get_openvino_config()
             with gr.Accordion(label="PyTorch Config", open=False, visible=True):
                 pytorch_config = get_pytorch_config()
+            # with gr.Accordion(label="IPEX Config", open=False, visible=True):
+            #     ipex_config = get_ipex_config()
         backends.change(
             inputs=backends,
                 openvino_output = gr.Markdown()
             with gr.Accordion(label="PyTorch Output", open=True, visible=True):
                 pytorch_output = gr.Markdown()
+            # with gr.Accordion(label="IPEX Output", open=True, visible=True):
+            #     ipex_output = gr.Markdown()
         backends.change(
             inputs=backends,
                 *inference_config.values(),
                 *openvino_config.values(),
                 *pytorch_config.values(),
+                # *ipex_config.values(),
             },
             outputs={
                 openvino_output,
                 pytorch_output,
+                # ipex_output,
             },
             concurrency_limit=1,
         )

benchmark.log DELETED Viewed

@@ -1,41 +0,0 @@
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:27,439[0m][[34mpytorch[0m][[32mINFO[0m] - Allocating pytorch backend[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:27,439[0m][[34mpytorch[0m][[32mINFO[0m] - 	+ Seeding backend with 42[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:27,440[0m][[34mpytorch[0m][[32mINFO[0m] - 	+ Benchmarking a Transformers model[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,549[0m][[34minference[0m][[32mINFO[0m] - Allocating inference scenario[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,549[0m][[34minference[0m][[32mINFO[0m] - 	+ Creating input generator[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,550[0m][[34minference[0m][[32mINFO[0m] - 	+ Generating Inference inputs[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,550[0m][[34minference[0m][[32mINFO[0m] - 	+ Initializing Inference report[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,551[0m][[34minference[0m][[32mINFO[0m] - 	+ Preparing input shapes for Inference[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,551[0m][[34minference[0m][[32mINFO[0m] - 	+ Running model loading tracking[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,551[0m][[34mlatency[0m][[32mINFO[0m] - 	+ Tracking latency using CPU performance counter[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,551[0m][[34minference[0m][[32mINFO[0m] - 	+ Loading model for Inference[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,552[0m][[34mpytorch[0m][[32mINFO[0m] - 	+ Creating backend temporary directory[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,553[0m][[34mpytorch[0m][[32mINFO[0m] - 	+ Loading model with pretrained weights[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,554[0m][[34mpytorch[0m][[32mINFO[0m] - 	+ Loading Transformers model[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,881[0m][[34mpytorch[0m][[32mINFO[0m] - 	+ Enabling eval mode[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,883[0m][[34mpytorch[0m][[32mINFO[0m] - 	+ Cleaning up backend temporary directory[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,884[0m][[34minference[0m][[32mINFO[0m] - 	+ Preparing inputs for Inference[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:28,885[0m][[34minference[0m][[32mINFO[0m] - 	+ Warming up backend for Inference[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:29,252[0m][[34minference[0m][[32mINFO[0m] - 	+ Running Inference latency tracking[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:29,252[0m][[34mlatency[0m][[32mINFO[0m] - 	+ Tracking latency using CPU performance counter[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,282[0m][[34mlatency[0m][[32mINFO[0m] - 		+ load latency:[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,282[0m][[34mlatency[0m][[32mINFO[0m] - 			- count: 1[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,283[0m][[34mlatency[0m][[32mINFO[0m] - 			- total: 0.331631 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,283[0m][[34mlatency[0m][[32mINFO[0m] - 			- mean: 0.331631 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,283[0m][[34mlatency[0m][[32mINFO[0m] - 			- stdev: 0.000000 s (0.00%)[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,284[0m][[34mlatency[0m][[32mINFO[0m] - 			- p50: 0.331631 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,284[0m][[34mlatency[0m][[32mINFO[0m] - 			- p90: 0.331631 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,284[0m][[34mlatency[0m][[32mINFO[0m] - 			- p95: 0.331631 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,284[0m][[34mlatency[0m][[32mINFO[0m] - 			- p99: 0.331631 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,285[0m][[34mlatency[0m][[32mINFO[0m] - 		+ forward latency:[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,285[0m][[34mlatency[0m][[32mINFO[0m] - 			- count: 266[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,285[0m][[34mlatency[0m][[32mINFO[0m] - 			- total: 10.021863 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,285[0m][[34mlatency[0m][[32mINFO[0m] - 			- mean: 0.037676 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,286[0m][[34mlatency[0m][[32mINFO[0m] - 			- stdev: 0.008922 s (23.68%)[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,286[0m][[34mlatency[0m][[32mINFO[0m] - 			- p50: 0.035970 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,286[0m][[34mlatency[0m][[32mINFO[0m] - 			- p90: 0.043994 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,286[0m][[34mlatency[0m][[32mINFO[0m] - 			- p95: 0.046884 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,287[0m][[34mlatency[0m][[32mINFO[0m] - 			- p99: 0.073021 s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,288[0m][[34mlatency[0m][[32mINFO[0m] - 		+ forward throughput: 53.083941 samples/s[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,296[0m][[34mprocess[0m][[32mINFO[0m] - 	+ Sending report to main process[0m
-[ISOLATED-PROCESS][[36m2024-09-25 18:53:39,297[0m][[34mprocess[0m][[32mINFO[0m] - 	+ Exiting isolated process[0m

requirements.txt CHANGED Viewed

	@@ -1 +1 @@
1	- optimum-benchmark[openvino~~,onnxruntime,ipex~~]@git+https://github.com/huggingface/optimum-benchmark.git@markdown-report


1	+ optimum-benchmark[openvino]@git+https://github.com/huggingface/optimum-benchmark.git@markdown-report