Spaces:

Arif-Badhon
/

llm-data-analyzer

Running

App Files Files Community

Arif commited on 3 days ago

Commit

697bc47

1 Parent(s): 5ca944e

Updating docker model runner

Browse files

Files changed (2) hide show

backend/app/services/llm_service.py +6 -5
docker-compose.yml +2 -0

backend/app/services/llm_service.py CHANGED Viewed

@@ -135,7 +135,7 @@ class LLMServiceMLX(BaseLLMService):
 class LLMServiceDockerModelRunner(BaseLLMService):
-    """Docker Model Runner implementation"""
     def __init__(self, model_name: str, max_tokens: int, temperature: float, docker_url: str, timeout: int = 300):
         super().__init__(model_name, max_tokens, temperature)
@@ -152,7 +152,7 @@ class LLMServiceDockerModelRunner(BaseLLMService):
             self.logger.info(f"🔄 Connecting to Docker Model Runner: {self.docker_url}")
             self.client = httpx.AsyncClient(timeout=self.timeout)
-            # Correct endpoint: /models (not /api/tags)
             response = await self.client.get(f"{self.docker_url}/models")
             if response.status_code == 200:
@@ -173,13 +173,13 @@ class LLMServiceDockerModelRunner(BaseLLMService):
         try:
             payload = {
-                "model": self.model_name,
                 "messages": [{"role": "user", "content": prompt}],
                 "temperature": self.temperature,
                 "max_tokens": self.max_tokens,
             }
-            # Correct endpoint: /chat/completions
             response = await self.client.post(
                 f"{self.docker_url}/chat/completions",
                 json=payload
@@ -187,7 +187,7 @@ class LLMServiceDockerModelRunner(BaseLLMService):
             if response.status_code == 200:
                 result = response.json()
-                return result["choices"]["message"]["content"]
             else:
                 self.logger.error(f"❌ Docker Model Runner error: {response.status_code} - {response.text}")
                 raise RuntimeError(f"Model Runner error: {response.status_code}")
@@ -204,6 +204,7 @@ class LLMServiceDockerModelRunner(BaseLLMService):
 class LLMServiceMock(BaseLLMService):
     """Mock implementation as fallback"""

 class LLMServiceDockerModelRunner(BaseLLMService):
+    """Docker Model Runner implementation - OpenAI-compatible API"""
     def __init__(self, model_name: str, max_tokens: int, temperature: float, docker_url: str, timeout: int = 300):
         super().__init__(model_name, max_tokens, temperature)
             self.logger.info(f"🔄 Connecting to Docker Model Runner: {self.docker_url}")
             self.client = httpx.AsyncClient(timeout=self.timeout)
+            # OpenAI-compatible endpoint: GET /v1/models
             response = await self.client.get(f"{self.docker_url}/models")
             if response.status_code == 200:
         try:
             payload = {
+                "model": self.model_name,  # "ai/llama3.2:1B-Q4_0"
                 "messages": [{"role": "user", "content": prompt}],
                 "temperature": self.temperature,
                 "max_tokens": self.max_tokens,
             }
+            # OpenAI-compatible endpoint: POST /v1/chat/completions
             response = await self.client.post(
                 f"{self.docker_url}/chat/completions",
                 json=payload
             if response.status_code == 200:
                 result = response.json()
+                return result["choices"][0]["message"]["content"]
             else:
                 self.logger.error(f"❌ Docker Model Runner error: {response.status_code} - {response.text}")
                 raise RuntimeError(f"Model Runner error: {response.status_code}")
 class LLMServiceMock(BaseLLMService):
     """Mock implementation as fallback"""

docker-compose.yml CHANGED Viewed

@@ -14,6 +14,8 @@ services:
     networks:
       - llm-network
     hostname: backend
   frontend:
     build:

     networks:
       - llm-network
     hostname: backend
+    extra_hosts:
+      - "model-runner.docker.internal:host-gateway"
   frontend:
     build: