Spaces:

DataQuests
/

DeepCritical

Running

App Files Files Community

DeepCritical / docs /bugs /005_services_not_integrated.md

VibecoderMcSwaggins

fix: wire EmbeddingService to simple orchestrator + improve search quality

2e4a760 17 days ago

preview code

raw

history blame

5.15 kB

Bug 005: Embedding Services Built But Not Wired to Default Orchestrator

Date: November 26, 2025 Severity: CRITICAL Status: Open

1. The Problem

Two complete semantic search services exist but are NOT USED by the default orchestrator:

Service	Location	Status
EmbeddingService	`src/services/embeddings.py`	BUILT, not wired to simple mode
LlamaIndexRAGService	`src/services/llamaindex_rag.py`	BUILT, not wired to simple mode

2. Root Cause: Two Orchestrators

┌─────────────────────────────────────────────────────────────────┐
│ orchestrator.py (SIMPLE MODE - DEFAULT)                         │
│ - Basic search → judge → loop                                   │
│ - NO embeddings                                                 │
│ - NO semantic search                                            │
│ - Hand-rolled keyword matching                                  │
└─────────────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────────┐
│ orchestrator_magentic.py (MAGENTIC MODE)                        │
│ - Multi-agent architecture                                      │
│ - USES EmbeddingService                                         │
│ - USES semantic search                                          │
│ - Requires agent-framework (optional dep)                       │
│ - OpenAI only                                                   │
└─────────────────────────────────────────────────────────────────┘

The UI defaults to simple mode, which bypasses all the semantic search infrastructure.

3. What's Built (Not Wired)

EmbeddingService (NO API KEY NEEDED)

# src/services/embeddings.py
class EmbeddingService:
    async def embed(text) -> list[float]
    async def search_similar(query) -> list[dict]  # SEMANTIC SEARCH
    async def deduplicate(evidence) -> list        # DEDUPLICATION

Uses local sentence-transformers
ChromaDB vector store
Works without API keys

LlamaIndexRAGService

# src/services/llamaindex_rag.py
class LlamaIndexRAGService:
    def ingest_evidence(evidence_list)
    def retrieve(query) -> list[dict]  # Semantic retrieval
    def query(query_str) -> str        # Synthesized response

4. Where Services ARE Used

src/orchestrator_magentic.py    ← Uses EmbeddingService
src/agents/search_agent.py      ← Uses EmbeddingService
src/agents/report_agent.py      ← Uses EmbeddingService
src/agents/hypothesis_agent.py  ← Uses EmbeddingService
src/agents/analysis_agent.py    ← Uses EmbeddingService

All in magentic mode agents, NOT in simple orchestrator.

5. The Fix Options

Option A: Add Embeddings to Simple Orchestrator (RECOMMENDED)

Modify src/orchestrator.py to optionally use EmbeddingService:

class Orchestrator:
    def __init__(self, ..., use_embeddings: bool = True):
        if use_embeddings:
            from src.services.embeddings import get_embedding_service
            self.embeddings = get_embedding_service()
        else:
            self.embeddings = None

    async def run(self, query):
        # ... search phase ...

        if self.embeddings:
            # Semantic ranking
            all_evidence = await self._rank_by_relevance(all_evidence, query)
            # Deduplication
            all_evidence = await self.embeddings.deduplicate(all_evidence)

Option B: Make Magentic Mode Default

Change app.py to default to "magentic" mode when deps available.

Option C: Merge Best of Both

Create a new orchestrator that:

Has the simplicity of simple mode
Uses embeddings for ranking/dedup
Doesn't require agent-framework

6. Implementation Plan

Phase 1: Wire EmbeddingService to Simple Orchestrator

Import EmbeddingService in orchestrator.py
Add semantic ranking after search
Add deduplication before judge
Test end-to-end

Phase 2: Add Relevance to Evidence

Use embedding similarity as relevance score
Sort evidence by relevance
Only send top-K to judge

7. Files to Modify

src/orchestrator.py           ← Add embedding integration
src/orchestrator_factory.py   ← Pass embeddings flag
src/app.py                    ← Enable embeddings by default

8. Success Criteria

Default mode uses semantic search
Evidence ranked by relevance
Duplicates removed
No new API keys required (sentence-transformers is local)
Magentic mode still works as before