Spaces:

davidtran999
/

hue-portal-backend-v2

Running

App Files Files Community

hue-portal-backend-v2 / backend /FIX_LOCAL_LLM_ISSUE.md

davidtran999

Push full code from hue-portal-backend folder

519b145 7 days ago

preview code

raw

history blame contribute delete

3.02 kB

Fix: Server đang dùng Local LLM thay vì API Mode

Vấn đề

Khi test chat trên web, server đang chạy local LLM trên máy thay vì gọi HF Spaces API.

Nguyên nhân

Global instance cache: get_llm_generator() sử dụng global instance _llm_generator chỉ tạo một lần
Server start với env cũ: Nếu server start với LLM_PROVIDER=local, instance sẽ giữ provider=local
Không reload khi env thay đổi: Khi .env được update, server không tự động reload instance

Đã sửa

File: `backend/hue_portal/chatbot/llm_integration.py`

Trước:

_llm_generator: Optional[LLMGenerator] = None

def get_llm_generator() -> Optional[LLMGenerator]:
    global _llm_generator
    if _llm_generator is None:
        _llm_generator = LLMGenerator()
    return _llm_generator if _llm_generator.is_available() else None

Sau:

_llm_generator: Optional[LLMGenerator] = None
_last_provider: Optional[str] = None

def get_llm_generator() -> Optional[LLMGenerator]:
    """Get or create LLM generator instance.
    
    Recreates instance if provider changed (e.g., from local to api).
    """
    global _llm_generator, _last_provider
    
    # Get current provider from env
    current_provider = os.environ.get("LLM_PROVIDER", LLM_PROVIDER_NONE).lower()
    
    # Recreate if provider changed or instance doesn't exist
    if _llm_generator is None or _last_provider != current_provider:
        _llm_generator = LLMGenerator()
        _last_provider = current_provider
        print(f"[LLM] 🔄 Recreated LLM generator with provider: {current_provider}", flush=True)
    
    return _llm_generator if _llm_generator.is_available() else None

Cách test

Đảm bảo .env có đúng config:

cd backend
cat .env | grep LLM
# Should show:
# LLM_PROVIDER=api
# HF_API_BASE_URL=https://davidtran999-hue-portal-backend.hf.space/api

Restart server:

pkill -f "manage.py runserver"
cd backend && source venv/bin/activate && cd hue_portal
python3 manage.py runserver 0.0.0.0:8000

Test trong web UI:

Mở http://localhost:3000/chat
Gửi câu hỏi: "Mức phạt vượt đèn đỏ là bao nhiêu?"
Xem server logs để thấy:
- [LLM] 🔄 Recreated LLM generator with provider: api
- [RAG] Using LLM provider: api
- [LLM] 🔗 Calling API: https://davidtran999-hue-portal-backend.hf.space/api/chatbot/chat/

Kiểm tra response:

Response phải từ HF Spaces API (có văn bản tự nhiên, không phải template)
KHÔNG thấy logs về local model loading

Lưu ý

Server sẽ tự động recreate LLM instance khi provider thay đổi
Không cần restart server khi thay đổi .env (nhưng nên restart để đảm bảo)
Nếu vẫn dùng local LLM, kiểm tra:
- .env có LLM_PROVIDER=api không
- Server có load đúng .env không
- Xem server logs để biết provider nào đang được dùng