Spaces:

MouhammadYadex
/

poubelle-v2

Configuration error

App Files Files Community

poubelle-v2 / GUIDE_VIDEO.md

MouhammadYadex

Upload 25 files

aedd96f verified 22 days ago

preview code

raw

history blame contribute delete

8.7 kB

	# 🎥 Guide de Détection Vidéo

	## ✅ Fonctionnalité Ajoutée

	Une page dédiée pour traiter les vidéos a été créée avec :
	- Upload drag & drop de vidéos (MP4, AVI, MOV)
	- Traitement frame par frame avec YOLO
	- Vidéo annotée téléchargeable
	- Statistiques complètes (FPS, durée, nombre de détections)
	- Historique des vidéos traitées

	---

	## 🚀 Comment utiliser

	### 1. Accéder à la page Vidéo

	Dans l'application web (http://localhost:3000), cliquez sur "Vidéos" dans le menu de navigation.

	### 2. Uploader une vidéo

	Option 1 - Drag & Drop:
	- Glissez-déposez votre vidéo dans la zone de dépôt

	Option 2 - Sélection:
	- Cliquez sur la zone de dépôt
	- Sélectionnez votre fichier vidéo

	Formats acceptés: MP4, AVI, MOV
	Taille maximale: 100 MB

	### 3. Lancer la détection

	1. Une fois la vidéo uploadée, une prévisualisation s'affiche
	2. Cliquez sur "Détecter sur Vidéo"
	3. Attendez le traitement (peut prendre quelques minutes selon la durée)
	4. Une barre de progression s'affiche

	### 4. Voir les résultats

	Une fois le traitement terminé, vous obtenez :

	#### 📹 Vidéo Annotée
	- Chaque frame annotée avec les bounding boxes
	- Compteur de frames
	- Player vidéo intégré

	#### 📊 Statistiques
	- Total frames: Nombre de frames traitées
	- FPS: Frames par seconde de la vidéo
	- Durée: Durée totale en secondes
	- Temps de traitement: Temps pris pour traiter la vidéo

	#### 🎯 Résumé des détections
	- Nombre total de détections
	- Répartition par classe (poubelle_pleine / poubelle_vide)
	- Nombre de frames où chaque classe apparaît

	### 5. Télécharger la vidéo annotée

	Cliquez sur "Télécharger Vidéo Annotée" pour enregistrer la vidéo avec les annotations.

	---

	## 🔧 Architecture Technique

	### Backend (API)

	Endpoint: `POST /api/predict/video`

	Traitement:
	1. Reçoit la vidéo uploadée
	2. Ouvre avec OpenCV (`cv2.VideoCapture`)
	3. Pour chaque frame :
	- Exécute YOLO inference
	- Annote le frame avec bounding boxes
	- Ajoute compteur de frames
	- Collecte les détections
	4. Écrit vidéo annotée avec `cv2.VideoWriter`
	5. Encode en base64
	6. Retourne JSON avec vidéo + statistiques

	Code API (api.py):
	```python
	@app.post("/api/predict/video")
	async def predict_video(file: UploadFile = File(...)):
	# Traitement frame par frame
	while cap.isOpened():
	ret, frame = cap.read()
	if not ret:
	break

	# Inférence YOLO sur frame
	results = model.predict(source=frame, conf=0.25, device='cpu')
	annotated_frame = results[0].plot()

	# Écrire frame annoté
	out.write(annotated_frame)

	# Retourner vidéo encodée + stats
	return {
	"video_base64": video_base64,
	"stats": {...},
	"detections": [...]
	}
	```

	### Frontend (React)

	Composant: `VideoPage.jsx`

	Fonctionnalités:
	- React Dropzone pour upload
	- Axios pour requête API (timeout 5 minutes)
	- Barre de progression simulée
	- Décodage base64 → Blob → URL pour lecture
	- LocalStorage pour historique

	Flow:
	1. User drop vidéo → `onDrop()`
	2. Prévisualisation avec `<video>`
	3. Click "Détecter" → `handleDetect()`
	4. POST `/api/predict/video` avec FormData
	5. Affichage résultats + vidéo annotée
	6. Download via blob URL

	---

	## ⚡ Optimisations Possibles

	### 1. Traitement par lots de frames
	Au lieu de traiter frame par frame, traiter par batch de 10-30 frames :
	```python
	batch_frames = []
	for i in range(batch_size):
	ret, frame = cap.read()
	if ret:
	batch_frames.append(frame)

	# Inférence sur batch
	results = model.predict(source=batch_frames, batch=True)
	```

	### 2. Réduire la résolution
	Redimensionner les frames avant inférence :
	```python
	frame_resized = cv2.resize(frame, (640, 480))
	results = model.predict(source=frame_resized)
	```

	### 3. Sauter des frames (frame skipping)
	Ne traiter que 1 frame sur N :
	```python
	skip_frames = 2 # Traiter 1 frame sur 3
	if frame_count % skip_frames == 0:
	results = model.predict(source=frame)
	```

	### 4. GPU Acceleration
	Si disponible, utiliser GPU :
	```python
	model.to('cuda') # Au lieu de 'cpu'
	results = model.predict(source=frame, device='cuda')
	```

	### 5. Codec H.264 (plus efficace)
	Utiliser codec H.264 au lieu de mp4v :
	```python
	fourcc = cv2.VideoWriter_fourcc(*'H264') # ou 'avc1', 'x264'
	```

	### 6. WebSocket pour progression en temps réel
	Au lieu de simuler, envoyer vraie progression :
	```python
	# Backend
	from fastapi import WebSocket

	@app.websocket("/ws/video_progress")
	async def websocket_endpoint(websocket: WebSocket):
	await websocket.accept()
	# Envoyer progression pendant traitement
	await websocket.send_json({"progress": frame_count / total_frames})
	```

	### 7. Celery pour tâches asynchrones
	Pour vidéos longues, utiliser Celery :
	```python
	from celery import Celery

	celery = Celery('tasks', broker='redis://localhost:6379')

	@celery.task
	def process_video(video_path):
	# Traitement long
	pass

	# API retourne task_id
	# Frontend poll status avec GET /task/{task_id}
	```

	---

	## 📊 Performances Attendues

	### Exemple avec vidéo 30s @ 30 FPS

	Spécifications:
	- Durée: 30 secondes
	- FPS: 30
	- Total frames: 900
	- Résolution: 1920x1080

	Sans optimisation (CPU):
	- Temps par frame: ~50-100ms
	- Temps total: 45-90 secondes
	- Ratio: 1.5-3x temps réel

	Avec GPU (CUDA):
	- Temps par frame: ~10-20ms
	- Temps total: 9-18 secondes
	- Ratio: 0.3-0.6x temps réel

	Avec optimisations (skip 2 frames, résolution 640x480):
	- Frames traitées: 300
	- Temps par frame: ~30ms
	- Temps total: 9 secondes
	- Ratio: 0.3x temps réel

	---

	## 🐛 Dépannage

	### Erreur: "connect ECONNREFUSED 127.0.0.1:8000"

	Cause: API backend non démarrée

	Solution:
	```bash
	cd /home/mouhammad/Bureau/nourrou/projet-poubelle/trash_full_detection
	source .venv/bin/activate
	python api.py
	```

	### Erreur: "Request Timeout"

	Cause: Vidéo trop longue, timeout atteint (5 min)

	Solutions:
	1. Augmenter timeout dans `VideoPage.jsx` :
	```jsx
	timeout: 600000 // 10 minutes
	```

	2. Réduire durée/résolution vidéo

	3. Utiliser frame skipping

	### Erreur: "File too large"

	Cause: Vidéo > 100 MB

	Solutions:
	1. Augmenter limite dans `VideoPage.jsx` :
	```jsx
	maxSize: 200 * 1024 * 1024 // 200 MB
	```

	2. Compresser vidéo avec ffmpeg :
	```bash
	ffmpeg -i input.mp4 -vcodec h264 -crf 28 output.mp4
	```

	### Vidéo annotée ne se télécharge pas

	Cause: Erreur décodage base64

	Solution: Vérifier que le backend retourne bien `video_base64`

	Test API direct:
	```bash
	curl -X POST "http://localhost:8000/api/predict/video" \
	-F "file=@test.mp4" \
	-o result.json

	# Extraire vidéo
	jq -r '.video_base64' result.json \| base64 -d > output.mp4
	```

	### Vidéo noire/corrompue

	Cause: Codec incompatible

	Solutions:
	1. Changer codec dans API :
	```python
	fourcc = cv2.VideoWriter_fourcc(*'XVID') # Tester différents codecs
	```

	2. Convertir vidéo source :
	```bash
	ffmpeg -i input.mp4 -c:v libx264 -preset fast output.mp4
	```

	---

	## 📝 Exemple d'utilisation avec le notebook

	Si vous voulez tester en dehors de l'app web, utilisez le notebook 2_yolo_inference_app.ipynb :

	```python
	# Cellule : Traitement vidéo
	video_path = "chemin/vers/votre/video.mp4"
	output_path = "outputs/video/annotated_video.mp4"

	cap = cv2.VideoCapture(video_path)
	fourcc = cv2.VideoWriter_fourcc(*'mp4v')
	out = cv2.VideoWriter(output_path, fourcc, 30, (width, height))

	while cap.isOpened():
	ret, frame = cap.read()
	if not ret:
	break

	results = model_detect.predict(source=frame, conf=0.25, device='cpu')
	annotated = results[0].plot()
	out.write(annotated)

	cap.release()
	out.release()
	print(f"Vidéo sauvegardée: {output_path}")
	```

	---

	## 🎯 Résumé

	Vous pouvez maintenant :
	✅ Uploader des vidéos (MP4, AVI, MOV)
	✅ Traiter frame par frame avec YOLO
	✅ Voir vidéo annotée avec détections
	✅ Télécharger la vidéo annotée
	✅ Consulter statistiques détaillées
	✅ Historique des vidéos traitées

	Endpoints API disponibles :
	- `POST /api/predict/image` → Images
	- `POST /api/predict/video` → Vidéos ✨ NOUVEAU
	- `GET /api/health` → Status
	- `GET /api/stats` → Métriques modèle

	Navigation app :
	- `/` → Accueil
	- `/upload` → Images
	- `/video` → Vidéos ✨ NOUVEAU
	- `/history` → Historique
	- `/stats` → Statistiques
	- `/about` → À propos

	---

	Votre application est maintenant complète avec support Images ET Vidéos ! 🎥🎉