Problemes connus

Chatbotaurus, comme tout systeme complexe, peut rencontrer des problemes occasionnels. Ce guide fournit des solutions pour les cas les plus courants.

Besoin d'aide pour un probleme non liste ici ?

Ouvrez une issue sur notre depot Forgejo ou contactez-nous a contact@chatbotaurus.com.

Infrastructure Podman

Conteneur qui ne demarre pas

Si un conteneur refuse de demarrer apres podman run ou podman start :

Verifiez les logs du conteneur :
```
sudo podman logs chatbotaurus-<service>
```

Verifiez que le reseau existe :

sudo podman network ls | grep chatbotaurus-network
sudo podman network ls | grep mgaas-network

Si le reseau manque, recreez-le :

sudo podman network create chatbotaurus-network --subnet 172.28.0.0/16
sudo podman network create mgaas-network --subnet 172.29.0.0/16

Conflit de port

Si un port est deja utilise :

netstat -ano | grep PORT_NUMBER

Sur Windows, si wslrelay.exe occupe le port :

wsl --shutdown

Ports courants a verifier : 5432 (PostgreSQL), 6333 (Qdrant), 6379 (Valkey), 11434 (Ollama), 8180 (Keycloak), 8200 (Vault).

Resolution DNS entre conteneurs (aardvark-dns)

Si les conteneurs ne se resolvent pas entre eux par nom :

Verifiez que aardvark-dns est installe :
```
which aardvark-dns
```
Redemarrez le reseau Podman :
```
sudo podman network reload --all
```
En dernier recours, recreez les conteneurs (les volumes sont preserves).

Volumes et persistance des donnees

Si des donnees sont perdues apres un redemarrage de conteneur :

Verifiez que les volumes sont correctement montes :

sudo podman inspect chatbotaurus-<service> | grep -A5 "Mounts"

Assurez-vous d'utiliser des volumes nommes plutot que des bind mounts temporaires.

Ollama et modeles IA

Ollama Out of Memory (OOM)

Le modele qwen3:8b necessite environ 8 Go de RAM. Si Ollama est tue par le kernel (OOM killer) :

Verifiez la memoire disponible :
```
free -h
```

Verifiez les limites du conteneur :

sudo podman inspect chatbotaurus-ollama | grep -i memory

Solutions :
- Augmentez la limite memoire du conteneur Ollama a 16 Gi minimum
- Reduisez le nombre de modeles charges simultanement
- Utilisez tomng/nanbeige4.1:3b pour les taches legeres au lieu de qwen3:8b

Modele non trouve

Si Ollama retourne une erreur "model not found" :

# Listez les modeles disponibles
sudo podman exec chatbotaurus-ollama ollama list

# Telechargez le modele manquant
sudo podman exec chatbotaurus-ollama ollama pull qwen3:8b
sudo podman exec chatbotaurus-ollama ollama pull tomng/nanbeige4.1:3b
sudo podman exec chatbotaurus-ollama ollama pull qwen3-embedding:0.6b

Latence elevee des reponses

Si les reponses du LLM sont lentes (> 8s pour une requete complexe) :

Verifiez l'utilisation CPU
Verifiez qu'un seul modele est charge en memoire (le swap entre modeles est couteux)
Activez la degradation gracieuse si necessaire (voir architecture PODIUM, 5 niveaux)

Vault (Gestion des secrets)

Vault re-sealed

Vault peut se re-sceller automatiquement apres un redemarrage. Symptome : erreur 503 "Vault is sealed".

Verifiez le statut :

sudo podman exec chatbotaurus-vault vault status

Descellement (unseal) avec les cles :

sudo podman exec chatbotaurus-vault vault operator unseal <UNSEAL_KEY_1>
sudo podman exec chatbotaurus-vault vault operator unseal <UNSEAL_KEY_2>
sudo podman exec chatbotaurus-vault vault operator unseal <UNSEAL_KEY_3>

attention

Les cles de descellement doivent etre stockees de maniere securisee et separee. Ne les commitez jamais dans le depot.

Secrets non injectes dans les conteneurs

Si un conteneur MCP deploye ne recoit pas ses secrets :

Verifiez que le chemin Vault est correct : secret/data/mcp-servers/{serverId}
Verifiez les permissions du token Vault utilise par le SecretsManager
Consultez les logs du service de deploiement

MCP Gateway

Erreur de session Streamable HTTP

Si vous recevez une erreur 404 ou "session not found" :

Verifiez que le header Mcp-Session-Id est present dans la requete
Les sessions expirent apres 30 minutes d'inactivite (TTL configurable)
Reinitialisez la session avec une requete initialize sur POST /api/v1/mcp

Erreur JSON-RPC batch

Le batching est limite a 50 requetes par batch. Si vous depassez cette limite :

Erreur: "Batch size exceeds maximum of 50 requests"

Decoupez vos requetes en lots de 50 maximum.

Connecteur MCP qui echoue

Si un connecteur (Odoo, n8n, etc.) ne repond pas :

Verifiez la connectivite reseau vers le service cible :
```
curl -s http://<service-host>:<port>/health
```
En mode demo (VPS2), la latence doit etre < 5ms
En mode production (infra client), la latence peut atteindre 200ms - verifiez les timeouts
Verifiez les credentials dans Vault

Base de donnees

PostgreSQL connexion refusee

Error: connect ECONNREFUSED 127.0.0.1:5432

Verifiez que le conteneur tourne :

sudo podman ps | grep chatbotaurus-postgres

Verifiez les logs :
```
sudo podman logs chatbotaurus-postgres
```
Verifiez que le port 5432 n'est pas utilise par une autre instance PostgreSQL locale

Qdrant index corrompu

Si Qdrant retourne des erreurs de lecture :

Verifiez les logs :
```
sudo podman logs chatbotaurus-qdrant
```
En dernier recours, recreez la collection (les embeddings devront etre regeneres) :
```
curl -X DELETE http://localhost:6333/collections/<collection_name>
```

Frontend (Next.js)

Erreur de build Next.js

cd packages/new-ui
pnpm build

Si le build echoue :

Nettoyez le cache : rm -rf .next
Reinstallez les dependances : pnpm install
Verifiez les erreurs TypeScript : pnpm tsc --noEmit

Variables d'environnement manquantes

Si le frontend ne se connecte pas au backend :

Verifiez .env ou .env.local dans packages/new-ui/
Les variables Next.js publiques doivent commencer par NEXT_PUBLIC_
Redemarrez le serveur de dev apres modification des variables d'environnement

Keycloak (Authentification)

Impossible de se connecter

Verifiez que Keycloak est accessible : http://localhost:8180
Verifiez les logs :
```
sudo podman logs chatbotaurus-keycloak
```
Verifiez la configuration du realm et du client dans la console d'administration

Performance et monitoring

Metriques a surveiller

Metrique	Seuil d'alerte	Action
RAM totale VPS1	> 24 Go	Reduire les limites conteneurs
CPU VPS1	> 85%	Activer degradation gracieuse
Latence tool calling	> 8s	Verifier cache, reseau
Cache hit rate	< 80%	Verifier configuration Valkey

Besoin d'aide supplementaire ?

Si votre probleme n'est pas couvert ici :

Ouvrez une issue sur Forgejo
Contactez-nous : support@chatbotaurus.com
Consultez les diagnostics integres pour generer un rapport technique

Infrastructure Podman​

Conteneur qui ne demarre pas​

Conflit de port​

Resolution DNS entre conteneurs (aardvark-dns)​

Volumes et persistance des donnees​

Ollama et modeles IA​

Ollama Out of Memory (OOM)​

Modele non trouve​

Latence elevee des reponses​

Vault (Gestion des secrets)​

Vault re-sealed​

Secrets non injectes dans les conteneurs​

MCP Gateway​

Erreur de session Streamable HTTP​

Erreur JSON-RPC batch​

Connecteur MCP qui echoue​

Base de donnees​

PostgreSQL connexion refusee​

Qdrant index corrompu​

Frontend (Next.js)​

Erreur de build Next.js​

Variables d'environnement manquantes​

Keycloak (Authentification)​

Impossible de se connecter​

Performance et monitoring​

Metriques a surveiller​

Besoin d'aide supplementaire ?​