Problemes connus
Chatbotaurus, comme tout systeme complexe, peut rencontrer des problemes occasionnels. Ce guide fournit des solutions pour les cas les plus courants.
Ouvrez une issue sur notre depot Forgejo ou contactez-nous a contact@chatbotaurus.com.
Infrastructure Podman
Conteneur qui ne demarre pas
Si un conteneur refuse de demarrer apres podman run ou podman start :
- Verifiez les logs du conteneur :
sudo podman logs chatbotaurus-<service> - Verifiez que le reseau existe :
sudo podman network ls | grep chatbotaurus-network
sudo podman network ls | grep mgaas-network - Si le reseau manque, recreez-le :
sudo podman network create chatbotaurus-network --subnet 172.28.0.0/16
sudo podman network create mgaas-network --subnet 172.29.0.0/16
Conflit de port
Si un port est deja utilise :
netstat -ano | grep PORT_NUMBER
Sur Windows, si wslrelay.exe occupe le port :
wsl --shutdown
Ports courants a verifier : 5432 (PostgreSQL), 6333 (Qdrant), 6379 (Valkey), 11434 (Ollama), 8180 (Keycloak), 8200 (Vault).
Resolution DNS entre conteneurs (aardvark-dns)
Si les conteneurs ne se resolvent pas entre eux par nom :
- Verifiez que
aardvark-dnsest installe :which aardvark-dns - Redemarrez le reseau Podman :
sudo podman network reload --all - En dernier recours, recreez les conteneurs (les volumes sont preserves).
Volumes et persistance des donnees
Si des donnees sont perdues apres un redemarrage de conteneur :
- Verifiez que les volumes sont correctement montes :
sudo podman inspect chatbotaurus-<service> | grep -A5 "Mounts" - Assurez-vous d'utiliser des volumes nommes plutot que des bind mounts temporaires.
Ollama et modeles IA
Ollama Out of Memory (OOM)
Le modele qwen3:8b necessite environ 8 Go de RAM. Si Ollama est tue par le kernel (OOM killer) :
- Verifiez la memoire disponible :
free -h - Verifiez les limites du conteneur :
sudo podman inspect chatbotaurus-ollama | grep -i memory - Solutions :
- Augmentez la limite memoire du conteneur Ollama a 16 Gi minimum
- Reduisez le nombre de modeles charges simultanement
- Utilisez
tomng/nanbeige4.1:3bpour les taches legeres au lieu deqwen3:8b
Modele non trouve
Si Ollama retourne une erreur "model not found" :
# Listez les modeles disponibles
sudo podman exec chatbotaurus-ollama ollama list
# Telechargez le modele manquant
sudo podman exec chatbotaurus-ollama ollama pull qwen3:8b
sudo podman exec chatbotaurus-ollama ollama pull tomng/nanbeige4.1:3b
sudo podman exec chatbotaurus-ollama ollama pull qwen3-embedding:0.6b
Latence elevee des reponses
Si les reponses du LLM sont lentes (> 8s pour une requete complexe) :
- Verifiez l'utilisation CPU
- Verifiez qu'un seul modele est charge en memoire (le swap entre modeles est couteux)
- Activez la degradation gracieuse si necessaire (voir architecture PODIUM, 5 niveaux)
Vault (Gestion des secrets)
Vault re-sealed
Vault peut se re-sceller automatiquement apres un redemarrage. Symptome : erreur 503 "Vault is sealed".
- Verifiez le statut :
sudo podman exec chatbotaurus-vault vault status - Descellement (unseal) avec les cles :
sudo podman exec chatbotaurus-vault vault operator unseal <UNSEAL_KEY_1>
sudo podman exec chatbotaurus-vault vault operator unseal <UNSEAL_KEY_2>
sudo podman exec chatbotaurus-vault vault operator unseal <UNSEAL_KEY_3>
Les cles de descellement doivent etre stockees de maniere securisee et separee. Ne les commitez jamais dans le depot.
Secrets non injectes dans les conteneurs
Si un conteneur MCP deploye ne recoit pas ses secrets :
- Verifiez que le chemin Vault est correct :
secret/data/mcp-servers/{serverId} - Verifiez les permissions du token Vault utilise par le
SecretsManager - Consultez les logs du service de deploiement
MCP Gateway
Erreur de session Streamable HTTP
Si vous recevez une erreur 404 ou "session not found" :
- Verifiez que le header
Mcp-Session-Idest present dans la requete - Les sessions expirent apres 30 minutes d'inactivite (TTL configurable)
- Reinitialisez la session avec une requete
initializesurPOST /api/v1/mcp
Erreur JSON-RPC batch
Le batching est limite a 50 requetes par batch. Si vous depassez cette limite :
Erreur: "Batch size exceeds maximum of 50 requests"
Decoupez vos requetes en lots de 50 maximum.
Connecteur MCP qui echoue
Si un connecteur (Odoo, n8n, etc.) ne repond pas :
- Verifiez la connectivite reseau vers le service cible :
curl -s http://<service-host>:<port>/health - En mode demo (VPS2), la latence doit etre < 5ms
- En mode production (infra client), la latence peut atteindre 200ms - verifiez les timeouts
- Verifiez les credentials dans Vault
Base de donnees
PostgreSQL connexion refusee
Error: connect ECONNREFUSED 127.0.0.1:5432
- Verifiez que le conteneur tourne :
sudo podman ps | grep chatbotaurus-postgres - Verifiez les logs :
sudo podman logs chatbotaurus-postgres - Verifiez que le port 5432 n'est pas utilise par une autre instance PostgreSQL locale
Qdrant index corrompu
Si Qdrant retourne des erreurs de lecture :
- Verifiez les logs :
sudo podman logs chatbotaurus-qdrant - En dernier recours, recreez la collection (les embeddings devront etre regeneres) :
curl -X DELETE http://localhost:6333/collections/<collection_name>
Frontend (Next.js)
Erreur de build Next.js
cd packages/new-ui
pnpm build
Si le build echoue :
- Nettoyez le cache :
rm -rf .next - Reinstallez les dependances :
pnpm install - Verifiez les erreurs TypeScript :
pnpm tsc --noEmit
Variables d'environnement manquantes
Si le frontend ne se connecte pas au backend :
- Verifiez
.envou.env.localdanspackages/new-ui/ - Les variables Next.js publiques doivent commencer par
NEXT_PUBLIC_ - Redemarrez le serveur de dev apres modification des variables d'environnement
Keycloak (Authentification)
Impossible de se connecter
- Verifiez que Keycloak est accessible :
http://localhost:8180 - Verifiez les logs :
sudo podman logs chatbotaurus-keycloak - Verifiez la configuration du realm et du client dans la console d'administration
Performance et monitoring
Metriques a surveiller
| Metrique | Seuil d'alerte | Action |
|---|---|---|
| RAM totale VPS1 | > 24 Go | Reduire les limites conteneurs |
| CPU VPS1 | > 85% | Activer degradation gracieuse |
| Latence tool calling | > 8s | Verifier cache, reseau |
| Cache hit rate | < 80% | Verifier configuration Valkey |
Besoin d'aide supplementaire ?
Si votre probleme n'est pas couvert ici :
- Ouvrez une issue sur Forgejo
- Contactez-nous : support@chatbotaurus.com
- Consultez les diagnostics integres pour generer un rapport technique