API-as-a-Service EU Souverain
Le probleme
Sur les 328 serveurs institutionnels EU references dans le registre Chatbotaurus, environ 320 n exposent pas d API REST publique. L EDPB, l EBA, l ESMA, la CURIA et la plupart des institutions europeennes publient leurs donnees uniquement sous forme de pages web HTML.
Les entreprises, cabinets juridiques et administrations qui ont besoin d acceder a ces donnees de maniere programmatique n ont aujourd hui aucune solution souveraine EU.
La solution : Website-to-API
Chatbotaurus propose un service de construction d APIs structurees JSON a partir de n importe quel site web institutionnel europeen. Chaque connecteur est deploye comme un service MCP dans le catalogue business, avec scan de securite, monitoring et maintenance inclus.
Architecture technique
Site institutionnel EU (ex: edpb.europa.eu)
|
v
[SearXNG] -----> Recherche ciblee (site:domain query)
|
v
[Firecrawl EU] -> Extraction profonde Markdown/JSON
|
v
[LLM local] ---> Structuration schema JSON stable
|
v
[Qdrant] ------> Stockage vectoriel (recherche semantique)
[Valkey] ------> Cache cle-valeur (reponses frequentes)
|
v
[Connecteur MCP] -> API REST JSON exposee via catalogue business
|
v
[Trivy + SBOM] -> Scan securite + provenance
[Vault] -------> Gestion secrets
[AppArmor] ----> Isolation conteneur
Flux d une requete
- Le client appelle
GET /api/v1/mcp/catalog-business/{connector-id}/search?q=droit+a+l+oubli - Le connecteur MCP verifie le cache Valkey (TTL configurable)
- Si cache miss : SearXNG recherche
site:edpb.europa.eu droit a l oubli - Firecrawl extrait le contenu complet des pages trouvees
- Le LLM local (Ollama) structure les donnees en JSON selon le schema defini
- Le resultat est stocke dans Qdrant (vectoriel) et Valkey (cache)
- Reponse JSON structuree retournee au client
Niveaux de service
| Niveau | Description | Fraicheur | Prix indicatif |
|---|---|---|---|
| Standard | Cache + recherche a la demande | Temps reel | EUR/mois/connecteur |
| Premium | Scraping periodique + alertes changements | Quotidien | EUR/mois/connecteur |
| Enterprise | Schema custom + SLA + support dedie | Configurable | Sur devis |
Composants existants reutilises
Le service repose a 100% sur l infrastructure existante de Chatbotaurus :
| Composant | Role | Localisation |
|---|---|---|
| SearXNGService | Recherche web ciblee | packages/server/src/services/search/ |
| EUAPIRegistry | Registre 328 serveurs EU | packages/server/src/services/mcp-gateway/connectors/ |
| EUAPIConnector | Connecteur avec fallback SearXNG | packages/server/src/services/mcp-gateway/connectors/ |
| CatalogBusinessService | Deploiement one-click | packages/server/src/services/mcp-gateway/ |
| ServerDeploymentService | Lifecycle Podman | packages/server/src/services/mcp-gateway/ |
| ProvenanceVerifier | Scan Trivy + SBOM | packages/server/src/services/mcp-gateway/ |
| SecretsManager | Integration Vault | packages/server/src/services/mcp-gateway/ |
| EUAPIHttpClient | Client HTTP (SSRF, cache, circuit breaker) | packages/server/src/services/mcp-gateway/connectors/ |
Avantage concurrentiel
- Zero concurrent EU : aucune plateforme europeenne ne propose du Website-to-API souverain
- Alternatives US non conformes : Apify (US), Diffbot (US), Import.io (US) ne respectent pas le RGPD pour les donnees institutionnelles EU
- Infrastructure deja en place : SearXNG, Qdrant, Valkey, Vault, Trivy, Podman - tout est operationnel
- Conformite native : RGPD, NIS2, Gaia-X, hebergement 100% EU (Luxembourg/France)
Cibles prioritaires
| Segment | Besoin | Exemples de connecteurs |
|---|---|---|
| Cabinets juridiques | Acces structure aux decisions CJUE, avis EDPB | EDPB, CURIA, EUR-Lex |
| Fintech / RegTech | Donnees reglementaires EBA, ESMA | EBA, ESMA, ECB |
| Administrations | Interoperabilite entre institutions | Eurostat, CORDIS, OpenAIRE |
| Recherche academique | Acces programmatique aux publications | CORDIS, OpenAIRE, Europeana |
| Conformite RGPD | Veille reglementaire automatisee | EDPB, CNIL, autorites nationales |
Roadmap
| Phase | Description | Statut |
|---|---|---|
| Phase 1 | SearXNG fallback dans EUAPIConnector (snippets web temps reel) | Fait |
| Phase 2 | Firecrawl self-hosted pour extraction profonde + structuration LLM | A faire |
| Phase 3 | Interface catalogue pour commander un connecteur custom | A faire |
| Phase 4 | Pipeline automatise scraping periodique + detection changements | A faire |
Modele economique
- Revenue recurrent par connecteur maintenu (abonnement mensuel)
- Upsell : monitoring, alertes quand le site source change de structure, mise a jour automatique du schema
- Integration naturelle dans le modele MGaaS existant : le client paie pour un connecteur MCP custom deploye dans son profil catalogue