Aller au contenu principal

API-as-a-Service EU Souverain

Le probleme

Sur les 328 serveurs institutionnels EU references dans le registre Chatbotaurus, environ 320 n exposent pas d API REST publique. L EDPB, l EBA, l ESMA, la CURIA et la plupart des institutions europeennes publient leurs donnees uniquement sous forme de pages web HTML.

Les entreprises, cabinets juridiques et administrations qui ont besoin d acceder a ces donnees de maniere programmatique n ont aujourd hui aucune solution souveraine EU.

La solution : Website-to-API

Chatbotaurus propose un service de construction d APIs structurees JSON a partir de n importe quel site web institutionnel europeen. Chaque connecteur est deploye comme un service MCP dans le catalogue business, avec scan de securite, monitoring et maintenance inclus.

Architecture technique

Site institutionnel EU (ex: edpb.europa.eu)
|
v
[SearXNG] -----> Recherche ciblee (site:domain query)
|
v
[Firecrawl EU] -> Extraction profonde Markdown/JSON
|
v
[LLM local] ---> Structuration schema JSON stable
|
v
[Qdrant] ------> Stockage vectoriel (recherche semantique)
[Valkey] ------> Cache cle-valeur (reponses frequentes)
|
v
[Connecteur MCP] -> API REST JSON exposee via catalogue business
|
v
[Trivy + SBOM] -> Scan securite + provenance
[Vault] -------> Gestion secrets
[AppArmor] ----> Isolation conteneur

Flux d une requete

  1. Le client appelle GET /api/v1/mcp/catalog-business/{connector-id}/search?q=droit+a+l+oubli
  2. Le connecteur MCP verifie le cache Valkey (TTL configurable)
  3. Si cache miss : SearXNG recherche site:edpb.europa.eu droit a l oubli
  4. Firecrawl extrait le contenu complet des pages trouvees
  5. Le LLM local (Ollama) structure les donnees en JSON selon le schema defini
  6. Le resultat est stocke dans Qdrant (vectoriel) et Valkey (cache)
  7. Reponse JSON structuree retournee au client

Niveaux de service

NiveauDescriptionFraicheurPrix indicatif
StandardCache + recherche a la demandeTemps reelEUR/mois/connecteur
PremiumScraping periodique + alertes changementsQuotidienEUR/mois/connecteur
EnterpriseSchema custom + SLA + support dedieConfigurableSur devis

Composants existants reutilises

Le service repose a 100% sur l infrastructure existante de Chatbotaurus :

ComposantRoleLocalisation
SearXNGServiceRecherche web cibleepackages/server/src/services/search/
EUAPIRegistryRegistre 328 serveurs EUpackages/server/src/services/mcp-gateway/connectors/
EUAPIConnectorConnecteur avec fallback SearXNGpackages/server/src/services/mcp-gateway/connectors/
CatalogBusinessServiceDeploiement one-clickpackages/server/src/services/mcp-gateway/
ServerDeploymentServiceLifecycle Podmanpackages/server/src/services/mcp-gateway/
ProvenanceVerifierScan Trivy + SBOMpackages/server/src/services/mcp-gateway/
SecretsManagerIntegration Vaultpackages/server/src/services/mcp-gateway/
EUAPIHttpClientClient HTTP (SSRF, cache, circuit breaker)packages/server/src/services/mcp-gateway/connectors/

Avantage concurrentiel

  • Zero concurrent EU : aucune plateforme europeenne ne propose du Website-to-API souverain
  • Alternatives US non conformes : Apify (US), Diffbot (US), Import.io (US) ne respectent pas le RGPD pour les donnees institutionnelles EU
  • Infrastructure deja en place : SearXNG, Qdrant, Valkey, Vault, Trivy, Podman - tout est operationnel
  • Conformite native : RGPD, NIS2, Gaia-X, hebergement 100% EU (Luxembourg/France)

Cibles prioritaires

SegmentBesoinExemples de connecteurs
Cabinets juridiquesAcces structure aux decisions CJUE, avis EDPBEDPB, CURIA, EUR-Lex
Fintech / RegTechDonnees reglementaires EBA, ESMAEBA, ESMA, ECB
AdministrationsInteroperabilite entre institutionsEurostat, CORDIS, OpenAIRE
Recherche academiqueAcces programmatique aux publicationsCORDIS, OpenAIRE, Europeana
Conformite RGPDVeille reglementaire automatiseeEDPB, CNIL, autorites nationales

Roadmap

PhaseDescriptionStatut
Phase 1SearXNG fallback dans EUAPIConnector (snippets web temps reel)Fait
Phase 2Firecrawl self-hosted pour extraction profonde + structuration LLMA faire
Phase 3Interface catalogue pour commander un connecteur customA faire
Phase 4Pipeline automatise scraping periodique + detection changementsA faire

Modele economique

  • Revenue recurrent par connecteur maintenu (abonnement mensuel)
  • Upsell : monitoring, alertes quand le site source change de structure, mise a jour automatique du schema
  • Integration naturelle dans le modele MGaaS existant : le client paie pour un connecteur MCP custom deploye dans son profil catalogue