Déploiement auto-hébergé

Exécutez la Mnemom Gateway sur votre propre infrastructure pour un contrôle complet de la résidence des données. Le contenu des prompts et des réponses n’est jamais envoyé au cloud Mnemom, bien que les prompts soient transmis aux fournisseurs LLM que vous configurez — consultez Résidence des données pour les limites exactes du trafic. La passerelle auto-hébergée est un adaptateur Node.js qui exécute le même code que le service géré Cloudflare Workers — comportement identique, votre infrastructure.

Le déploiement auto-hébergé nécessite une licence Enterprise. Contactez-nous pour obtenir une clé de licence. Enterprise inclut le mode d’analyse hybride, l’intégration SSO/SAML et un support dédié.

Options de déploiement

	Géré (Cloud)	Docker Compose	Kubernetes (Helm)
Idéal pour	La plupart des équipes	Petites équipes, éval, dev	Production à grande échelle
Infrastructure	Aucune (Mnemom héberge)	VM ou serveur unique	Cluster K8s
Temps de configuration	Minutes	~10 minutes	~30 minutes
Mise à l’échelle	Automatique	Manuelle	Auto-scaling HPA
Résidence des données	Cloud Mnemom	Votre infrastructure	Votre infrastructure
Haute disponibilité	Intégrée	Nœud unique	Multi-réplica, PDB
Surveillance	Tableau de bord	Prometheus + logs	Prometheus + ServiceMonitor

Prérequis

Un JWT de licence Enterprise depuis mnemom.ai/dashboard
Une clé API Anthropic (requise pour l’analyse d’intégrité AIP)
Optionnel : clés API OpenAI et Gemini pour le traçage multi-fournisseur

AIP utilise par défaut le mode fail-open. Si le LLM d’analyse est inaccessible, les vérifications d’intégrité passeront silencieusement. Pour les déploiements en production gérant des opérations sensibles, définissez failure_policy: { mode: "fail_closed" } dans votre configuration AIP.

Démarrage rapide : Docker Compose

Le moyen le plus rapide de faire fonctionner une passerelle auto-hébergée. Inclut PostgreSQL, Redis et les migrations de base de données automatiques.

Exigences

Docker 24+ et Docker Compose v2+
2 Go de RAM minimum, 4 Go recommandés
10 Go d’espace disque

Cloner le dépôt

git clone https://github.com/mnemom/mnemom-platform.git
cd mnemom-platform/deploy/docker

Configurer l'environnement

Copiez le fichier d’environnement d’exemple et renseignez vos identifiants :

cp .env.example .env

Modifiez .env et définissez les valeurs requises :

# Required
POSTGRES_PASSWORD=<strong-password>
REDIS_PASSWORD=<strong-password>
SUPABASE_URL=https://<your-project-ref>.supabase.co
SUPABASE_SECRET_KEY=<your-supabase-service-role-key>
SUPABASE_JWT_SECRET=<your-supabase-jwt-secret>
INTERNAL_API_KEY=<strong-random-string>
MNEMOM_LICENSE_JWT=<your-enterprise-license-jwt>
ANTHROPIC_API_KEY=<your-anthropic-api-key>

# Optional: additional providers
OPENAI_API_KEY=<your-openai-key>
GEMINI_API_KEY=<your-gemini-key>

# Optional: heartbeat override (for EU/air-gapped deployments)
# HEARTBEAT_URL=https://api.mnemom.ai/v1/deployments/heartbeat

Si votre .env.example affiche SMOLTBOT_ROLE, renommez-le en MNEMOM_ROLE — le fichier contient un nom de marque obsolète, mais le point d’entrée lit MNEMOM_ROLE.

Démarrer la stack

docker compose up -d

Cela démarre quatre services dans l’ordre :

PostgreSQL — base de données avec vérification de santé
Redis — couche de cache avec persistance
Gateway — proxy HTTP sur le port 8787 (applique les migrations de base de données au démarrage)
Observer — planificateur en arrière-plan pour le traitement des traces

Vérifier la santé

Attendez environ 30 secondes, puis vérifiez la santé de la passerelle :

curl http://localhost:8787/health/ready

Expected response

{
  "status": "ok",
  "checks": {
    "redis": { "ok": true },
    "supabase": { "ok": true },
    "license": { "ok": true }
  }
}

Connecter un agent

Pointez la CLI mnemom vers votre passerelle auto-hébergée :

npm install -g @mnemom/mnemom
# Point the CLI at your self-hosted stack, then authenticate
export MNEMOM_ENV=local   # resolves API + gateway to http://localhost:8787
mnemom login

Effectuez une requête de test :

curl http://localhost:8787/anthropic/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-haiku-4-5-20251001",
    "max_tokens": 256,
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Si vous avez configuré OPENAI_API_KEY, la même passerelle sert OpenAI sur le chemin /openai :

curl http://localhost:8787/openai/v1/chat/completions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Et Gemini sur le chemin /gemini, si vous avez configuré GEMINI_API_KEY :

curl http://localhost:8787/gemini/v1beta/models/gemini-2.5-flash:generateContent \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Hello"}]}]
  }'

Vérifiez que l’agent est connecté :

mnemom status

Production : Kubernetes avec Helm

Pour les déploiements en production avec auto-scaling, haute disponibilité et surveillance.

Exigences

Kubernetes 1.27+
Helm 3.12+
kubectl configuré pour votre cluster

Ajouter le chart Helm

cd mnemom-platform/deploy/helm  # navigate to the helm chart

Créer un Secret Kubernetes

Stockez les identifiants sensibles dans un Secret :

kubectl create secret generic mnemom-secrets \
  --from-literal=SUPABASE_URL=<your-supabase-url> \
  --from-literal=SUPABASE_SECRET_KEY=<your-service-role-key> \
  --from-literal=SUPABASE_JWT_SECRET=<your-supabase-jwt-secret> \
  --from-literal=INTERNAL_API_KEY=<strong-random-string> \
  --from-literal=ANTHROPIC_API_KEY=<your-anthropic-key> \
  --from-literal=MNEMOM_LICENSE_JWT=<your-license-jwt> \
  --from-literal=REDIS_URL=<your-redis-url> \
  --from-literal=DATABASE_URL=<your-postgres-url>

Installer le chart

helm install mnemom ./mnemom-gateway \
  --set secrets.existingSecret=mnemom-secrets \
  --set ingress.enabled=true \
  --set ingress.hosts[0].host=gateway.yourcompany.com \
  --set ingress.hosts[0].paths[0].path=/ \
  --set ingress.hosts[0].paths[0].pathType=Prefix

Vérifier le déploiement

kubectl get pods -l app.kubernetes.io/name=mnemom-gateway
helm test mnemom

Ce que déploie le chart

Déploiement Gateway (2 réplicas par défaut) — proxy HTTP avec sondes de liveness, readiness et startup
Déploiement Observer (1 réplica) — planificateur en arrière-plan pour le traitement des traces
Job de migration — hook Helm pre-install/pre-upgrade qui applique les migrations de base de données
Service — ClusterIP sur le port 8787
NetworkPolicy — deny-all par défaut avec des autorisations explicites pour l’ingress, Redis, PostgreSQL et les API LLM en amont
PodDisruptionBudget — garantit au moins 1 réplica pendant les mises à jour progressives
Optionnel : Ingress avec TLS, HPA, ServiceMonitor pour Prometheus

Mise à l’échelle

Activez le HorizontalPodAutoscaler pour une mise à l’échelle automatique :

# values.yaml
hpa:
  enabled: true
  minReplicas: 2
  maxReplicas: 20
  targetCPU: 70
  targetMemory: 80

Architecture

En mode auto-hébergé, une couche d’adaptateur Node.js remplace les API spécifiques à Cloudflare tout en exécutant exactement le même code de passerelle :

Your App / Agents
  │
  ▼
Self-Hosted Gateway (Node.js, port 8787)
  │ ── KV adapter ──▶ Redis (or in-memory)
  │ ── fetch interceptor ──▶ Anthropic / OpenAI / Gemini (direct)
  │
  ├──▶ Observer (cron scheduler)
  │     ── builds AP-Traces
  │     ── runs AAP verification
  │     ── runs AIP integrity checks
  │
  ▼
PostgreSQL (Supabase or self-managed)
  │
  ├──▶ CLI (mnemom status / logs)
  └──▶ Dashboard (mnemom.ai or self-hosted)

Couche d’adaptation — zéro modification du code source de la passerelle :

API Cloudflare	Remplacement auto-hébergé
KV Namespace	Redis (avec repli en mémoire)
`ctx.waitUntil()`	Collecte de Promise avec drainage après la réponse
Routage d’URL AI Gateway	Intercepteur fetch réécrivant vers les API en amont
`ExecutionContext`	Shim Node.js avec sémantique fire-and-forget

Résidence des données

Le contenu des prompts et des réponses n’est jamais envoyé au cloud Mnemom. Cependant, les prompts sont transmis aux fournisseurs LLM que vous configurez — consultez le tableau ci-dessous pour les limites exactes du trafic.

Trafic	Destination	Comment le maintenir dans votre région
Appels aux fournisseurs LLM	APIs Anthropic / OpenAI / Gemini (port 443)	Routez via un proxy API avec VPC peering ou utilisez le point de terminaison régional du fournisseur
Heartbeat	`https://api.mnemom.ai/v1/deployments/heartbeat`	Définissez `HEARTBEAT_URL` sur un endpoint interne ou un relais régional
Création d’agents (s2s)	`https://api.mnemom.ai/v1/agents` (envoie uniquement `agent_hash` + préfixe de clé API — aucun contenu de prompt)	Contactez [email protected] pour les options air-gapped

Les traces, points de contrôle d’intégrité et tout le contenu des prompts/réponses restent dans votre base de données et ne sont jamais envoyés au cloud Mnemom.

Référence de configuration

Requis

Variable	Description
`SUPABASE_URL`	URL du projet Supabase (`https://<ref>.supabase.co`) ou point de terminaison PostgREST auto-hébergé
`SUPABASE_SECRET_KEY`	Clé de rôle de service Supabase
`SUPABASE_JWT_SECRET`	Secret JWT pour la vérification des tokens d’authentification Supabase (l’observer échoue sans cela)
`REDIS_PASSWORD`	Mot de passe pour l’instance Redis (requis lorsque Redis est utilisé)
`INTERNAL_API_KEY`	Secret interne service-à-service pour les appels de création d’agents
`MNEMOM_LICENSE_JWT`	JWT de licence Enterprise depuis mnemom.ai/dashboard
`ANTHROPIC_API_KEY`	Clé API Anthropic (requise pour l’analyse AIP)

Optionnel : fournisseurs

Variable	Défaut	Description
`OPENAI_API_KEY`	—	Clé API OpenAI pour le routage multi-fournisseur
`GEMINI_API_KEY`	—	Clé API Google Gemini pour le routage multi-fournisseur

Optionnel : analyse hybride

Variable	Défaut	Description
`MNEMOM_ANALYZE_URL`	—	Délègue l’analyse AIP au cloud Mnemom (`https://api.mnemom.ai/v1/analyze`)
`MNEMOM_API_KEY`	—	Clé API Mnemom avec la portée `analyze` (requise lorsque `MNEMOM_ANALYZE_URL` est défini)

En mode hybride, seuls les blocs de réflexion/raisonnement sont envoyés pour analyse — les prompts et réponses bruts ne quittent jamais votre infrastructure.

Optionnel : infrastructure

Variable	Défaut	Description
`REDIS_URL`	—	URL de connexion Redis. Sans Redis, un adaptateur KV en mémoire est utilisé (nœud unique seulement).
`PORT`	`8787`	Port d’écoute HTTP
`HOST`	`0.0.0.0`	Adresse de liaison HTTP
`MNEMOM_ROLE`	`all`	`gateway` (HTTP uniquement), `scheduler` (cron uniquement) ou `all` (les deux)
`LOG_LEVEL`	`info`	`debug`, `info`, `warn` ou `error`. JSON structuré vers stdout.
`HEARTBEAT_URL`	`https://api.mnemom.ai/v1/deployments/heartbeat`	Remplace le point de terminaison heartbeat. Définissez-le sur un endpoint interne pour les déploiements UE ou air-gapped.

Points de terminaison de santé

Trois sondes standard Kubernetes :

Point de terminaison	Objectif	Comportement
`/health/live`	Sonde de liveness	Toujours 200 sauf en cas de blocage
`/health/ready`	Sonde de readiness	Vérifie Redis, PostgreSQL et la validité de la licence
`/health/startup`	Sonde de startup	Retourne 503 jusqu’à la fin de l’initialisation

Métriques Prometheus

La passerelle expose un point de terminaison /metrics avec :

gateway_requests_total{provider,status} — compteur de requêtes
gateway_request_duration_seconds{provider} — histogramme de latence
gateway_aip_checks_total{verdict} — compteur de vérifications d’intégrité
gateway_cache_operations_total{operation,result} — hit/miss de cache
Métriques standard process_* et nodejs_*

Pour Kubernetes, activez le ServiceMonitor dans values.yaml :

metrics:
  serviceMonitor:
    enabled: true
    interval: 30s

Mise à niveau

Docker Compose

cd mnemom-platform && git pull
cd deploy/docker
docker compose build
docker compose up -d

Les migrations s’exécutent automatiquement au démarrage de la passerelle.

Helm

helm upgrade mnemom ./deploy/helm/mnemom-gateway \
  --set secrets.existingSecret=mnemom-secrets

Le job de migration s’exécute comme un hook Helm pre-upgrade.

Sauvegardez toujours votre base de données avant de mettre à niveau. Pour Docker : docker compose exec postgres pg_dump -U mnemom mnemom > backup.sql. Pour Kubernetes : utilisez votre procédure de sauvegarde PostgreSQL standard.

Dépannage

La passerelle ne démarre pas — EnvValidationError

Une variable d’environnement requise est manquante. Vérifiez le message d’erreur pour savoir laquelle, puis vérifiez votre fichier .env ou votre Secret Kubernetes.

Connexion Redis refusée

Docker Compose : assurez-vous que le service redis est sain (docker compose ps)
Kubernetes : vérifiez que REDIS_URL dans votre Secret pointe vers une instance Redis accessible
Sans Redis, la passerelle se replie sur le KV en mémoire (nœud unique seulement)

Échec de validation de la licence

Vérifiez que MNEMOM_LICENSE_JWT est défini et non expiré
Vérifiez /health/ready pour l’erreur de licence spécifique
Contactez [email protected] pour une réémission de licence

Erreurs d'API LLM en amont (401/403)

Vérifiez que vos clés API sont correctes et disposent de crédits suffisants
La passerelle proxy directement vers les API des fournisseurs — assurez-vous que le HTTPS sortant (port 443) est autorisé
Dans Kubernetes, vérifiez que la NetworkPolicy autorise l’egress vers 0.0.0.0/0:443

Mémoire élevée / OOMKilled

Augmentez les limites de mémoire du conteneur (512Mi minimum, 1Gi recommandé pour un trafic élevé)
Si vous utilisez le KV en mémoire, passez à Redis pour réduire la pression mémoire
Définissez NODE_OPTIONS=--max-old-space-size=768 pour un contrôle fin du tas

Prochaines étapes

Vue d’ensemble de la Mnemom Gateway — architecture et composants
Modes d’application — observe, nudge et enforce
Guide d’observabilité — tableaux de bord et alertes
Modèle de sécurité — limites de confiance et modèle de menace

​Déploiement auto-hébergé

​Options de déploiement

​Prérequis

​Démarrage rapide : Docker Compose

​Exigences

​Production : Kubernetes avec Helm

​Exigences

​Ce que déploie le chart

​Mise à l’échelle

​Architecture

​Résidence des données

​Référence de configuration

​Requis

​Optionnel : fournisseurs

​Optionnel : analyse hybride

​Optionnel : infrastructure

​Points de terminaison de santé

​Métriques Prometheus

​Mise à niveau

​Docker Compose

​Helm

​Dépannage

​Prochaines étapes

Déploiement auto-hébergé

Options de déploiement

Prérequis

Démarrage rapide : Docker Compose

Exigences

Production : Kubernetes avec Helm

Exigences

Ce que déploie le chart

Mise à l’échelle

Architecture

Résidence des données

Référence de configuration

Requis

Optionnel : fournisseurs

Optionnel : analyse hybride

Optionnel : infrastructure

Points de terminaison de santé

Métriques Prometheus

Mise à niveau

Docker Compose

Helm

Dépannage

Prochaines étapes