Passer au contenu principal

Mnemom Gateway

La Mnemom Gateway est une passerelle IA transparente qui s’interpose entre votre application et n’importe quel fournisseur LLM. Elle fournit la stack de confiance Mnemom complète dès le départ : Vos prompts et réponses passent inchangés. Vos clés API ne quittent jamais votre machine.
1

Installer la CLI

npm install -g @mnemom/mnemom
2

S'authentifier

Connectez-vous à votre compte Mnemom :
mnemom login
Cela ouvre un flux de connexion via navigateur et stocke votre token d’authentification dans ~/.mnemom/auth.json.
Vos clés API fournisseur ne sont pas envoyées à Mnemom. Seuls les hachages SHA-256 sont utilisés pour identifier votre agent. Le hachage ne peut pas être inversé pour récupérer votre clé.
3

Effectuer un appel API

Utilisez l’URL de la passerelle à la place de l’URL directe du fournisseur. Incluez l’en-tête x-mnemom-agent pour nommer votre agent — il sera créé automatiquement au premier appel dans le Sandbox Mnemom sans propriétaire. Avant que les commandes de lecture (mnemom status, logs, integrity, card show) puissent le résoudre, vous devez revendiquer l’agent sur votre compte (étape suivante). Utilisez -i pour afficher les en-têtes de réponse afin de capturer l’id X-Mnemom-Agent nécessaire pour la revendication.
# Au lieu de https://api.anthropic.com/v1/messages
curl -i https://gateway.mnemom.ai/anthropic/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "x-mnemom-agent: my-agent" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 1024,
    "messages": [{"role": "user", "content": "Hello"}]
  }'
La passerelle prend en charge les trois fournisseurs à leurs chemins standard :
FournisseurChemin GatewayÉquivalent Direct
Anthropicgateway.mnemom.ai/anthropic/*api.anthropic.com/*
OpenAIgateway.mnemom.ai/openai/*api.openai.com/*
Geminigateway.mnemom.ai/gemini/*generativelanguage.googleapis.com/*
La plupart des SDK et frameworks vous permettent de remplacer l’URL de base. Définissez-la sur le chemin de la passerelle pour votre fournisseur et tout le reste fonctionne sans modification.
4

Ce qu'il faut lire au retour

La passerelle ajoute des en-têtes de réponse qui portent le verdict Safe House, les métadonnées de corrélation du support et les entrées d’avis. Une intégration conforme doit les analyser et les observer — au minimum les exposer en cas de problème.
En-têteQuand émisQue faire
X-Mnemom-Request-IdToujoursUUIDv4 par requête. Toujours journaliser. Collez-le dans un ticket de support et nous pouvons récupérer chaque ligne de log pour la requête.
X-Mnemom-VerdictToujours (gateway)Structuré front=…; autonomy=…; integrity=…; back=… avec chaque valeur dans {pass | observed | nudged | enforced}. Analysez-le ; l’état à quatre points de contrôle indique ce que Safe House a observé (front+back), ce que CLPI a fait sur les appels d’outils (autonomy), et ce que AIP a fait sur le raisonnement (integrity).
X-Mnemom-AdvisoryQuand la gateway a des avisJSON compact [{source, text, severity?, id?}, …]. Exposez les entrées dans votre UI opérateur / logs. Omis entièrement quand vide.
X-Mnemom-AgentQuand la requête est liée à un agent nomméL’identifiant d’agent que la gateway a résolu pour votre requête (ex. mnm-a1b2c3d4…). Utile pour le recoupement des lignes du tableau de bord.
X-Mnemom-SessionSur les sessions multi-toursToken de corrélation de session stable. Renvoyez-le au tour suivant pour maintenir la continuité de session.
Retry-AfterSur 429 et certains 503Secondes à attendre avant de réessayer. Respectez-le.
Analyse rapide :
const v = response.headers.get('X-Mnemom-Verdict')!;
const checkpoints = Object.fromEntries(v.split(';').map(s => s.trim().split('=')));
// checkpoints.front, checkpoints.autonomy, checkpoints.integrity, checkpoints.back

if (checkpoints.integrity === 'enforced') {
  // Un remplacement AIP du même tour s'est produit — exposez-le dans votre UI.
}
Consultez la référence des en-têtes pour l’ensemble canonique complet + les parseurs par langage, et la référence des erreurs pour le mapping verdict-vers-statut (quand enforced devient une quarantaine 422 ou un blocage 403).
5

Revendiquer votre agent

La passerelle a créé votre agent dans le Sandbox Mnemom partagé (sans propriétaire). Le revendiquer prouve que vous détenez la clé fournisseur et le déplace dans votre compte afin que toutes les commandes de lecture puissent le résoudre.Copiez la valeur X-Mnemom-Agent des en-têtes de réponse ci-dessus, puis exécutez :
mnemom agents claim mnm-550e8400-e29b-41d4-a716-446655440000 --name my-agent --key $ANTHROPIC_API_KEY
Remplacez mnm-550e8400-e29b-41d4-a716-446655440000 par l’id réel de votre en-tête X-Mnemom-Agent.
  • Passez --name correspondant à la valeur x-mnemom-agent envoyée lors de l’appel à la gateway (omettez --name si vous avez fait cet appel sans l’en-tête). Si l’id, --name ou --key ne correspondent pas à un agent réel, la revendication retourne 404 — vérifiez l’id X-Mnemom-Agent et que --name/--key correspondent à l’appel à la gateway.
  • La clé est hachée localement (SHA-256) et n’est jamais envoyée à Mnemom.
  • L’agent atterrit dans votre organisation personnelle par défaut ; passez --org <slug> pour revendiquer dans une organisation partagée.
  • L’opération est idempotente — peut être exécutée plusieurs fois sans risque.
Une réponse 503 signifie que votre organisation personnelle est encore en cours de provisionnement. Attendez quelques secondes et réessayez. Pour les erreurs 403 inter-locataires ou non-membre, consultez le guide du flux de revendication d’agent.
6

Vérifier le statut

Vérifiez que la passerelle est accessible et que votre agent est connecté :
mnemom status --agent my-agent
Sortie
Agent:    my-agent (mnm-550e8400-e29b-41d4-a716-446655440000)
Gateway:  https://gateway.mnemom.ai (healthy)
Status:   Connected
Providers: anthropic, openai
Last seen: just now
7

Afficher les traces

Après avoir effectué des appels API via la passerelle, affichez ce qui a été tracé :
mnemom logs --agent my-agent
Sortie
2026-02-17T10:30:00Z  tr-abc123  recommend  bounded   verified  0.82
2026-02-17T10:30:05Z  tr-abc124  search     bounded   verified  0.76
2026-02-17T10:30:12Z  tr-abc125  respond    bounded   verified  0.91
Utilisez mnemom logs --agent my-agent -l 20 pour afficher plus d’entrées.
8

Vérifier l'intégrité

Affichez les scores d’intégrité AIP pour l’activité récente de votre agent :
mnemom integrity --agent my-agent
Sortie
Agent: mnm-550e8400-e29b-41d4-a716-446655440000
Checkpoints: 12
Verdicts:
  clear: 11
  review_needed: 1
  boundary_violation: 0
Integrity score: 0.94
Drift: none detected
9

Afficher votre carte d'alignement

Consultez la carte d’alignement assignée à votre agent :
mnemom card show --agent my-agent
Personnalisez-la en publiant votre propre carte :
mnemom card publish my-card.yaml --agent my-agent
10

Explorer le tableau de bord

Les données de votre agent sont disponibles sur mnemom.ai/dashboard une fois connecté. Le tableau de bord affiche :
  • Timeline de conscience — Une vue chronologique de chaque trace, point de contrôle d’intégrité et action d’application
  • Carte d’alignement — Les valeurs et limites déclarées de votre agent
  • Scores d’intégrité — Historique des verdicts AIP et analyse des tendances
  • Alertes de dérive — Notifications quand le comportement diverge de l’alignement déclaré
  • Journal d’application — Enregistrements des nudges et blocages (si l’application est activée)

Agents nommés

Si vous exécutez plusieurs agents derrière la même clé API, utilisez l’en-tête x-mnemom-agent pour donner à chacun une identité distincte. Le chemin du fournisseur reste inchangé — la passerelle dérive un ID d’agent unique par SHA256(apiKey + '|' + agentName). Consultez Identité d’agent pour la dérivation complète de l’ID, les chemins de création automatique vs enregistrement programmatique, et comment la rotation des clés interagit avec l’identité de l’agent.
curl https://gateway.mnemom.ai/anthropic/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "x-mnemom-agent: my-coder" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 1024,
    "messages": [{"role": "user", "content": "Hello"}]
  }'
Chaque agent nommé obtient son propre historique de traces, scores d’intégrité et détection de dérive — même s’ils partagent une clé API. Les agents sont créés automatiquement au premier appel API ; revendiquez une fois (voir l’étape de revendication ci-dessus) pour lier l’agent à votre compte.
Vous pouvez également créer des agents de manière programmatique via l’API CRUD Agent si vous souhaitez les pré-créer avec des métadonnées avant leur première requête.

Fournisseurs pris en charge

FournisseurModèlesSupport Thinking / AIPEn-tête d’authentification
AnthropicClaude Opus 4.7, Sonnet 4.6, Haiku 4.5Complet (blocs de réflexion analysés directement)x-api-key
OpenAIGPT-5.2, GPT-5.2 Pro, GPT-5Via résumés de raisonnement (confiance réduite)Authorization: Bearer
GeminiGemini 2.5 Pro, Gemini 3 ProComplet (parties de réflexion analysées directement)x-goog-api-key

Compatibilité AIP

Fournisseur / ModèleSupport AIPMéthode
Modèles de raisonnement Anthropic (Opus, Sonnet)CompletBlocs de réflexion analysés directement
Série GPT-5 Thinking OpenAIPartielRésumés de raisonnement (confiance réduite)
Gemini 2.5/3 avec thinkingCompletParties de réflexion analysées directement
Modèles sans raisonnementTraçage uniquementVerdict clear synthétique
OpenAI legacy (o3/o4-mini)Non pris en chargeRaisonnement chiffré
Éléments thinking dans les réponses proxiées. Safe House / AIP active le thinking étendu pour analyser le raisonnement de l’agent en temps réel. Les réponses proxiées incluent donc un élément de contenu thinking dans le tableau content aux côtés du bloc text standard. Les clients qui supposent des tableaux de contenu texte uniquement doivent être mis à jour pour gérer ou ignorer les blocs thinking. Les tokens de sortie thinking sont facturés comme des tokens de sortie standard — ce comportement est intentionnel et ne peut pas être désactivé.

Ce qui est tracé

La Mnemom Gateway construit des AP-Traces qui enregistrent :
  • Action — Ce que l’agent a fait (type, nom, catégorie)
  • Décision — Quelles alternatives ont été envisagées et pourquoi l’une a été sélectionnée
  • Escalade — Si l’agent a escaladé vers un humain et pourquoi
  • Vérification — Si la trace est cohérente avec la carte d’alignement déclarée de l’agent
  • Intégrité — Analyse AIP en temps réel des blocs de réflexion, avec verdict (clear / review_needed / boundary_violation)

Ce qui N’est PAS stocké

Vos prompts, réponses et clés API ne sont jamais stockés par Mnemom. La passerelle traite les requêtes en mémoire et les transmet au fournisseur. Seules les métadonnées de trace structurées (actions, décisions, verdicts) et les résultats d’analyse des blocs de réflexion sont persistés.

Modes d’application

La Mnemom Gateway prend en charge trois modes d’application lorsqu’une violation d’intégrité est détectée :
ModeComportement
observeDétecte les violations, les enregistre, n’agit pas (par défaut)
nudgeDétecte les violations, injecte un retour dans la prochaine requête de l’agent via le prompt système. L’agent le voit et peut s’auto-corriger.
enforceBlocage dur avec HTTP 403 pour les requêtes non-streaming. Bascule vers nudge pour le streaming.
Définissez le mode d’application en mettant à jour la carte d’alignement de l’agent. integrity_mode et autonomy_mode sont des champs de premier niveau sur la carte d’alignement ; le point de terminaison legacy /v1/agents/{id}/enforcement a été retiré le 2026-05-14. Trois chemins, choisissez celui qui convient à votre flux de travail :
  • Tableau de bord : ouvrez https://mnemom.ai/dashboard/agents/{your-agent-id}/card, activez integrity_mode, enregistrez. Le chemin le plus simple.
  • CLI : mnemom card edit ouvre le YAML de la carte d’alignement courante dans $EDITOR ; changez integrity_mode: nudge, enregistrez, la CLI publie et recompose.
  • Programmatique : PUT /v1/alignment/agent/{agent_id} avec la carte canonique complète. Consultez le guide de gestion des cartes pour le flux lecture-modification-écriture et le schéma de carte d’alignement pour les exigences de champs.

Prochaines étapes