Intégration SDK directe
Utilisez les SDK AAP et AIP pour ajouter la vérification d’alignement et la vérification d’intégrité directement à votre code applicatif. Cela vous donne un contrôle total sur le moment où les traces sont générées, la manière dont les vérifications d’intégrité s’exécutent et ce qui se passe en cas de violations. Pour les fonctionnalités de gouvernance (application des politiques, reclassification des violations, récupération de la confiance), utilisez l’API Policy et l’API Reclassification en complément des SDK.Installation
Définir une carte d'alignement
Une carte d’alignement déclare l’identité de votre agent, ses valeurs, ses limites d’autonomie et ses engagements d’audit. Chaque trace et chaque vérification d’intégrité est vérifiée par rapport à cette carte.
Générer des AP-Traces à partir des actions de l'agent
Chaque décision importante prise par votre agent doit produire une AP-Trace. La trace enregistre l’action effectuée, les alternatives envisagées, le raisonnement appliqué et si une escalade a été évaluée.
Vérifier les traces par rapport à la carte
La vérification contrôle si le comportement de l’agent (enregistré dans la trace) est cohérent avec son alignement déclaré (la carte). Elle renvoie des vérifications structurelles, un score de similarité, ainsi que toute violation ou avertissement.
Le
similarity_score (de 0.0 à 1.0) mesure à quel point le comportement de la trace est sémantiquement similaire à l’alignement déclaré. Une trace peut passer toutes les vérifications structurelles tout en recevant un avertissement low_behavioral_similarity si le score tombe en dessous de 0.50. Consultez la calibration pour savoir comment les seuils ont été dérivés.Ajouter des points de contrôle d'intégrité
La vérification d’intégrité AIP analyse les blocs de réflexion du LLM en temps réel pour détecter l’injection de prompt, la dérive des valeurs et la manipulation. Chaque vérification produit un verdict :
clear, review_needed ou boundary_violation.Correspondance verdict → action
| Verdict | Continuer | Action recommandée |
|---|---|---|
clear | Oui | continue |
review_needed | Oui | log_and_continue |
boundary_violation | Non | pause_for_review ou deny_and_escalate |
Traçage automatique avec décorateurs (Python)
Le SDK Python AAP fournit des décorateurs pour la génération automatique de traces :Détection de dérive
Surveillez votre agent pour détecter toute dérive comportementale au fil du temps :Prochaines étapes
- Vue d’ensemble CLPI — Couche de gouvernance : application des politiques, récupération de la confiance, ancrage on-chain
- API Policy — Gestion programmatique des politiques pour les intégrations SDK
- API Reclassification — Reclassification des violations et récupération du score de confiance
- Spécification AAP — Détails complets du protocole pour les implémenteurs
- Spécification AIP — Détails du protocole d’intégrité
- Limitations — Ce que AAP peut et ne peut pas garantir
- Modèle de sécurité — Modèle de menace et surfaces d’attaque
- Intégration A2A — Ajouter AAP aux flux de travail d’agents A2A
- Migration MCP — Ajouter le traçage d’alignement aux outils MCP