MCP : connecter Claude à vos outils
Lire →Construire un agent qui « marche en démo » est facile. Construire un agent fiable, sûr et maintenable en production demande une méthode. Voici comment je structure un agent avec le Claude Agent SDK, étape par étape.
Un agent est un système qui utilise un modèle comme Claude pour raisonner puis agir, en boucle. À chaque tour : il décide d'une action (appeler un outil, interroger une donnée), exécute, observe le résultat, et recommence jusqu'à accomplir la tâche. C'est ce qui distingue un agent d'un simple assistant conversationnel.
Le Claude Agent SDK industrialise cette boucle : gestion des messages, déclaration et appel d'outils, orchestration des étapes, gestion du contexte. Plutôt que de réécrire cette plomberie, on se concentre sur la logique métier. La référence technique est la documentation Anthropic.
Un agent qui peut tout faire est un agent dangereux. La fiabilité vient de contraintes explicites : limiter les outils accessibles, exiger une validation humaine pour les actions irréversibles, journaliser chaque étape, fixer un budget de tours et de coûts. Ces garde-fous se conçoivent avant le déploiement, pas après le premier incident.
Un bon agent n'est pas celui qui peut tout faire, mais celui dont on sait exactement ce qu'il peut faire.
On ne met pas un agent en production sur une impression. On construit un jeu de cas représentatifs et on mesure : taux de réussite, erreurs, coûts, latence. Ces évaluations deviennent des tests de non-régression qui protègent la qualité dans le temps.
Un cas que je déploie régulièrement : un agent qui reçoit des demandes entrantes (formulaire web, email transféré, ticket helpdesk), les qualifie, enrichit avec les données de contexte disponibles, et propose un routage vers la bonne équipe. Avec un mécanisme de validation humaine sur les cas sensibles ou ambigus.
Architecture concrète : le Claude Agent SDK orchestre la boucle ; un serveur MCP expose l'accès au CRM et au helpdesk ; un évaluateur automatique compare la qualité du routage proposé à un échantillon validé manuellement chaque semaine. En 3 mois, les paramètres se stabilisent, les évaluations restent à 95 % d'accord avec l'humain, et l'équipe est libérée de la qualification de routine.
Construire un agent est une chose ; le maintenir utile et fiable dans la durée en est une autre. Ce qui distingue les agents qui restent en production pendant des années des agents qui sont débranchés au bout de quelques mois, c'est la discipline de maintenance qui les entoure. Trois rituels font la différence.
Une revue d'évaluations mensuelle. On rejoue le jeu de cas de référence, on compare les résultats à l'historique, on identifie les dérives. Si la qualité a baissé sur un type de cas, on creuse : changement de prompt ? changement de modèle ? évolution de la donnée d'entrée ? Cette discipline transforme l'agent en système observable, pas en boîte noire.
Un canal de feedback utilisateur. Les utilisateurs voient des choses que les évaluations automatiques ne voient pas. Un mécanisme simple — un bouton « ce n'est pas la bonne réponse » avec un commentaire libre — alimente le jeu de cas et nourrit l'amélioration continue. Sans cette boucle, on optimise dans le vide.
Une revue trimestrielle du périmètre. Avec l'usage, les besoins évoluent : certaines actions sont peu utilisées et peuvent être retirées, d'autres manquent et méritent d'être ajoutées. Cette revue évite à la fois le périmètre obsolète et le périmètre qui gonfle au fil des demandes ad hoc.
Ces rituels s'installent en quelques mois après la mise en production, généralement portés par un binôme métier-tech qui devient propriétaire de l'agent. Mon accompagnement post-mise en production consiste précisément à transférer cette posture aux équipes internes, jusqu'à ce qu'elles tiennent seules la maintenance et l'évolution.
Le Claude Agent SDK rend la construction d'agents accessible, mais la qualité reste affaire de méthode : périmètre clair, garde-fous, évaluations. Commencez par un agent simple et fiable, puis étendez. C'est l'approche que j'applique sur les missions de développement d'agents.
Un agent à construire ? Décrivez-moi la tâche.
De la boucle d'agent aux garde-fous, je conçois des agents qui passent en production.
Me contacter → Retour au blog