
Le relais, c'est le produit
La chose la plus intelligente que fait un agent IA en production, c'est de savoir quand s'arrêter et appeler un humain. Bien concevoir ce relais, c'est l'essentiel du travail.

Tout le monde veut parler de tout ce qu'un agent peut accomplir seul. Les conversations qui comptent vraiment portent sur l'inverse. Où s'arrête-t-il, comment passe-t-il le relais, et que reçoit l'humain au moment où il le fait.
Nous l'avons appris en construisant un assistant client pour une marque de retail. Le bot répond toute la journée aux questions sur Messenger et Instagram. La fonctionnalité que notre client apprécie le plus n'est aucune des réponses qu'il donne. C'est l'instant où il décide de ne pas répondre, et fait intervenir une personne à la place.
L'autonomie n'est pas l'objectif
Un agent totalement autonome qui se trompe dix pour cent du temps est pire qu'un agent modeste qui transmet proprement. La version autonome échoue en silence, en public, devant un client. La version modeste échoue dans les mains d'un humain qui rectifie.
Nous concevons donc la frontière en premier. Pour chaque agent, nous nous demandons ce qu'il a le droit de résoudre seul, ce qu'il doit confirmer, et ce qu'il ne doit jamais toucher. Tout ce qui touche à l'argent, à une réclamation ou à un client mécontent franchit la ligne, délibérément. Le rôle du bot, à cet endroit, est de reconnaître la situation et de s'effacer.
Un bon relais transporte le contexte
La différence entre un relais qui aide et un relais qui agace tient à ce dont l'humain dispose au départ. Un mauvais relais largue une transcription froide sur un conseiller et l'oblige à la lire. Un bon relais arrive résumé, avec l'intention du client, ce qui a déjà été tenté, et ce qu'il faut faire ensuite.
Dans notre assistant, une escalade met le bot en pause pour cet utilisateur, envoie à l'équipe une notification claire avec la conversation et le motif, et inclut un seul bouton pour reprendre la main. L'humain intervient en connaissant déjà l'histoire. Une fois qu'il a terminé, un clic rend le contrôle. Le client ne sent jamais la couture.
Un relais qui oblige l'humain à repartir de zéro n'est pas un relais. C'est un appel coupé.
Les déclencheurs qui comptent
Certaines escalades sont évidentes. Un client qui tape le mot « réclamation », un message vocal que le bot ne devrait pas tenter d'interpréter, une demande qui tombe en dehors des horaires d'ouverture. Ce sont des règles, et les règles sont faciles.
Les déclencheurs plus délicats relèvent de la confiance. Quand le modèle hésite, le bon réflexe est d'escalader plutôt que de deviner. Nous préférons payer quelques relais inutiles que laisser l'agent inventer une politique de remboursement. L'incertitude est un signal sur lequel agir, pas un défaut à cacher.
Les relais rendent l'agent plus intelligent
Voici la partie que les équipes ratent. Chaque escalade est une donnée. Quand un humain doit intervenir, ce cas vous indique précisément où s'arrête la compétence de l'agent. Réinjectez ces cas dans les prompts, les garde-fous et le jeu de tests, et la frontière se déplace d'elle-même. L'agent gère discrètement davantage au fil du temps, parce que vous l'instruisez à partir de ses propres échecs au lieu de deviner.
C'est pour cela que la supervision humaine n'est pas une béquille temporaire que l'on retire une fois le modèle assez bon. C'est le mécanisme qui rend le modèle assez bon, et qui le maintient à ce niveau à mesure que le monde change autour de lui.
Construisez d'abord la sortie
Si vous ne deviez retenir qu'une chose : construisez le relais avant de construire l'autonomie. Décidez où l'agent s'arrête, concevez ce que reçoit l'humain, et rendez le trajet de retour indolore. La capacité, c'est la moitié facile. La sortie élégante, c'est le produit.
Un projet à construire ?
Transformons votre vision en produit livré, vite.



