Nos actualités
Agents IA : Pour fiabiliser le futur, n’oubliez pas les outils du présent!
Vous êtes Product Owner et c'est votre premier jour avec votre nouvelle équipe. Autour de la table (ou plutôt dans le Cloud) : un agent codeur, un agent testeur, un agent sécurité et un agent Ops. Votre job ? Simplement écrire vos User Stories. Le reste ? "It's done". Le code est généré, testé et déployé avant même que vous ayez fini votre café. Bienvenue dans le futur !
Sauf que ça, c'est le pitch.
Aujourd'hui, dans la réalité opérationnelle et insistons bien sur le "aujourd'hui", car dans 6 mois ce paradigme pourrait être obsolète, s'appuyer uniquement sur une chaîne d'agents IA sans garde-fous relève davantage du pari que de l'ingénierie.
Chez Bpifrance.io, nous embrassons l'IA pour transformer notre façon de produire. Malgré tout, cette transformation ne doit pas se faire au détriment de la fiabilité du résultat, ni de nos engagements RSE.
Nous avons donc la ferme conviction que le choix pragmatique et responsable du moment, c'est l'alliance du Déterministe (scripts, linters), de l'Indéterministe (IA) et de l'Humain.
Do the math
Bienvenue dans l'arithmétique de la réalité actuelle.
Prenons une hypothèse réaliste pour des tâches cognitives complexes (pas juste du 'Hello World') : disons que votre Agent IA est fiable à 90%. C'est déjà excellent.
Maintenant, enchaînez-en 6 pour réaliser une fonctionnalité complète (Conception -> Code -> Test -> Review -> Secu -> Deploy).
Le calcul de probabilité est brutal : 0,90 puissance 6 ≈ 53%.
Vous avez créé un processus qui a une chance sur deux de réussir du premier coup. Vous avez transformé votre pipeline de production en un gigantesque pile ou face. 🎲
Pourquoi ? Parce que l'IA est probabiliste.
Dans une chaîne d'agents, l'hallucination ou l'imprécision du premier devient la "vérité" du second. Nous ne corrigeons pas l'erreur, nous la capitalisons.
Trust, but verify
Pour contrer cette érosion, on voit émerger l'idée d'utiliser des "Agents QA" pour vérifier le travail des "Agents Devs". C'est souvent une illusion dangereuse : la consanguinité numérique.
Ces agents tournent souvent sur les mêmes modèles fondations (GPT, Claude, Llama...). Ils partagent les mêmes biais, les mêmes lacunes et la même définition statistique de ce qui "ressemble" à du bon code.
Demander à une IA de valider le code d'une autre IA, c'est comme demander à un enfant de corriger sa dictée en changeant simplement de stylo. Il corrigera peut-être les fautes d'inattention (la syntaxe), mais il sera aveugle aux erreurs de fond (la conception) car elles proviennent de sa propre logique.
La validation, pour être robuste, a besoin de rupture de contexte.
Simplicity is the ultimate sophistication
La solution pour rendre la vision Agentique viable dès maintenant ? Le "Sandwich Hybride".
L'automatisation ne peut pas être une chaîne infinie d'IA. Elle doit alterner les couches :
- IA (Génération / Draft) : pour proposer du code, dégrossir la tâche et offrir de la vélocité.
- Déterministe (Compilateur, Tests, Linter, Sonar) : le juge de paix froid et binaire.
- Human-in-the-loop : la validation finale (Conception & Métier).
Pourquoi cette couche déterministe au milieu est-elle nécessaire ? Parce qu'un compilateur ne "pense" pas que le code est bon. Il sait lorsqu'il compile.
Pourquoi l'humain à la fin ? Même si c'est "consommateur de temps", c'est notre filet de sécurité indispensable dans cette phase de transition technologique. L'IA propose, le script valide la forme, l'humain valide le fond.
Less is more
Au-delà de la fiabilité, c'est une question de responsabilité (RSE) et de bon sens économique.
Utiliser un LLM (Large Language Model) pour vérifier si une variable est bien typée ou s'il manque un point-virgule, c'est comme engager un chef étoilé pour faire bouillir de l'eau.
- Coût Économique : chaque aller-retour entre agents coûte des tokens. Un linter ou un script bash coûte 0€.
- Coût Écologique : l'inférence d'un modèle IA consomme de l'eau et de l'électricité (GPU). L'exécution d'un test unitaire est insignifiante énergétiquement.
Le choix responsable, c'est de déléguer à l'IA uniquement ce que l'algorithme classique ne sait pas faire. Pour tout le reste, le "vieux monde" des outils déterministes reste imbattable.
Conclusion
L'IA est créative, probabiliste et rapide.
Vos outils classiques (CI/CD, Sonar, Linters) sont déterministes, binaires et implacables.
L'humain détient le contexte et la vision.
La "secret sauce" n'est pas de remplacer l'un par l'autre, mais de les faire travailler ensemble.
Ne cherchez pas l'agent autonome parfait tout de suite. Cherchez le pipeline hybride robuste dès aujourd'hui.
Et ça, c'est le choix pragmatique.
Envie d'en savoir plus sur nos pratiques et nos convictions? N'oubliez pas de vous abonner à notre LinkedIn pour ne louper aucune info ! #LaTechAuCore
Technologies associées