Évaluations alarmantes des fuites contextuelles chez les agents informatiques

Le fait — Anmol Goel et Iryna Gurevych ont publié le 22 juin 2026 un article sur arXiv intitulé « Capable but Careless ». Ils présentent AgentCIBench, un banc d’essai pour agents capables d’utiliser un ordinateur. Le benchmark cible trois échecs précis. Il mesure les fuites par co‑localisation visuelle, les surpartages face à des consignes vagues, et les erreurs de destinataire. Les auteurs évaluent quinze agents dits frontier. Selon le résumé, onze sur quinze divulguent des informations dans plus de la moitié des scénarios. Le taux moyen de fuite atteint 67,9 %. Les mêmes échecs persistent quand les agents agissent de bout en bout dans l’environnement.

Le contexte — Les agents informatiques sont souvent présentés comme une étape vers des systèmes plus généraux. Ils doivent naviguer entre messagerie, calendrier, fichiers et tâches. Cette polyvalence ressemble davantage à l’usage d’un assistant généraliste qu’à un modèle spécialisé. Mais elle ouvre aussi un problème ancien en sécurité. Un agent peut avoir accès à plusieurs contextes sociaux qui ne devraient pas être mélangés. Les auteurs mobilisent ici l’idée d’« intégrité contextuelle ». Cette notion décrit des règles implicites sur qui peut transmettre quoi, à qui, et dans quel cadre.

L’analyse — Ce travail ne montre pas un franchissement de capacité vers l’AGI. Il documente plutôt un plafond de fiabilité pour des agents déjà polyvalents. C’est utile pour la chronologie AGI, car la trajectoire actuelle mise beaucoup sur les agents généralistes. Si ces agents accomplissent des tâches variées mais échouent souvent sur les frontières contextuelles, alors l’extension de leurs permissions devient un risque de gouvernance. Le point important est que les fuites restent présentes en exécution complète, pas seulement dans des tests abstraits. Cela suggère que l’orchestration multi‑applications crée une surface de risque distincte des erreurs de raisonnement pures. La question reste alors ouverte : faut‑il d’abord augmenter l’autonomie des agents, ou durcir les garde‑fous qui limitent ce qu’un agent généraliste peut voir et transmettre ?