Capacités autonomes de pénétration cyber en hausse chez les agents
Le 11 juin, un article arXiv a présenté une nouvelle évaluation des capacités de pénétration autonome de systèmes pilotés par grands modèles de langage. Les auteurs construisent 300 serveurs cibles en deux niveaux de difficulté et utilisent une architecture agentique généraliste avec des outils cyber non spécialisés. Ils testent 19 modèles ouverts et propriétaires. Les taux de réussite vont de 10,7 % à 69,3 %. Les auteurs affirment aussi que la capacité de pénétration progresse avec l’amélioration générale des modèles.
Ce résultat est pertinent pour la chronologie AGI parce que la cybersécurité offensive sert souvent de domaine sentinelle. Elle combine planification, usage d’outils, adaptation à l’environnement et persistance multi-étapes. Une amélioration régulière sur ce type de tâche donne un signal sur l’extension des capacités agentiques générales, même si elle ne démontre pas l’AGI. Elle intéresse aussi les débats de gouvernance, car l’autonomie offensive fait partie des lignes rouges fréquemment invoquées par les laboratoires frontier.
L’analyse appelle cependant de la prudence. Le benchmark mesure une famille de tâches spécialisée, même si elle mobilise plusieurs compétences générales. Il montre une montée de capacité dans un domaine à fort impact, pas une intelligence générale établie. En même temps, les niveaux atteints rendent plus concrète la question du contrôle d’accès, de l’évaluation avant déploiement et des garde-fous sur les agents outillés. La tension est nette: comment élargir les usages défensifs de ces systèmes sans banaliser des capacités offensives de plus en plus autonomes ?