Annonce publique d’un cadre d’évaluation des risques biologiques

Le 18 juin 2026, Patricia Paskov, Jeffrey Lee, Kyle Brady et Alyssa Worland ont publié un préprint sur l’évaluation des capacités biologiques des agents IA. Le papier ne présente pas un nouveau benchmark unique. Il propose plutôt un cadre pour définir, exécuter, noter et documenter des évaluations agentiques en biologie. Les auteurs insistent sur un point simple. Deux évaluations apparemment proches peuvent impliquer des niveaux de risque très différents selon leur conception.

Dans le débat AGI, ce type de travail compte surtout du côté gouvernance et alignement. Les systèmes agentiques sont de plus en plus présentés comme capables d’effectuer des tâches scientifiques en plusieurs étapes. La biologie est un domaine sensible, car la compétence utile et le risque dual peuvent progresser ensemble. Ce texte intervient dans un moment où gouvernements, laboratoires frontier et évaluateurs tiers cherchent des mesures crédibles, au-delà des démonstrations internes.

La portée du papier reste méthodologique, mais elle touche un angle devenu structurant. Un test de risque ne vaut pas seulement par son score. Il vaut par ce qu’il mesure réellement, et par ce qu’il laisse hors champ. Cela suggère que les futurs débats sur les capacités dangereuses dépendront moins d’un chiffre isolé que de protocoles d’évaluation comparables et audités. La question reste donc ouverte. Qui définira les standards d’évaluation quand les laboratoires ont aussi intérêt à contrôler le récit sur leurs propres risques ?