Anthropic et OpenAI institutionnalisent l’accès sélectif aux modèles cyber
Le 9 juin, Axios a rapporté qu’Anthropic et OpenAI convergent vers un modèle d’accès sélectif pour leurs systèmes cyber les plus capables. Selon l’article, OpenAI applique déjà un programme de trusted access pour certains chercheurs et entreprises de sécurité. Anthropic prépare un dispositif similaire et a élargi l’accès à son programme Mythos Preview à plus de 200 entreprises et entités publiques. L’article décrit aussi une séparation entre versions publiques plus bridées et versions plus permissives pour des utilisateurs sélectionnés.
Ce point est structurant pour la gouvernance des capacités avancées. Il montre que les laboratoires frontier ne se contentent plus d’un choix binaire entre diffusion large et non-déploiement. Ils créent une distribution discriminée selon le profil des usagers. Dans le champ AGI, cette logique compte parce qu’elle délègue à des entreprises privées une part de l’arbitrage sur l’accès à des capacités potentiellement offensives. Elle concerne directement la cybersécurité, souvent vue comme un domaine d’alerte précoce pour les risques des systèmes plus généraux.
Pour la trajectoire AGI, ce n’est pas une preuve de proximité de l’AGI. C’est une évolution de régime institutionnel autour de modèles frontier. Elle suggère que l’évaluation du risque se déplace du modèle seul vers le couple modèle-utilisateur. Mais cela pose une question de gouvernance difficile: sur quelle base des laboratoires privés doivent-ils décider qui accède aux capacités les plus sensibles ?