Rapport d’index jugeant insuffisantes les stratégies existentielles des laboratoires

Le 3 décembre 2025, Axios rapporte les conclusions de l’AI Safety Index publié par le Future of Life Institute. Cet organisme évalue régulièrement les pratiques de sécurité des entreprises d’IA les plus avancées. Selon l’édition hiver 2025, aucun grand laboratoire n’obtient une note supérieure à D en sécurité existentielle. L’indicateur porte sur la capacité à prévenir un mésusage catastrophique ou une perte de contrôle des modèles. Anthropic obtient la meilleure note globale, mais reste aussi noté D sur cette dimension. Le rapport souligne que les déclarations publiques des entreprises sur les risques extrêmes ne se traduisent pas encore en stratégies mesurables. Il cite l’absence d’approches fiables sur l’échec d’alignement, la surveillance interne ou le contrôle. Axios indique également un écart croissant entre Anthropic, OpenAI et Google DeepMind d’un côté, et xAI, Meta, DeepSeek ou Alibaba Cloud de l’autre.

Cet article est important car il apporte une évaluation extérieure comparée des laboratoires frontier. La plupart des débats AGI reposent sur les annonces des entreprises elles-mêmes. Ici, un acteur tiers essaie de mesurer si leurs dispositifs suivent réellement l’élévation des risques qu’elles déclarent. C’est une pièce rare dans un domaine où la transparence reste limitée. Le fait saillant n’est pas seulement la mauvaise note. C’est le type de décalage qu’elle formalise. Plusieurs laboratoires affirment viser une intelligence générale ou au moins des systèmes proches de la dépasser. Plusieurs reconnaissent aussi publiquement des risques extrêmes. Pourtant, selon cet index, ces mêmes laboratoires ne montrent pas encore de plan robuste de prévention de la perte de contrôle. Cela renforce une tension déjà visible en 2025. Les capacités avancent dans un cadre où l’évaluation indépendante reste faible et partielle. Il faut toutefois garder une prudence. L’index provient d’un organisme engagé dans le débat sur les risques existentiels. Mais même en tenant compte de ce contexte, le signal reste utile. Il pose une question difficile. Comment interpréter des ambitions AGI croissantes si les mécanismes vérifiables de sécurité demeurent jugés insuffisants par les évaluateurs externes ?