Séparation mesurée entre recherche en safety et en éthique IA

Le 10 décembre 2025, un article de recherche publié sur arXiv étudie les relations entre deux communautés. La première travaille sur la safety, centrée sur l’alignement, les comportements trompeurs et le risque existentiel. La seconde travaille sur l’éthique, centrée sur les biais, les préjudices actuels et les conditions de production. Les auteurs analysent 6 442 articles issus de douze conférences majeures en apprentissage automatique et traitement du langage, entre 2020 et 2025. Ils concluent que plus de 80 % des collaborations ont lieu à l’intérieur d’un seul des deux ensembles. Ils ajoutent qu’environ 5 % des articles concentrent plus de 85 % des liens entre les deux. Selon eux, retirer ce petit groupe de courtiers augmente fortement la ségrégation du réseau. Les auteurs en déduisent que la séparation est institutionnelle autant que conceptuelle.

Ce travail est pertinent pour la trajectoire AGI car l’alignement n’est pas seulement une affaire de méthodes techniques. Il dépend aussi du type de problèmes jugés légitimes, des communautés mobilisées et des lieux où se discutent les priorités. Si safety et éthique avancent en parallèle, les laboratoires et les décideurs risquent de traiter séparément des questions pourtant liées. Les risques extrêmes d’un côté. Les dommages sociaux présents de l’autre. L’étude ne documente pas une avancée de capacité. Elle documente un blocage dans l’organisation du champ. C’est important pour l’AGI parce que les débats sur la gouvernance sont déjà fragmentés. Une partie du secteur parle de perte de contrôle et de systèmes autonomes. Une autre insiste sur les préjudices, les inégalités et les usages institutionnels. Le papier suggère que cette division n’est pas un simple désaccord intellectuel. Elle est stabilisée par les réseaux de collaboration et donc par les incitations académiques. Cela pose une question pratique pour la suite. Peut-on construire des cadres d’alignement crédibles si les communautés qui traitent les risques lointains et les dommages présents travaillent encore largement séparément ?