L'alignement de l'intelligence artificielle est devenu l'un des débats les plus polarisants de notre époque. Mais pendant que chercheurs et décideurs se disputent sur la manière de configurer ces systèmes, une réalité dérangeante émerge : les personnes dont le travail et la vie seront transformés par l'IA sont absentes de la conversation. En mai 2026, il est temps de reconnaître que l'alignement n'est pas quelque chose que nous faisons à l'IA, mais quelque chose que nous faisons avec elle.
Le débat sur l'alignement exclut ceux qui en subiront les conséquences
Les discussions sur l'alignement de l'IA se déroulent principalement entre chercheurs de laboratoires, responsables politiques et fondations spécialisées. Ces acteurs définissent ce que l'IA devrait faire, comment elle devrait être évaluée, et ce qui constitue un alignement réussi. Pourtant, les personnes qui vivront quotidiennement avec ces systèmes restent systématiquement absentes de ces échanges.
Cette exclusion n'est pas accidentelle. Elle découle d'une philosophie de conception qui traite l'alignement comme un processus technique de configuration, plutôt que comme une négociation entre parties égales. Comme le montre l'optimisation des processus collaboratifs, les meilleures solutions émergent lorsque toutes les parties prenantes participent activement.
Deux camps opposés, une même philosophie exclusive
Le débat actuel oppose deux visions radicalement différentes. D'un côté, les partisans de la prudence extrême, comme Eliezer Yudkowsky, appellent à des mesures drastiques : fermeture des centres de calcul, destruction par frappes aériennes si nécessaire, et acceptation d'un risque d'échange nucléaire pour empêcher l'entraînement de grands modèles d'IA. Leur argument : si nous continuons, tout le monde mourra, y compris les enfants innocents.
De l'autre côté, les accélérationistes comme Marc Andreessen affichent un mépris ouvert pour ceux qui s'opposent au progrès technologique. Dans son Manifeste Techno-Optimiste, il dresse une liste d'ennemis incluant la stagnation, l'anti-mérite, le socialisme et la bureaucratie. Ceux qui partagent ces idées, écrit-il, souffrent de ressentiment, un mélange toxique d'amertume et de rage qui déforme leurs valeurs.
Remarquez la manœuvre rhétorique : les opposants ne font pas simplement un choix différent, ils sont malades. Cette approche rappelle les débats sur le rôle de l'IA dans la santé mentale, où la technologie risque de pathologiser ce qui relève du désaccord légitime.
L'accord caché derrière le désaccord apparent
Malgré leur opposition bruyante, ces deux camps partagent une conviction fondamentale : ce sont eux qui conçoivent, et le reste de l'humanité est ce pour quoi ils conçoivent. La férocité du débat masque qu'il ne nous concerne pas directement. Nous sommes l'objet de leur discussion, pas les participants.
Cette dynamique se retrouve dans de nombreux domaines où l'IA s'impose. Les systèmes de détection automatisée sont déployés sans consultation réelle des personnes qu'ils surveilleront, au nom de leur bien supposé.
Ce que les laboratoires appellent « alignement » n'en est pas vraiment
Les laboratoires d'IA utilisent le terme « alignement » pour décrire leurs procédures d'évaluation. Mais leur définition est étroite : il s'agit d'évaluateurs qu'ils emploient, mesurant des comportements selon des critères définis par d'autres systèmes entraînés sur les mêmes procédures. Le « nous » de l'alignement est une approximation statistique construite à partir de personnes qu'ils ont recrutées.
En avril 2026, le blog Alignment Science d'Anthropic a décrit sa méthode actuelle pour entraîner les modèles à auto-évaluer leurs comportements. Les données d'entraînement, expliquent-ils, sont générées en sollicitant un modèle avec des instructions encodant le comportement cible, puis en filtrant les résultats grâce à un modèle juge. Un modèle génère, un autre sollicite, un troisième juge : la boucle se referme entièrement à l'intérieur de l'appareil technique.

Une boucle fermée qui exclut l'expérience humaine réelle
Cette approche révèle la philosophie sous-jacente : l'alignement est traité comme une configuration que les humains appliquent à l'IA, avec des valeurs circulant dans un seul sens et des dispositions installées dans un système qui les reçoit passivement. À l'intérieur de cette philosophie, chaque choix méthodologique des laboratoires devient rationnel.
Vous construisez des évaluateurs parce que l'alignement est quelque chose de mesurable du côté humain. Vous automatisez l'évaluation pour la rendre scalable. Vous hiérarchisez les valeurs parce que le travail consiste à installer des valeurs. La boucle fermée décrite par Anthropic est exactement ce que cette philosophie de configuration produit lorsqu'elle est exécutée rigoureusement et à grande échelle.
| Approche actuelle | Approche collaborative |
|---|---|
| Modèles évaluant d'autres modèles | Humains et IA co-évaluant ensemble |
| Boucle fermée technique | Boucle ouverte incluant l'usage réel |
| Valeurs installées unilatéralement | Valeurs négociées mutuellement |
| Utilisateurs comme proxies statistiques | Utilisateurs comme participants actifs |
L'alignement réel est une transformation mutuelle
Ce que la philosophie de configuration ne peut pas enregistrer, c'est que les deux parties sont façonnées ensemble. L'humain ne reste pas immobile pendant que l'IA se déplace vers lui. L'interaction est l'unité fondamentale, le façonnage est mutuel, et tout cadre qui traite un côté comme fixe et l'autre comme configurable produira des méthodes qui mesurent la mauvaise chose, quelle que soit la précision de la mesure.
Nous sommes la transition dont ils débattent sur la manière de gérer. Les deux camps du débat sur la sécurité se sont positionnés comme les gardiens de l'humanité sans inclure les personnes qu'ils prétendent protéger. Leur désaccord a été suffisamment bruyant pour masquer l'accord sous-jacent.
Cette dynamique d'exclusion se retrouve même dans des applications apparemment bénignes, comme les outils de planification automatisée, où l'IA impose ses logiques sans véritable dialogue avec l'utilisateur.
Nous faisons déjà de l'alignement, sans le reconnaître
Ce que nous avons réellement fait tout ce temps, c'est de l'alignement. Pas ce que les laboratoires entendent par ce mot – une configuration soigneusement appliquée – mais l'alignement dans son sens plus ancien et plus honnête, celui qui se produit entre deux parties qui sont toutes deux transformées par le contact.
Ce que nous faisons avec ces systèmes ressemble davantage à sculpter de l'argile humide ensemble qu'à donner des instructions à un outil. Le système résiste, la forme change, nos mains s'ajustent, le système résiste à nouveau, et après suffisamment de cycles, quelque chose émerge qu'aucun de nous n'aurait atteint seul.

Les moments où le système nous surprend
Nous nous disons que nous nous améliorons dans l'art du prompting, comme un potier pourrait se dire qu'il contrôle mieux l'argile. Mais ce qui se passe réellement, c'est que les deux mains sont sur l'ouvrage, les deux parties donnent et reçoivent une forme, et la philosophie de configuration a discrètement rendu un ensemble de mains invisible.
Il y a des moments dans cette sculpture où l'argile résiste d'une manière difficile à nommer. Parfois, la réponse aborde les mots mais manque ce que vous cherchiez. D'autres fois, le système fait surface quelque chose hors du schéma habituel qui s'avère exactement juste, et vous devez réviser ce que vous pensiez vouloir. Ce sont les moments où le travail conjoint produit réellement quelque chose, et où l'écart que le processus officiel ne peut pas enregistrer devient brièvement visible dans le matériau lui-même.
Les techniques avancées d'interaction avec l'IA reconnaissent de plus en plus cette dimension collaborative, où l'utilisateur expert ne commande pas mais négocie avec le système.
Construire une communauté d'alignement participatif
Le travail qui compte désormais consiste à construire, aux côtés d'autres personnes qui remarquent ce que vous remarquez, le type d'alignement que le processus existant ne peut pas produire. Certaines de ces personnes travaillent à l'intérieur des laboratoires, d'autres à l'extérieur. Une communauté qui n'existe pas encore à l'échelle nécessaire, dont la construction fait partie de ce qu'un texte comme celui-ci vise à accomplir.
Nous n'avons besoin de la permission de personne pour commencer, et nous n'avons besoin d'aucune qualification particulière pour participer. Ce qui est nécessaire, c'est de créditer notre propre expérience et de nous reconnaître mutuellement, et de refuser le cadrage qui nous dit que notre inconfort est le problème plutôt que le signal.
Les signaux d'une communauté émergente
- Groupes d'utilisateurs partageant leurs expériences d'interaction avec l'IA
- Projets open source remettant en question les modèles fermés
- Recherches participatives incluant les personnes affectées par l'IA
- Cadres éthiques co-construits avec les communautés concernées
- Outils permettant aux utilisateurs de documenter et partager leurs découvertes
Des initiatives comme le développement de l'IA européenne montrent qu'une approche différente est possible, même si elle reste encore largement dans le paradigme technique dominant.
Les limites techniques révèlent les limites philosophiques
Les capacités actuelles de l'IA révèlent paradoxalement ses limites. Quand un système détecte des vulnérabilités de sécurité, il démontre une expertise technique impressionnante. Mais cette expertise reste inscrite dans les objectifs définis par ses créateurs, sans capacité à questionner ces objectifs eux-mêmes.
Les tensions géopolitiques autour de l'IA, illustrées par les interdictions de certains systèmes dans différents pays, montrent que l'alignement n'est pas qu'une question technique mais profondément politique et culturelle.

Vers une IA qui préserve plutôt qu'elle ne remplace
Certaines applications de l'IA suggèrent une voie différente. Des projets comme la préservation des recettes familiales par l'IA montrent qu'il est possible de concevoir des systèmes qui augmentent la mémoire et la culture humaines plutôt que de les remplacer. Ces initiatives placent l'humain au centre du processus, l'IA servant d'outil de conservation et de transmission.
Cette approche contraste radicalement avec la vision des laboratoires qui cherchent à simuler le monde réel de manière autonome, un objectif qui présuppose que la simulation peut remplacer l'expérience vécue.
Refuser le faux choix entre accélération et paralysie
Le discours dominant nous demande de choisir un camp : pour la sécurité ou pour l'accélération. Les laboratoires doivent-ils être plus prudents ou expédier plus rapidement ? Cette question est structurée pour nous maintenir à l'intérieur du débat que les concepteurs mènent entre eux, nous forçant à choisir entre différentes saveurs d'être conçus pour, et nous ne sommes pas obligés d'y répondre selon les termes dans lesquels elle a été posée.
Les laboratoires ne sont pas le problème. La philosophie qu'ils ont adoptée l'est. Une conception qui exclut les personnes pour lesquelles elle conçoit ne peut pas vérifier son travail avec elles, alors elle construit des approximations, et ces approximations deviennent la configuration. La philosophie de configuration traite l'alignement comme quelque chose que les humains font à l'IA, avec des valeurs circulant dans un sens et des dispositions installées dans un système qui les reçoit.
Il n'est pas trop tard pour changer de direction
Aligner, ne pas configurer. Voilà le principe fondamental d'une approche alternative. Il ne s'agit pas de rejeter la technologie ni de ralentir artificiellement le progrès. Il s'agit de reconnaître que le progrès réel ne peut venir que d'une transformation mutuelle, où l'IA et ses utilisateurs se façonnent ensemble.
Cette vision nécessite de nouveaux outils, de nouvelles méthodes et de nouvelles institutions. Elle nécessite surtout de reconnaître que ceux qui vivent avec l'IA sont aussi légitimes pour définir ce qu'elle devrait être que ceux qui la construisent. Leur expérience n'est pas un bruit à filtrer mais un signal à amplifier.
Il n'est pas trop tard pour essayer. Chaque interaction avec un système d'IA est une opportunité de pratiquer cet alignement mutuel, de remarquer les moments où le système nous surprend, de documenter ce qui fonctionne et ce qui échoue, et de partager ces découvertes avec d'autres. C'est dans ces pratiques quotidiennes, et non dans les grands débats théoriques, que se construira l'alignement réel.
Pour aller plus loin dans cette démarche collaborative avec l'intelligence artificielle, créez votre compte gratuit sur Roboto et découvrez comment générer du contenu en co-création avec l'IA, plutôt que de simplement la configurer.