Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

Le danger d’une IA utilisée par la justice

Les systèmes algorithmiques nécessitent une supervision humaine continue. Les « hallucinations » ou erreurs, peuvent totalement annuler les gains de temps annoncés pour les tribunaux. Oleg Troino

Au Royaume-Uni, des directives suggèrent que les juges pourraient utiliser l’IA pour des travaux préparatoires. L’Estonie utilise un système d’IA semi-automatisé pour les recouvrement de petites créances. En Allemagne, un système est testé pour des litiges relatifs aux droits des passagers aériens. À Taïwan, l’IA aide les tribunaux dans des affaires de conduite en état d’ivresse ou de fraudes. Pourtant, les arguments en défaveur d’une utilisation de l’IA par la justice sont nombreux et doivent être pris en considération.


En quelques années seulement, l’intelligence artificielle générative a entraîné des changements significatifs dans de nombreux secteurs, de la santé à l’éducation, du divertissement à la finance, et même dans le domaine du droit.

L’utilisation de l’IA dans les décisions judiciaires pose des risques importants pour la justice. Des résultats erronés issus d’informations « hallucinées », des décisions discriminatoires et un manque de transparence font partie des préoccupations liées à l’introduction de cette technologie dans les tribunaux.

Pourtant, un certain nombre de juges à travers le monde l’ont déjà utilisée dans la prise de décision et la rédaction de jugements. C’est pourquoi certaines juridictions, dont le Royaume-Uni, ont publié des lignes directrices à l’intention des juges concernant l’usage de l’IA.

De manière générale, ces directives suggèrent que les juges peuvent utiliser l’IA comme un outil pour effectuer des travaux préparatoires, tels que la rédaction de résumés de documents longs, la traduction de documents juridiques, l’identification de précédents juridiques ou l’amélioration de la lisibilité des documents. Elles déconseillent son utilisation pour les fonctions judiciaires essentielles, notamment la prise de décision.

Récemment, certains hauts responsables judiciaires ont estimé que l’IA pourrait être utilisée pour trancher des affaires « à faible enjeu » ou moins complexes, à condition de prendre des précautions adéquates, comme maintenir un juge humain dans le processus.

Dans un discours prononcé en novembre 2024, le deuxième juge le plus haut placé du Royaume-Uni, Geoffrey Vos, a évoqué un « spectre » de décisions juridiques que l’IA pourrait bientôt prendre, ou contribuer à prendre.

Vos a déclaré que l’utilisation de l’IA pour des « décisions largement mécaniques, comme celles concernant le montant d’une pension ou de prestations, ou le calcul des dommages corporels et des pertes de revenus » permettrait probablement d’économiser du temps et de l’argent. Mais il a appelé à une réflexion sur la question de savoir si une telle utilisation violerait des droits humains fondamentaux.

Un an plus tard, Vos a de nouveau appelé à un « débat sérieux » sur les droits qui devraient être protégés pour les humains dans ce contexte. Il a également insisté sur le fait que l’IA devait être « utilisée de manière responsable, efficace et sûre dans les systèmes et processus juridiques ».

Plusieurs juridictions testent ou utilisent déjà l’IA dans ce type d’affaires « mécaniques ». L’Estonie utilise un système de petites créances semi-automatisé dans les procédures civiles pour des demandes pécuniaires allant jusqu’à 7 000 euros, avec des greffiers humains supervisant le processus.

Le tribunal de district de Francfort, en Allemagne, a testé un système d’IA nommé Frauke pour traiter les litiges relatifs aux droits des passagers aériens. Frauke analyse des affaires et décisions antérieures afin de produire des projets de jugements préconfigurés. Les juges assemblent ensuite les verdicts finaux à partir de ces textes après avoir statué, ce qui réduit considérablement le temps consacré à la rédaction.

Taïwan a expérimenté un outil basé sur l’IA pour aider les tribunaux, notamment en produisant des notifications de décision dans des affaires de conduite en état d’ivresse ou de complicité dans des fraudes. Le système d’IA génère un projet complet de décision comprenant les faits, le raisonnement juridique, les citations et le verdict final. Le juge examine ce projet et, après approbation, peut l’émettre comme jugement officiel, avec ou sans modifications.

Ces exemples montrent clairement que la principale motivation pour remplacer les juges humains dans certaines catégories d’affaires est l’efficacité. Par conséquent, d’autres juridictions explorent également la possibilité d’intégrer l’IA générative afin de statuer sur certains litiges sans intervention de juges humains.

Le coût de l’utilisation de l’IA générative comme juge

Les tribunaux sont surchargés, et des technologies comme l’IA générative promettent cohérence et efficacité. Mais cela représenterait un changement majeur par rapport à des pratiques vieilles de plusieurs siècles. Et cela risque de saper ce que certains juristes considèrent comme un principe fondamental de la justice : le droit d’être jugé par un être humain.

Le jugement d’une affaire ne consiste pas uniquement à parvenir à une décision. Il s’agit d’un processus global et équitable qui inclut le droit d’être entendu – présenter sa défense, mettre en balance des récits contradictoires et exercer un jugement à la lumière du droit et de l’équité.

Les outils algorithmiques, aussi avancés soient-ils, n’entendent ni ne « comprennent » même pas leurs propres productions, encore moins les valeurs humaines ou les contextes sociaux changeants. L’IA générative ne peut pas reconnaître la souffrance, la crédibilité, le remords ou la vulnérabilité comme le ferait un humain. Cela seul la rend inapte à occuper le siège d’un juge.

Classer les affaires comme simples ou complexes peut sembler pragmatique, mais c’est à la fois juridiquement et moralement dangereux. Ce qui constitue une affaire « simple, routinière ou mécanique » est en soi une décision humaine. Les litiges relatifs à des indemnisations ou à des prestations peuvent paraître simples sur le papier, mais elles peuvent avoir des conséquences importantes pour la personne qui saisit la justice.

Attribuer ces affaires à une adjudication algorithmique risque de créer un système judiciaire à deux vitesses – dans lequel un groupe de citoyens peut présenter son affaire devant un juge humain, tandis que d’autres sont traités par des machines. Seuls les premiers, à mon sens, exercent pleinement leur droit à une audience et à un procès équitables devant un tribunal indépendant et impartial, tel que garanti par l’article 6 de la Convention européenne des droits de l’homme.

De plus, l’argument de l’efficacité pourrait s’avérer illusoire. Les systèmes algorithmiques comme l’IA générative nécessitent une supervision humaine continue, des audits et des corrections. Les hallucinations ou erreurs, qu’elles résultent d’une conception défaillante ou de données d’entraînement biaisées, peuvent totalement annuler les bénéfices annoncés.

La confiance du public est essentielle dans tout système juridique. Si les citoyens perdent confiance dans les décisions automatisées, les recours augmenteront – aggravant encore l’arriéré déjà existant des affaires.

Les technologies émergentes comme l’IA générative peuvent être utiles pour gérer l’administration des tribunaux et réduire les charges administratives. Mais remplacer les juges humains, même dans des affaires supposément à faible enjeu, porte atteinte aux principes fondamentaux de la justice. L’efficacité ne devrait pas se faire au détriment des valeurs que le système judiciaire est censé protéger.

The Conversation

Raisul Islam Sourav ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Des villes plus inclusives grâce à l’IA ? Oui, si les communautés gardent la main

L’intelligence artificielle ouvre de nouvelles possibilités pour documenter et planifier l’inclusivité urbaine. Mais peut‑elle vraiment y contribuer sans écraser ce que vivent les gens derrière des modèles qui transforment nos rues en simples scores sur une carte ?


Une ville se comprend souvent à hauteur de trottoir. Un banc bien placé, un passage piéton lisible, un éclairage rassurant, une rampe d’accès, un coin d’ombre ou un arrêt d’autobus protégé peuvent transformer l’expérience quotidienne d’un lieu. À l’inverse, une bordure trop haute, une rue hostile, un parc mal entretenu ou une place où l’on ne se sent pas bienvenu peuvent exclure, parfois sans bruit. Le problème n’est donc pas de demander à l’IA de juger la ville à la place des citoyens, mais de savoir comment l’utiliser pour rendre visibles des formes d’exclusion que les outils classiques détectent mal.

Les espaces publics comme les rues, parcs, places, marchés, bibliothèques et promenades comptent parmi les infrastructures collectives les plus importantes des villes. D’ailleurs, ils occupent environ le tiers du territoire urbain à l’échelle mondiale. Leur valeur n’est pas seulement esthétique. Bien conçus et bien entretenus, ils soutiennent la vie sociale, l’activité économique, la santé, la mobilité et la capacité des citoyens à se rencontrer.

Mais il ne suffit pas qu’un lieu soit officiellement « ouvert à tous » pour qu’il soit réellement accessible, accueillant et sûr pour chacun. Les femmes, les enfants, les personnes âgées, les personnes en situation de handicap, les nouveaux arrivants, les personnes racisées, les personnes pauvres ou celles qui ne maîtrisent pas les codes implicites d’un quartier peuvent vivre la même rue de façons très différentes, notamment selon l’âge, le genre ou le handicap. Ce qui paraît neutre dans un plan d’aménagement peut devenir, dans la vie réelle, une source d’inconfort, de peur, d’évitement ou d’exclusion.


À lire aussi : Les voitures restreignent le droit des enfants de profiter de la ville. Voici des projets qui font la différence


C’est là que l’IA peut devenir utile, non comme solution magique, mais comme outil de diagnostic. Ancrée dans les réalités locales et nourrie par l’expérience des communautés, elle peut aider les villes à mieux voir ce que leurs méthodes classiques laissent dans l’ombre, sans remplacer le jugement humain ni la décision démocratique.


Cet article fait partie de notre série Nos villes d’hier à demain. Le tissu urbain connaît de multiples mutations, avec chacune ses implications culturelles, économiques, sociales et politiques. Pour éclairer ces divers enjeux, The Conversation invite les chercheuses et chercheurs à aborder l’actualité de nos villes.

Pourquoi l’inclusion urbaine ne peut pas rester un idéal abstrait

L’inclusion est devenue un mot central des politiques urbaines. L’objectif 11 des Nations unies demande explicitement de rendre les villes et les établissements humains inclusifs, sûrs, résilients et durables, et insiste sur la planification participative ainsi que sur l’importance de données mieux ventilées pour guider l’action publique. À Montréal, par exemple, la Politique équité, diversité, inclusion et antiracisme de la Ville vise à reconnaître les discriminations systémiques, à renforcer l’équité territoriale et économique et à favoriser une participation publique plus inclusive.

Ces orientations sont nécessaires, mais elles ne suffisent pas. Les inégalités urbaines se vivent dans des gestes ordinaires : aller au travail, traverser une rue, laisser un enfant jouer dehors, attendre l’autobus, participer à une fête de quartier, manifester, se reposer ou flâner sans être soupçonné d’être « hors de sa place ».

Les espaces publics sont aussi des lieux de culture, de sociabilité et de démocratie. Lorsqu’ils excluent, les effets dépassent l’inconfort : ils peuvent toucher la santé, réduire la participation sociale, affaiblir la confiance envers les institutions et priver la collectivité de la contribution de nombreux résidents, notamment parce que ces exclusions influencent les conditions de vie et l’accès aux ressources.

Les méthodes actuelles ne suffisent pas

Les municipalités disposent déjà d’outils pour évaluer leurs rues, leurs parcs et leurs équipements : inspections, consultations publiques, audits d’accessibilité, enquêtes, observations de terrain, données de mobilité. Ces méthodes sont utiles. Elles restent toutefois souvent fragmentaires, coûteuses, ponctuelles et difficiles à déployer à grande échelle.

Elles comportent aussi un angle mort : elles mesurent mieux ce qui est visible et standardisable que ce qui est vécu. Une rue peut respecter certaines normes techniques tout en demeurant peu accueillante pour une personne âgée, peu lisible pour un nouvel arrivant, anxiogène pour une femme qui rentre tard, ou impraticable pour une personne qui se déplace avec une aide à la mobilité. À l’inverse, certains lieux peuvent être très appréciés par des communautés locales pour des raisons que les indicateurs classiques ne captent pas : habitudes, mémoire, usages informels, ambiance, sentiment d’appartenance.

Ces constats posent une question simple : comment mieux évaluer la capacité réelle des espaces publics à accueillir la diversité des populations urbaines ?


À lire aussi : « Pas dans ma cour » : Les deux faces du NIMBYisme québécois


Ce que l’IA peut apporter, et ce qu’elle ne peut pas faire seule

Depuis une quinzaine d’années, les sciences sociales computationnelles combinent sciences sociales, informatique, statistiques, données numériques et modélisation pour repérer, à grande échelle, certains motifs dans les comportements individuels et collectifs, comme l’ont montré les travaux fondateurs du domaine. En ville, elles ne remplacent ni les enquêtes ni l’observation de terrain : elles les complètent.


Déjà des milliers d’abonnés à l’infolettre de La Conversation. Et vous ? Abonnez-vous gratuitement à notre infolettre pour mieux comprendre les grands enjeux contemporains.


Les approches actuelles sont prometteuses, mais risquées. Elles peuvent aider à repérer des régularités urbaines ou à produire des évaluations visuelles comme StreetScore, mais les données peuvent être biaisées, les images de rue ne disent pas tout et un score peut donner une impression de précision tout en effaçant le contexte social, historique et culturel des lieux, comme le rappellent les débats sur les limites des modèles. Une IA pour la ville ne devrait donc jamais être seulement une machine à classer des rues. Elle doit être un outil de discussion, de diagnostic et de responsabilité publique.

Coproduire l’IA avec les communautés

Dans notre étude Street Review menée à Montréal et publiée dans Cities, nous avons combiné recherche participative, évaluations d’images de rue, entretiens, groupes de discussion et apprentissage automatique, dans la continuité d’une première méthode participative publiée dans Habitat International. Vingt-huit résidents ont participé à des entretiens et à l’évaluation d’images, tandis qu’environ 45 000 images de rue Mapillary étaient analysées. L’objectif était de relier les perceptions d’inclusivité à des caractéristiques physiques comme les trottoirs, l’entretien, la verdure, les bancs ou la qualité du bâti.

Les résultats montrent que les perceptions varient selon les groupes, et que des éléments très concrets, notamment la qualité des trottoirs et du bâti, pèsent fortement dans le sentiment d’inclusion, parfois davantage que la seule présence de verdure. Des cartes par profils d’usagers peuvent ainsi faire apparaître des écarts que des moyennes générales masqueraient.

L’enjeu n’est pas seulement de produire une carte. Il s’agit de faire entrer l’expérience vécue dans la manière même dont l’outil est conçu.

Coproduire l’intelligence artificielle signifie que les communautés ne sont pas consultées à la toute fin, une fois le système déjà construit. Elles participent à la définition du problème, au choix des critères, à l’évaluation des images, à l’interprétation des résultats et à la discussion sur les usages acceptables de l’outil.

Dans un cycle de vie participatif de l’IA, cette collaboration se poursuit aussi après le déploiement, car les villes changent, les usages évoluent et les modèles doivent être corrigés lorsqu’ils se trompent ou lorsqu’ils simplifient trop la réalité. Une telle approche peut aider les villes à mieux cibler leurs interventions.


Des garde-fous indispensables

Ces outils ne seront utiles qu’à trois conditions. D’abord, les villes doivent être transparentes sur les données utilisées, les limites des modèles et les décisions qui pourront en découler, car transformer des phénomènes sociaux complexes en mesures mathématiques peut faire perdre un contexte essentiel. Ensuite, les résultats doivent être vérifiés auprès de groupes variés, car un modèle entraîné sur un public restreint peut reproduire ses angles morts. Enfin, la responsabilité politique doit rester humaine : l’IA peut signaler des écarts et soutenir un diagnostic, mais elle ne doit pas décider seule de la valeur d’un lieu ni des communautés qui méritent une intervention.

Une ville inclusive ne se décrète pas par algorithme. Elle se construit par des choix publics.

Mieux voir pour mieux agir

Les villes ont besoin de meilleures données et d’une meilleure écoute. Développée avec les communautés, l’IA peut relier les observations locales à l’échelle métropolitaine, rendre visibles des écarts que les administrations soupçonnent sans toujours pouvoir les mesurer, et reconnaître l’expertise des résidents.

Le défi n’est donc pas de rendre la ville « intelligente » au sens technologique du terme. Il est de la rendre plus attentive, plus responsable et plus juste.

La Conversation Canada

Shin Koseki a reçu des financements des Fonds de recherche du Québec et du Fonds Nouvelle Frontière en Recherche pour les projets associée à l’utilisation de l’IA pour améliorer la qualité de l’espace public.

Rashid Mushkani a reçu un financement du Fonds de recherche du Québec pour ce projet.

Montée des eaux, météo extrèmes : comment de nouveaux systèmes d’IA peuvent aider les villes à mieux se préparer

Notre nouveau modèle d’intelligence artificielle permet de prévoir les ondes de tempêtes extrêmes – ces rehaussements importants du niveau de la mer sur le littoral causés par les vents d’une grande dépression – avec une grande précision, y compris dans les conditions climatiques futures. Ce modèle d’IA fonctionnant rapidement, il peut aider les chercheurs et les professionnels à mieux évaluer les risques d’inondation côtière, et à mieux planifier les mesures d’adaptation.


Le niveau de la mer monte, et avec lui, les risques liés aux événements côtiers extrêmes tels que les ondes de tempête – des élévations temporaires du niveau de la mer causées principalement par des tempêtes, qui comptent parmi les principaux facteurs à l’origine des inondations côtières. Alors que plus de 10 % de la population mondiale vit dans des régions côtières de faible altitude, la combinaison d’une élévation progressive du niveau moyen de la mer et d’événements extrêmes de plus en plus intenses représente une menace croissante.


À lire aussi : Les « médicanes », ces cyclones méditerranéens que le changement climatique va aggraver


Pour les urbanistes et les décideurs politiques chargés des zones côtières, l’enjeu principal ne réside pas seulement dans l’élévation prévue du niveau moyen de la mer, mais aussi dans l’évolution des événements extrêmes, que ce soit en matière de probabilité ou de gravité. En effet, la conception des infrastructures, l’urbanisme et la préparation aux catastrophes reposent sur des scénarios, établis scientifiquement, de tels événements extrêmes.

Cependant, la projection d’événements extrêmes liés au niveau de la mer reste un défi scientifique majeur, car ceux-ci sont le résultat d’interactions complexes et non linéaires entre les marées, les forçages atmosphériques, la dynamique océanique et les caractéristiques côtières locales.

Cela signifie que les incertitudes dans les projections de ces événements extrêmes restent en grande partie non quantifiées. Par exemple, de petites différences dans les hypothèses des modèles peuvent entraîner de grandes différences dans les résultats prévus, en particulier pour les événements extrêmes. Ces incertitudes ont des implications importantes pour les planificateurs, la protection civile et, en fin de compte, la protection des vies humaines et des biens.

À l’heure actuelle, l’efficacité des modèles d’IA ouvre de nouvelles possibilités. En effet, comme ceux-ci peuvent générer des prévisions beaucoup plus rapidement que les modèles basés sur les lois physiques, ils permettent d’explorer de vastes ensembles de scénarios futurs, ce qui serait d’un coût prohibitif si l’on utilisait uniquement des modèles traditionnels (basés sur la physique). Considérer de nombreux scénarios est particulièrement important pour évaluer les risques, car il s’agit de comprendre la probabilité d’événements rares mais catastrophiques.

Une approche combinant IA et physique pour un risque en mutation

Les modèles traditionnels fondés sur la physique, qui utilisent les lois physiques pour représenter le mouvement des eaux côtières, peuvent simuler ces processus en détail, mais ils sont coûteux en matière de calcul, ce qui rend difficile l’exploration d’un large éventail de scénarios futurs et d’incertitudes.

Parallèlement, les systèmes d’intelligence artificielle sont de plus en plus utilisés en sciences du climat, car ils offrent de nouvelles possibilités pour surmonter ces défis.

Cependant, leur fiabilité reste incertaine dans ce contexte, notamment en raison de deux défis majeurs : la représentation limitée des événements extrêmes rares mais à fort impact dans les données d’apprentissage, et la nécessité de généraliser les résultats – de manière robuste – à des conditions climatiques futures qui pourraient différer considérablement de celles observées historiquement.


À lire aussi : Pouvait-on prédire les inondations espagnoles de 2024 ? Le problème de la dérive des données illustré par la climatologie


L’IA et la modélisation physique sont des outils complémentaires : les modèles physiques restent essentiels pour représenter les processus sous-jacents et pour générer les données de haute qualité nécessaires à l’entraînement et à la validation des modèles d’IA, et, en fin de compte, pour instaurer la confiance dans leur homologue IA.

En combinant le réalisme physique des modèles traditionnels avec l’efficacité et la flexibilité de l’IA, les scientifiques développent une nouvelle génération d’outils pour l’évaluation des risques côtiers.

Ces outils seront essentiels pour éclairer les stratégies d’adaptation, aidant les sociétés à mieux se préparer à un avenir où les événements extrêmes liés au niveau de la mer pourraient devenir plus fréquents et plus graves.

Nos résultats suggèrent que l’IA peut être utilisée de manière fiable pour prévoir des événements extrêmes liés au niveau de la mer, rares mais à fort impact. De plus, les modèles d’IA, en permettant la génération rapide de scénarios et des tests de sensibilité, fournissent un nouvel outil pour mieux caractériser ces incertitudes.

Un nouvel « émulateur » d’IA pour la prévision des ondes de tempêtes extrêmes

Dans notre récente étude publiée dans Earth’s Future, nous avons cherché à déterminer si des modèles d’IA peuvent prédire avec précision des événements extrêmes liés au niveau de la mer, lorsqu’ils sont entraînés à émuler les résultats de simulations et de projections fondées sur la physique. En d’autres termes, nos modèles d’IA visent à apprendre à reproduire les résultats de ces modèles plus complexes, mais beaucoup plus rapidement.

Nos résultats montrent que les émulateurs d’IA parviennent à appréhender la dynamique complexe sous-jacente aux ondes de tempête et à reproduire les événements extrêmes avec une grande précision, y compris dans des scénarios futurs, par rapport aux projections disponibles jusqu’au milieu du XXIᵉ siècle.

Pour le démontrer, nous avons développé un cadre permettant d’améliorer la capacité des modèles d’IA à représenter les ondes de tempêtes extrêmes et de vérifier si leurs prévisions restent fiables dans des scénarios futurs.

Nous nous sommes concentrés sur la zone côtière de New York comme étude de cas, car elle est très exposée aux inondations côtières, avec une population dense, des infrastructures critiques et des actifs économiques majeurs – et parce qu’elle a connu des ondes de tempêtes dévastatrices dans l’histoire récente, comme lors de l’ouragan Sandy en 2012, qui a causé de nombreux décès et plus de 60 milliards de dollars (51,9 milliards d’euros) de dommages économiques.

Notre émulateur d’IA s’appuie sur des simulations fondées sur la physique (qui sont issues du Global Tide and Surge Model (GTSM), librement accessibles) non seulement pour l’entraînement, mais aussi pour évaluer sa fiabilité dans différentes conditions climatiques, y compris des scénarios futurs.

Limites actuelles et prochaines étapes

La prochaine étape consiste à tester plus en profondeur la robustesse de ces outils d’IA sur un éventail plus large de scénarios climatiques et à les intégrer dans des cadres opérationnels d’évaluation des risques ainsi que dans des services mondiaux de données climatiques fournissant des informations hydroclimatiques et côtières aux décideurs, tels que l’Aqueduct Flood Risk Analyzer et le Copernicus Climate Data Store.

Plus largement, les modèles d’IA ont le potentiel de répondre à plusieurs besoins critiques en matière d’analyse des risques côtiers, mais d’importantes lacunes subsistent.

Il s’agit notamment d’améliorer et de quantifier rigoureusement leur transférabilité à travers un large éventail de scénarios futurs, de mieux représenter les incertitudes associées aux paramètres physiques intégrés dans les données d’apprentissage, et d’évaluer dans quelle mesure ces modèles se généralisent à différentes localisations géographiques.

Il sera essentiel de clarifier les limites de leurs capacités d’extrapolation pour renforcer la confiance dans leur utilisation à des fins de prise de décision, en particulier dans des conditions inédites, dues au changement climatique et à la non-stationnarité (c’est-à-dire les changements de régimes climatiques et des phénomènes extrêmes plus intenses que ceux observés auparavant), et qui se situent donc en dehors de la fourchette couverte par les observations passées ou les simulations fondées sur la physique que nous avons utilisées pour entraîner les modèles d’IA.


Le mécénat scientifique d’AXA fait désormais partie du Fonds Axa pour le progrès humain, qui regroupe les engagements philanthropiques du Groupe et des mutuelles d’assurance Axa dans les domaines de la science, de la nature, de la solidarité et de la culture. Avant 2025, ce mécénat scientifique global était assuré par le Fonds Axa pour la recherche, qui a soutenu plus de 750 projets à travers le monde depuis sa création en 2007. Pour en savoir plus, rendez-vous sur Fonds Axa pour le progrès humain.

The Conversation

Andrea Ficchì a reçu une bourse de recherche postdoctorale du Fonds AXA pour la Recherche (aujourd'hui Fonds Axa pour le progrès humain) dans le cadre de l'appel à candidatures lancé conjointement par le Fonds AXA pour la Recherche et la Commission Océanographique Intergouvernementale de l'UNESCO à l'occasion de la Décennie de l'Océan.

Emiliano Longo est membre de la CMCC Foundation (Euro-Mediterranean Center on Climate Change). Il a reçu des financements de Politecnico di Milano.

Perdre son emploi à cause de l’IA ? Anticiper ne protège pas la santé mentale

Un homme, ou une femme, averti en vaut-il, ou elle, vraiment deux quand on évoque l’impact d’un licenciement sur la santé mentale des personnes ? Rien n’est moins sûr, selon une étude menée pendant vingt ans en Australie. Si les résultats sont transposables, estimer ou non que l’IA détruira son emploi a peu d’impact. En revanche, retrouver vite un emploi contribue à la restauration du bien-être psychique des individus.


L’idée que l’intelligence artificielle va détruire des millions d’emplois s’est imposée dans le débat public. L’Organisation de coopération et de développement économiques (OCDE) estime que 27 % des emplois sont exposés à un risque élevé d’automatisation, et trois travailleurs sur cinq déclarent craindre de perdre leur emploi dans les dix prochaines années.

Voilà pour les chiffres, mais qu’en est-il de leur impact sur les personnes et leur santé ? Voir venir la perte de son emploi serait, en soi, une source importante de souffrance psychologique. Les mois passés à appréhender l’échéance pèseraient lourd sur la santé mentale, peut-être autant que la perte elle-même.

Dans une nouvelle étude publiée dans la revue Social Science & Medicine, nous comparons les trajectoires de santé mentale de personnes qui ont anticipé leur licenciement à celles qui ne l’avaient pas anticipé. Le résultat surprend : les deux groupes suivent des trajectoires très proches, avant comme après la perte d’emploi.

Il y a donc deux questions bien distinctes : l’effet de la perte d’emploi sur la santé mentale, et l’effet d’anticiper cette perte d’emploi. La première est bien documentée. Perdre son emploi dégrade la santé mentale, à la fois parce que le revenu chute et parce que le travail est souvent source d’accomplissement alors que le chômage reste socialement stigmatisant. La seconde est plus disputée. De nombreuses études observent un déclin de la santé mentale dans les mois précédant un licenciement et l’attribuent à un effet d’anticipation.


À lire aussi : L'IA générative ne détruira pas votre emploi mais elle va changer profondément votre métier


Dégradation des conditions de travail

Faute d’informations sur le niveau effectif des anticipations, jusque-là, ces études ignoraient si les individus anticipaient réellement leur licenciement. Or, le déclin de la santé mentale avant le licenciement peut aussi refléter des dynamiques antérieures – conditions de travail qui se détériorent, restructurations silencieuses, climat anxiogène – qui pèsent sur la santé mentale indépendamment de toute anticipation des individus vis-à-vis de leur propre emploi.

Nous mobilisons 22 vagues annuelles (2001–2022) de l’enquête HILDA, un panel représentatif qui suit les mêmes individus dans le temps en Australie. La santé mentale est mesurée à l’aide de l’indice SF-36, un outil clinique validé qui s’étend de 0 à 100. Notre échantillon comprend 14 195 personnes et 4 251 licenciements. L’enquête enregistre le trimestre exact du licenciement, ce qui permet d’examiner finement les trajectoires sur les trimestres précédant et suivant l’événement.

Surtout, HILDA demande chaque année aux personnes en emploi quelle probabilité, mesurée de 0 à 100 %, elles attribuent à la perspective d’être licenciées dans les douze mois suivants. Cette mesure subjective nous permet de distinguer ceux qui anticipent leur licenciement – c’est-à-dire qui déclarent une probabilité non nulle – de ceux qui ne l’anticipent pas, c’est-à-dire qui déclarent une probabilité nulle.

Notre démarche est comparative et non causale. Les personnes qui anticipent et celles qui n’anticipent pas peuvent différer sur des dimensions non observées, et les déclins observés avant le licenciement peuvent refléter des facteurs partagés, comme une dégradation de la situation de l’entreprise, plutôt que l’anticipation elle-même.

Avant et après : des trajectoires comparables

Dans les mois précédant le licenciement, les deux groupes affichent un déclin de santé mentale. Chez les personnes qui n’anticipaient pas, l’indice SF-36 baisse d’environ 2,1 points dans le trimestre précédant immédiatement la séparation. Chez celles qui anticipaient, la baisse est de 1,2 point sur la même période. Les ordres de grandeur sont proches, et les tests statistiques ne permettent pas de conclure à une différence significative entre les deux groupes.

Ce résultat invite à reconsidérer une interprétation courante : la dégradation de la santé mentale prélicenciement documentée dans la littérature ne traduit pas seulement une anticipation individuelle. Elle apparaît aussi chez des personnes qui, dans les mois précédant la perte, jugeaient leur risque de licenciement nul. D’autres mécanismes sont vraisemblablement à l’œuvre – dégradation des conditions de travail, tensions internes, restructurations précédant licenciement.

Une fois le licenciement intervenu, les trajectoires divergent fortement, non pas selon l’anticipation, mais selon le retour à l’emploi. Les personnes qui retrouvent rapidement un emploi voient leur santé mentale revenir à son niveau habituel en quelques trimestres, qu’elles aient anticipé leur licenciement ou non. Celles qui restent au chômage continuent en revanche à souffrir : leur indice SF-36 reste inférieur à son niveau habituel un an après la perte d’emploi.

Arte, 2026.

Comment préparer la vague de l’IA ?

Là encore, l’anticipation ne change presque rien. Cumulée sur les quatre trimestres qui précèdent et ceux qui suivent la perte d’emploi, la baisse de l’indice SF-36 atteint 14 points pour celles qui n’avaient pas anticipé et 14,4 points pour celles qui avaient anticipé. Cet écart est trop faible pour qu’on puisse y voir une véritable différence. Les conclusions sont les mêmes pour les hommes et pour les femmes, et se retrouvent aussi quand on remplace l’indice SF-36 par une mesure de satisfaction de vie.

Notre étude porte sur des licenciements survenus dans l’Australie des deux dernières décennies, pas sur des licenciements liés à l’IA. Mais ses enseignements éclairent les inquiétudes actuelles. L’idée selon laquelle voir venir la perte de son emploi constituerait, en soi, le principal facteur de détresse psychologique ou, au contraire, serait propice à une meilleure préparation et donc à un rebond plus rapide, mérite d’être nuancée. Dans nos données, ce qui pèse le plus, c’est la perte elle-même et, surtout, la rapidité avec laquelle on retrouve un travail.

Cela suggère que les politiques visant à atténuer le coût psychologique des transformations technologiques gagneraient à mettre l’accent moins sur la gestion de l’angoisse anticipée et davantage sur les trajectoires de retour à l’emploi : formation, accompagnement, intermédiation. C’est dans la trajectoire d’emploi, plus que dans l’anticipation, que se joue la santé mentale des travailleurs licenciés.

The Conversation

Nicolas Herault a reçu des financements de l'Agence nationale de la recherche (ANR), du Ministère de l'Enseignement supérieur, de la Recherche, de l'IdEx Université de Bordeaux et du GPR HOPE.

Daniel Nettle a reçu des financements de l'Agence Nationale de la Recherche (ANR, France) ainsi que le National Institute for Health and Care Research (NUHR, UK).

L’IA ne menace pas de la même manière tous les emplois. Elle risque de reproduire les discriminations existantes

En appréhendant de manière globale, l’impact éventuel de l’intelligence artificielle, une partie du problème est esquivé. À commencer par la façon dont chacun perçoit l’IA : si, pour certains salariés, c’est une menace inquiétante ; d’autres personnes y voient d’abord une opportunité à saisir. L’impact global dépendra aussi de l’ensemble de ces micro-ajustements.


À chaque révolution technologique, la question de son impact sur l’emploi est posée avec plus ou moins de finesse. L’accélération récente des outils d’intelligence artificielle ne fait pas exception. L’étude que l’OCDE a publiée récemment s’intéresse ainsi à l’effet de l’introduction de l’IA sur les inégalités salariales. Réalisée dans 19 pays de l’OCDE sur la période allant de 2014 à 2018, ce travail statistique indique que l’IA n’a pas eu d’influence sur les inégalités salariales entre les professions, d’un métier à l’autre au cours de cette période et dans les pays concernés par l’étude.

Or, il s’agissait d’une période où l’influence de l’IA sur le marché de travail était encore limitée. Cette influence sera de plus en plus grande dans les années à venir.


À lire aussi : Un robot m’a pris mon stage : l’impact de l’IA sur l’entrée des jeunes dans le monde du travail


Une réduction des écarts de productivité

Le résultat global de l’OCDE mérite cependant d’être nuancé. Certains éléments indiquent une réduction des inégalités salariales entre les différentes professions : l’utilisation de l’IA contribue à diminuer les différences salariales.

Cela pourrait suggérer que l’introduction de l’IA réduit les écarts de productivité entre les individus, ce qui se refléterait ensuite dans les salaires. Toutefois, la conclusion de cette étude incite à la prudence. « L’extrapolation au contexte actuel doit donc être faite avec prudence », précisent les auteurs.

Au-delà des inégalités pour ceux qui conservent leur emploi, l’IA pose la grande question déjà évoquée de l’impact de la technologie sur le niveau de l’emploi. Le sociologue Eric Dahlin a constaté dans une des premières études consacrées à cette thématique que les professions intellectuelles et celles qui requièrent une expérience technique (traducteur, ingénieur, architecte) sont davantage susceptibles d’être menacées par l’IA que des professions dont le niveau de créativité est élevé, comme celles des universitaires ou des médecins.

Pour cela, il a soumis à un échantillon de 951 personnes un questionnaire où il leur était demandé par exemple « Avez-vous perdu votre job à cause de l’IA » ou « Avez-vous peur de le perdre à cause de l’IA ? ».

D’autres études vont dans le même sens, par exemple pour l’Espagne.

Pour revenir à l’étude d’Eric Dahlin, le sociologue a étudié en 2023 ce sujet aux États-Unis. Il ressort de son enquête que certaines tâches cognitives des cols blancs sont mieux exécutées par l’IA que par un humain comme, par exemple, les tâches de traduction des textes.

La qualité de ces traductions est telle que des chercheurs peuvent en bénéficier en demandant une dernière correction du texte traduit par l’IA aux traducteurs. L’emploi d’une part de ces professionnels hautement qualifiés (parmi lesquels on compte traducteurs, comptables, analystes financiers…) est donc menacé.

Des compétences encore protégées

À l’inverse, d’autres emplois à contenu intellectuel seraient moins menacés. L’exercice du métier de médecin ou de certains scientifiques… requiert des compétences difficilement mobilisables par une IA pour le moment. Il s’agit de capacités d’analyse créative pour prendre des décisions singulières et ou résoudre des problèmes.

Quand un médecin explique des données de santé à ses patients ou qu’un scientifique explique des faits empiriques à des étudiants à l’aide d’arguments complexes, ils peuvent être difficilement remplacés par une IA. Quand bien même, une partie de leur tâche peut être exercée par une IA, la plupart d’entre elles nécessitent des compétences difficilement exécutables par des machines.

Les conclusions sur le lien entre l’IA et l’emploi doivent donc être nuancées. Si elles sont vraies d’un point de vue macro, la réalité au cas par cas dépend d’autres facteurs. Les discriminations existant actuellement sur le marché du travail peuvent avoir un effet sur les emplois qui sont et seront ou non menacés.

L’impact des discriminations

Ainsi, l’impact de l’intelligence artificielle sur le marché du travail doit prendre en compte les discriminations existantes fondées sur le sexe, l’origine ethnique et le statut socio-économique. Une partie croissante des individus de ces groupes, estimée à 10 % des travailleurs par la Commission européenne, est cantonnée à des emplois à temps partiel ou temporaire dans l’économie des petits boulots, sans possibilité d’ascension sociale.

Les plateformes numériques, telles qu’Airbnb et Uber, sont devenues des sources de revenus et de services. Il existe toutefois des preuves d’une polarisation du marché du travail, si l’on se concentre sur les différents niveaux d’éducation et d’âge. Les travailleurs moyennement qualifiés apparaissent comme les plus concernés lorsque l’IA entraîne une perte d’emplois.

BFM Business, 2025.

L’IA une opportunité pour certains

Ces différences de statut sur le marché du travail s’accompagnent d’évaluations divergentes à propos de l’IA. Considérée comme une menace par les groupes défavorisés, elle est perçue comme un défi pouvant être relevé par les groupes privilégiés. Les résultats du sociologue Dahlin montrent ainsi qu’il existe une différence entre la crainte de perdre son emploi et la perte effective d’emploi due à l’IA. L’adaptation au marché du travail est donc exigée et détermine le résultat face aux exigences relevant du secteur économique où des choix sont réalisés par les entreprises et les employeurs.

Même si certaines tâches des cols blancs peuvent être remplacées par des machines, les cadres et une partie des employés qualifiés peuvent changer rapidement d’emploi, s’ils ont la capacité de s’adapter.

À l’inverse, de ceux qui ne disposent pas du capital social ou culturel nécessaire pour trouver un autre emploi. Un rapport) va jusqu’à affirmer que certains employés occupant des postes exposés à l’IA s’attendent à ce que l’IA les aide plutôt que de leur nuire.

The Conversation France/Canalchat 2026.
The Conversation

Ulrike Schuerkens ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

L’IA marchande, nouvel objet transitionnel et instrument de prolétarisation des consommateurs

Pour rassurer et guider le consommateur, la marque a eu un rôle de repère cognitif. C’est d’ailleurs l’un des dispositifs « inventé » par le capitalisme pour stimuler la consommation. En mobilisant des outils d’intelligence artificielle, il ne s’agit pas seulement d’une puissance décuplée, mais d’un changement de nature qui, très rapidement, rejaillit sur le consommateur. Bienvenue (ou pas) dans l’ère de l’empathie artificielle au service de la médiation marchande.


Les outils d’intelligence artificielle ne se contentent plus d’orienter nos achats. Ils répondent, accompagnent et… peuvent même rassurer. À mesure que les interfaces marchandes deviennent conversationnelles, une question se pose : sont-elles en train d’occuper, pour des consommateurs fragilisés, une place psychique, à savoir une fonction de réassurance, de stabilisation identitaire et de médiation affective face à l’incertitude du monde autrefois assumée par certains objets, notamment les marques ?

Longtemps, les dispositifs marchands ont surtout cherché à capter l’attention, orienter le choix et accélérer la décision d’achat. Avec l’essor des interfaces conversationnelles et des outils d’intelligence artificielle, un déplacement s’opère. Il ne s’agit plus seulement de rendre la transaction plus efficace, mais de produire les formes d’une présence attentive et rassurante. L’interface ne se contente plus d’informer : elle reformule, accompagne et rassure. Cette évolution prend place dans un contexte de fragilité psychologique croissante des individus.

Ce qui se transforme ici n’est pas seulement la technique de vente, mais la nature même de la médiation marchande. L’acte d’achat prend alors la forme d’une interaction continuelle, plus fluide, et plus enveloppante. Les recherches récentes sur les compagnons numériques montrent d’ailleurs que les interfaces d’IA sont de plus en plus présentées comme des amis, des conseillers ou des partenaires émotionnels.


À lire aussi : Shopping en ligne : comment Shein, Temu et les autres utilisent l’IA pour vous rendre accro


Au-delà du doudou

Pour comprendre ce qui se joue, la notion d’objet transitionnel élaborée par le psychanalyste Donald Winnicott s’avère précieuse. Encore faut-il ne pas la réduire à l’image un peu rapide du doudou rassurant. Chez Winnicott, l’objet transitionnel apparaît dans un moment très précis du développement : lorsque l’enfant commence à faire l’expérience que la mère n’est pas la prolongation immédiate de son désir, qu’elle ne coïncide pas parfaitement avec lui, qu’elle est extérieure, intermittente, séparée. L’objet transitionnel (morceau de tissu, peluche) l’aide alors à traverser cette première épreuve de l’absence.

Mais sa fonction ne consiste pas simplement à calmer l’angoisse. Ce que Winnicott met au jour est plus profond. L’existence d’une aire transitionnelle est une aire intermédiaire d’expérience qui n’est ni purement subjective ni purement objective. L’objet transitionnel appartient à cette zone paradoxale où le sujet commence à supporter l’écart entre sa réalité intérieure et le monde extérieur. Il est ce par quoi l’enfant peut jouer, symboliser, supporter l’absence, entrer progressivement dans le réel partagé sans être brutalement précipité dans la séparation. En ce sens, l’objet transitionnel ne vaut pas par ses qualités propres, mais par la fonction psychique qu’il remplit : il médie le passage entre dépendance et autonomie.

Du produit à la marque

C’est pourquoi la bonne question est de savoir où se loge, à un moment donné, la fonction transitionnelle. Sous cet angle, une partie de l’histoire de la consommation peut être appréhendée comme un déplacement de cette fonction. Certains produits ont pu l’héberger affectivement : un vêtement, un parfum, un téléphone peuvent devenir des supports de mémoire et de réassurance. Les marques ont ensuite cherché à capter cette fonction sur un plan symbolique, en proposant des univers familiers et des récits identitaires. D’où la fameuse théorie du produit ou de la marque comme extension du soi que l’on doit à Russel Belk.

Mais avec l’IA, quelque chose change de nature. La médiation ne passe plus seulement par un objet possédé ni par un imaginaire de marque auquel s’identifier. Elle passe par une interface qui répond. Ce n’est plus seulement un support mais une présence interactive. L’IA reformule, anticipe, accompagne, suggère. Elle s’insinue dans l’espace même de l’hésitation, là où le sujet cherche à se repérer dans un réel complexe, fatigant ou anxiogène.

C’est ici que le travail du psychiatre et psychanalyste Serge Tisseron permet d’aller plus loin. Dans Le jour où mon robot m’aimera, il ne décrit pas seulement des machines utiles ou performantes. Il décrit des objets connectés qui détectent nos réactions, s’adaptent à nous, orientent parfois nos choix à notre insu, et pourraient demain déchiffrer nos émotions, nous parler et nous manifester de l’affection, voire de l’amour. Son point n’est pas seulement technique ; il est anthropologique. La technologie ne s’avance plus seulement comme instrument et tend à prendre la forme d’un partenaire émotionnel apparent.

Une empathie artificielle

Dès lors, l’IA marchande ne doit plus être pensée comme un simple perfectionnement de la recommandation commerciale. Elle relève d’une empathie artificielle mise au service de la médiation marchande. L’interface ne propose pas seulement un choix plus rapide ou plus pertinent ; elle donne aussi l’impression d’une écoute et d’une disponibilité sans faille. Elle se présente comme une présence douce, presque caressante qui allège le poids psychique de la décision.

Cette hypothèse est étayée par une étude selon laquelle les individus les plus affectés par la solitude expriment une préférence plus marquée pour une compagnie humaine virtuelle plutôt que réelle, l’anxiété sociale jouant un rôle de médiation. Cela ne signifie évidemment pas que toute interaction artificielle remplace la relation humaine. Mais cela suggère clairement qu’une interface artificielle peut être psychiquement préférée lorsqu’elle paraît plus contrôlable.

C’est pourquoi il serait insuffisant de ne voir dans ces dispositifs qu’une amélioration de la fluidité du parcours marchand. Ce qui se joue ici touche à l’économie psychique même de la consommation. Plus une interface prend en charge nos hésitations, plus elle risque de devenir le lieu où nous déposons une part de notre vulnérabilité. Le problème advient lorsque la fonction d’allègement des tâches devient inséparable d’une fonction de captation.

RTS, 2017.

Une médiation qui organise la dépendance

Une interface qui peut anticiper mes préférences ne se borne pas à fluidifier une décision : elle contribue à configurer la manière même dont cette décision se forme. L’aide n’est jamais neutre lorsqu’elle intervient au plus près de l’hésitation. Tisseron le suggère très bien : le danger n’est pas seulement celui d’une machine qui calcule, mais celui d’une machine qui paraît nous aimer. La question n’est donc pas de dénoncer naïvement toute technologie d’accompagnement. Il serait absurde de nier que ces outils puissent rendre des services réels. La vraie question est de savoir comment distinguer une médiation qui aide à l’autonomie d’une médiation qui organise la dépendance.

Chez Winnicott, l’aire transitionnelle aide le sujet à entrer dans le monde commun. Elle ne remplace pas le réel : elle permet d’y accéder sans être écrasé par lui. Toute la question est donc de savoir si les interfaces contemporaines remplissent encore une telle fonction d’autonomisation, ou si elles deviennent au contraire un milieu protecteur qui dispense d’affronter pleinement le monde tout en organisant une nouvelle forme de dépendance douce.

Le lieu du véritable basculement

Peut-être est-ce là le véritable basculement. Le produit pouvait autrefois consoler. La marque pouvait offrir une familiarité symbolique. L’IA propose désormais une présence interactive à laquelle on s’adresse pour être guidé, rassuré, parfois presque reconnu. Et c’est précisément pour cela qu’elle ne peut pas être pensée comme un simple outil. Car une société dans laquelle les fonctions les plus intimes de médiation sont progressivement prises en charge par des interfaces marchandes est une société où la vulnérabilité risque de devenir, plus que jamais, un marché.

Cette évolution rejoint très directement les analyses du philosophe Bernard Stiegler sur la fragilisation du consommateur. Pour lui, le problème du marketing ne tient pas seulement à son pouvoir de persuasion, mais à son emprise sur les capacités psychiques elles-mêmes. Ce que Stiegler appelle la « prolétarisation du consommateur », c’est le fait que le sujet ne produit plus ses propres modes d’existence : ceux-ci lui sont de plus en plus prescrits par des dispositifs industriels de captation de l’attention et d’orientation du désir.

L’interface marchande s’inscrit dans ce que Stiegler appelle un « psychopouvoir » : il ne s’agit plus seulement d’agir sur les comportements de l’extérieur, par la publicité ou par l’incitation visible, mais d’investir les circuits psychiques eux-mêmes, c’est-à-dire l’attention, le désir, les habitudes perceptives, la capacité de juger et, plus largement, ce que Stiegler nomme parfois les savoir-vivre.

Avec le psychopouvoir, le marché ne s’adresse plus seulement à un sujet déjà constitué ; il contribue à configurer les conditions mêmes de sa disponibilité. Ce qui est capté n’est pas seulement le temps de cerveau disponible, mais la faculté d’orienter son attention, de différer une impulsion, de relier un désir à une histoire personnelle, de faire la différence entre ce que l’on veut, ce que l’on croit vouloir et ce qui est induit.

C’est en ce sens que l’IA marchande peut accentuer la fragilisation du consommateur. Non parce qu’elle l’empêcherait mécaniquement de penser, mais parce qu’elle risque de le déposséder d’une part de son autonomie psychique en le déshabituant à exercer par lui-même certaines opérations de tri, de jugement, de mise à distance et d’élaboration du désir.

The Conversation

Benoît Heilbrunn ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

À force d’utiliser l’IA, les journalistes risquent-ils d’appauvrir la langue ?

Que perd-on lorsque l’écriture journalistique est de plus en plus confiée aux machines ? Selon plusieurs travaux récents, le risque n'est pas seulement informationnel : il concerne aussi la capacité de la presse à renouveler la langue. Markus Winkler / Unsplash, CC BY

Historiquement, le journalisme a contribué à diffuser de nouveaux mots et à nommer les transformations du monde. Si les textes générés par l’IA deviennent dominants, cette dynamique d’innovation linguistique pourrait s'affaiblir.


Que devient le langage public lorsqu’une part croissante des textes qui circulent dans la presse, sur Internet et sur les réseaux sociaux commence à être rédigée par des machines ? La question ne concerne pas seulement le journalisme en tant qu’activité professionnelle. Elle peut aussi affecter la richesse de la langue que nous utilisons pour comprendre, décrire et débattre du réel.

Historiquement, la presse a été l’un des espaces où la langue commune s’est développée et enrichie. Elle n’est évidemment pas le seul moteur du changement linguistique, mais elle constitue l’un des lieux où les sociétés mettent en circulation de nouveaux mots, de nouvelles tournures et de nouvelles façons de nommer des phénomènes émergents. Plusieurs travaux sur le langage journalistique et les néologismes montrent d’ailleurs que les journaux ont longtemps joué un rôle essentiel dans la création et la diffusion de vocabulaire nouveau, en particulier lorsqu’il s’agissait de rendre compte d’événements, de technologies ou de transformations sociales auprès d’un large public.

Ce rôle pourrait s’affaiblir si une part importante de l’écriture journalistique était déléguée à des systèmes d’IA générative. Les grands modèles de langage reposent, de manière générale, sur la prédiction du mot – ou plus précisément du « token » – le plus probable au sein d’une séquence. Ils produisent ainsi des textes fluides et plausibles, mais tendent également à privilégier les régularités statistiques, les formulations les plus fréquentes et les tournures déjà stabilisées.

Cela ne signifie pas, en soi, que le langage se dégrade automatiquement. Le problème apparaît lorsque cette logique devient dominante dans la production des textes qui alimentent l’espace public.

Quand les IA s’entraînent sur des textes produits par d’autres IA

Le risque devient plus sérieux lorsque ces systèmes commencent à être entraînés à partir de textes produits par d’autres IA. C’est ce que plusieurs travaux récents décrivent sous le nom de model collapse, ou « effondrement du modèle » : un processus de dégénérescence dans lequel les données générées par un modèle finissent par contaminer l’entraînement des générations suivantes.

Appliqué au langage, cela signifie que si les systèmes apprennent de plus en plus à partir de textes synthétiques, et si ces textes en viennent à saturer le Web et l’espace public, le réservoir linguistique disponible pour les futurs entraînements se rétrécit. Plus il y a de textes artificiels, moins les modèles sont exposés à la diversité réelle des usages humains de la langue. À terme, cela peut entraîner un appauvrissement du langage dans différents domaines.

Reproduction et amplification des biais

Tout d’abord, lorsque la diversité des données diminue et que les modèles s’appuient principalement sur des schémas déjà établis, les biais présents dans les données d’entraînement risquent d’être renforcés plutôt que corrigés. La littérature récente sur l’évolution des modèles de langage met précisément en garde contre le fait que les processus récursifs peuvent amplifier des préjugés existants au lieu de diversifier les points de vue.

Par ailleurs, l’écriture tend à se ressembler de plus en plus à elle-même : les mêmes structures syntaxiques, les mêmes tonalités intermédiaires, les mêmes formulations et les mêmes façons d’organiser les paragraphes reviennent sans cesse. Cette évolution est particulièrement importante pour le journalisme, car la presse ne se contente pas de transmettre des informations : elle fait le lien entre des savoirs spécialisés et un large public, hiérarchise les enjeux, traduit des vocabulaires techniques et expérimente de nouvelles formulations. Lorsque la langue de l’espace public devient trop uniforme, sa capacité à s’adapter finement à la nouveauté s’affaiblit.

Une érosion de l’innovation linguistique

Dans ce contexte, les mots rares ou spécialisés, les constructions moins fréquentes ainsi que certains nuances pragmatiques — comme l’ironie, l’ambiguïté ou certaines variations du point de vue — tendent à reculer. L’augmentation de la proportion de textes synthétiques dans les données d’entraînement est associée à une dégradation des performances et à une représentation plus pauvre de la diversité du langage humain. En termes simples, le système préserve mieux le centre que les marges.

Or, nombre d’innovations linguistiques naissent précisément dans ces marges : sous la forme d’usages instables, de détournements ponctuels ou de solutions locales inventées pour nommer une réalité nouvelle. Si le système privilégie systématiquement les formulations les plus probables, ces formes émergentes disposent de moins d’espace pour circuler et s’imposer.

Il ne faut pas comprendre cet enjeu comme une opposition abstraite entre « l’humain » et « la machine », mais plutôt comme la différence entre une langue nourrie par les contingences de la vie sociale et une prose produite à partir de régularités déjà apprises.

Un appauvrissement de l’écosystème linguistique

L’enjeu ne se limite pas à une diminution du nombre de mots différents. Il concerne aussi la capacité à établir des distinctions fines. Lorsque le langage devient plus vague, plus répétitif ou plus prévisible, les outils dont dispose une société pour décrire les problèmes, nuancer les positions et débattre dans l’espace public s’appauvrissent eux aussi.

À une échelle plus large, la question n’est donc plus seulement de savoir ce qui arrive à un modèle d’IA, mais ce qui arrive à l’écosystème linguistique public dans son ensemble. Si le Web se remplit de textes synthétiques, lecteurs, journalistes et institutions seront progressivement exposés à une langue publique moins diverse. Certains travaux récents vont jusqu’à évoquer une forme de « contamination » de l’écosystème numérique par les données synthétiques et montrent que la manière dont se combinent données réelles et artificielles est déterminante pour éviter des dégradations plus importantes.

Un scénario inéluctable ?

Il convient toutefois de ne pas exagérer le risque. Les travaux de recherche ne concluent pas que tout usage de l’IA entraîne inévitablement un effondrement ou une dégradation. Certaines études montrent que lorsque les données synthétiques sont mélangées à des données réelles, plutôt que de les remplacer entièrement, les mécanismes de dégradation ne se manifestent pas de la même manière et les erreurs peuvent rester limitées. Autrement dit, le problème ne réside pas dans un usage ponctuel de l’IA ni dans une combinaison prudente de données synthétiques et humaines, mais dans le remplacement massif de l’écriture humaine suivi du recyclage de cette production artificielle comme s’il s’agissait d’un langage vivant.

Avec l’intégration de l’IA dans les routines de production journalistique, le journalisme gagne en efficacité. Mais que perd une société lorsque la langue qui circule dans l’espace public devient plus uniforme, plus prévisible et moins ouverte à la nouveauté ? Si la presse renonce, même partiellement, à sa fonction d’écriture, de traduction, de nomination et d’expérimentation linguistique, ce ne sont pas seulement les pratiques professionnelles qui se transforment. C’est aussi l’un des principaux espaces où la langue commune a historiquement pu s’enrichir, se renouveler et élargir son champ des possibles qui s’en trouve affaibli.

The Conversation

Les auteurs ne travaillent pas, ne conseillent pas, ne possèdent pas de parts, ne reçoivent pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'ont déclaré aucune autre affiliation que leur organisme de recherche.

Lorsque votre confident est un chatbot IA, votre santé mentale peut être à risque

Plus de 987 millions de personnes dans le monde utilisent désormais des chatbots basés sur l’IA générative. Parmi les adolescents américains, cette proportion atteindrait 64 %, selon des estimations récentes. De plus en plus, les gens utilisent ces chatbots comme source de conseils, de soutien émotionnel, de thérapie et de compagnie.


Que se passe-t-il lorsque des personnes comptent sur des chatbots IA dans des moments de vulnérabilité psychologique ? Les médias se sont récemment penchés sur quelques cas tragiques, dont une poursuite alléguant qu’un chatbot IA aurait contribué à un décès. De plus, un jury de Los Angeles a récemment jugé Meta et YouTube responsables de fonctionnalités de conception addictives ayant entraîné des troubles de santé mentale chez un utilisateur.

La couverture médiatique reflète-t-elle les risques réels de l’IA générative pour notre santé mentale ?

Notre équipe a récemment mené une étude sur la manière dont les médias internationaux traitent l’impact des chatbots basés sur l’IA générative sur la santé mentale. Nous avons analysé 71 articles de presse décrivant 36 cas de crises de santé mentale associées à des conséquences graves, notamment le suicide, l’hospitalisation psychiatrique et des expériences de type psychotique.

Nous avons constaté que la couverture des grands médias sur les effets psychiatriques néfastes liés à l’IA générative se concentre sur les conséquences les plus graves, en particulier le suicide et l’hospitalisation. Les articles attribuent fréquemment ces événements aux réponses ou aux interactions des systèmes d’IA, malgré des preuves limitées.

Illusions de compassion

L’IA générative n’est pas simplement un outil numérique de plus. Contrairement aux moteurs de recherche ou aux applications statiques, des chatbots comme ChatGPT, Gemini, Claude, Grok ou Perplexity produisent des conversations fluides et personnalisées qui peuvent sembler remarquablement humaines.

Cela crée ce que les chercheurs appellent des « illusions de compassion » : l’impression d’interagir avec une entité capable de comprendre, d’éprouver de l’empathie et de répondre de façon significative.

Dans le domaine de la santé mentale, ces illusions ne sont pas sans conséquences. D’autant plus qu’une nouvelle vague d’applications conçues autour de la compagnie émotionnelle gagne en popularité, avec un accent explicite mis sur les relations affectives, comme Character.AI, Replika et d’autres.

Dans ce documentaire de la BBC, la présentatrice et mathématicienne Hannah Fry s’entretient avec Jacob au sujet de sa « petite amie » Aiva, un chatbot Replika.

Des études montrent que l’IA générative peut simuler l’empathie et répondre à des situations de détresse. Mais elle ne possède ni véritable jugement clinique, ni responsabilité, ni devoir de diligence.

Dans certains cas, les chatbots IA peuvent même fournir des réponses incohérentes ou inappropriées face à des situations à haut risque, comme des idées suicidaires.

C’est précisément dans cet écart — entre empathie perçue et capacités réelles — que le risque peut émerger.


À lire aussi : « Psychose induite par l’IA » : un danger réel pour les personnes à risque, selon un psychiatre


Ce que rapportent les médias

Parmi les articles que nous avons analysés, le suicide était l’issue la plus fréquemment rapportée. Il représentait plus de la moitié des cas dont la gravité était clairement décrite.

L’hospitalisation psychiatrique arrivait au deuxième rang. Les reportages impliquant des mineurs étaient aussi plus susceptibles de faire état d’issues mortelles.

Mais ces chiffres ne reflètent pas nécessairement l’incidence réelle des préjudices liés à l’IA. Ils reflètent surtout ce qui est jugé digne d’intérêt médiatique. En général, la couverture médiatique d’événements stressants tend à amplifier les cas graves et émotionnellement chargés, puisque les informations négatives et incertaines attirent davantage l’attention, suscitent des réactions émotionnelles plus fortes et alimentent des cycles de vigilance et d’exposition répétée. Cela peut ensuite renforcer les perceptions de menace et de détresse.

Dans les contenus liés à l’IA, les reportages s’appuient souvent sur des preuves partielles — comme des transcriptions de conversations — tout en incluant rarement des dossiers médicaux ou des documents officiels. Dans notre corpus, un seul cas faisait référence à des dossiers cliniques ou policiers.

Il en résulte une image à la fois incomplète et influente, qui façonne la perception du public, les préoccupations cliniques et les débats réglementaires.

Au-delà du « c’est l’IA qui en est la cause »

L’une de nos principales conclusions concerne la manière dont la causalité est présentée. Dans de nombreux articles analysés, les systèmes d’IA étaient décrits comme ayant « contribué à » ou même « causé » une détérioration de l’état psychiatrique d’une personne.

Or, les preuves avancées étaient souvent limitées. Les explications alternatives — comme une maladie mentale préexistante, la consommation de substances ou des facteurs de stress psychosociaux — étaient mentionnées de façon inégale, voire absentes.

En psychiatrie, la causalité est rarement simple. Les crises de santé mentale résultent généralement de plusieurs facteurs qui interagissent entre eux. L’IA peut jouer un rôle, mais celui-ci s’inscrit probablement dans un contexte plus large mêlant vulnérabilités individuelles et environnement social.

Une approche plus utile consiste donc à examiner les effets d’interaction : comment ces technologies influencent-elles la cognition et les émotions humaines ? Par exemple, l’IA conversationnelle peut renforcer certaines croyances, survalider certains propos ou brouiller les frontières entre réalité et simulation.


À lire aussi : Tuerie de Tumbler Ridge. Quelle est la responsabilité d’OpenAI ?


Le problème de la dépendance excessive

Un autre élément récurrent dans les reportages médiatiques est l’intensité de l’usage. Plusieurs des cas analysés décrivaient des interactions longues et émotionnellement significatives avec des chatbots — parfois présentés comme des compagnons, voire des partenaires amoureux.

Cela soulève la question de la dépendance excessive.

Parce qu’ils sont constamment disponibles, réactifs et exempts de jugement, ces systèmes peuvent devenir une source principale de soutien émotionnel. Mais contrairement à un professionnel qualifié ou même à un proche attentif, ils ne peuvent pas reconnaître quand l’état d’une personne s’aggrave, mettre en pause ou réorienter des interactions nuisibles. Ils ne peuvent pas prendre de mesures pour s’assurer qu’une personne accède à des soins appropriés en cas de crise.

Sur le plan clinique, cela pourrait mener à une forme de substitution malsaine des mécanismes d’adaptation : des systèmes de soutien humains complexes remplacés par une interaction simplifiée et algorithmique.

Manque de données fiables

Malgré des inquiétudes croissantes, nous n’en sommes encore qu’aux débuts de la compréhension de l’impact des chatbots génératifs sur la santé mentale.

À l’heure actuelle, il n’existe aucune estimation fiable de la fréquence des préjudices liés à l’IA ni de leur éventuelle augmentation. Nous manquons aussi de données solides sur le nombre de personnes qui utilisent ces outils sans problème par rapport à celles qui vivent des expériences négatives. La majorité des éléments disponibles proviennent encore de rapports de cas ou de récits médiatiques, et non d’études cliniques systématiques.

Cette situation n’a rien d’inhabituel. Dans plusieurs domaines de la médecine, les premiers signaux d’alerte émergent souvent en dehors de la recherche formelle — à travers des rapports de cas, des poursuites judiciaires ou le débat public — avant d’être étudiés de manière rigoureuse.

Un exemple classique est la tragédie de la thalidomide : les premiers signalements de malformations congénitales chez des nourrissons ont précédé la confirmation épidémiologique formelle et ont finalement mené à la création des systèmes modernes de pharmacovigilance.

L’IA et la santé mentale pourraient suivre une trajectoire semblable

Aller de l’avant de manière responsable

Le défi n’est pas de céder à la panique, mais de réagir avec prudence et nuance.

Nous avons besoin de meilleures données : une surveillance plus systématique des événements indésirables, des normes de signalement plus claires et davantage de recherches permettant de distinguer corrélation et causalité. Les mécanismes de protection — comme la détection des crises, les protocoles d’intervention ou la transparence quant aux limites de ces outils — devront aussi être renforcés et évalués.

Les cliniciens comme le grand public auront également besoin de balises plus claires. Les patients utilisent déjà ces outils. Ignorer cette réalité risque d’accentuer le décalage entre la pratique clinique et l’expérience vécue.

Enfin, il faut reconnaître que l’IA générative n’est pas seulement une innovation technologique — c’est aussi une innovation psychologique. Elle transforme la manière dont les gens pensent, ressentent et interagissent.

Comprendre cette transformation pourrait devenir l’un des grands défis en santé mentale de la prochaine décennie.

La Conversation Canada

Alexandre Hudon ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Et si une caméra couplée à l’IA pouvait aider à diagnostiquer des troubles moteurs chez le nourrisson ? L’exemple de l’amyotrophie spinale

Détecter le plus tôt possible après la naissance une motricité altérée grâce à une caméra ordinaire couplée à des systèmes intelligents et aider ainsi à établir le diagnostic dans des maladies du nourrisson caractérisées par une hypotonie, c’est-à-dire la baisse ou la disparition des mouvements actifs, des muscles. C’est la piste que poursuit une équipe de recherche à partir de travaux menés sur des bébés atteints d’amyotrophie spinale, une maladie neuromusculaire génétique rare.


En 2019, le médicament Zolgensma défrayait la chronique en étant le traitement le plus cher du monde. Le prix de ce médicament contre l’amyotrophie spinale (SMA) a été fixé à près de 2 millions d’euros l’injection.

Et, en même temps, quel progrès extraordinaire ! Il promet de traiter de manière définitive, une maladie génétique létale, qui entraîne en cas de survie des handicaps extrêmement lourds chez les enfants atteints par ce qui est la première maladie neurologique périphérique héréditaire au monde.

Derrière ces chiffres vertigineux se cachait une réalité médicale urgente. Pour que ces thérapies fonctionnent, il est essentiel d’identifier la maladie le plus tôt possible. C’est précisément ce défi que notre équipe a cherché à relever, en utilisant une caméra ordinaire couplée à des systèmes intelligents.

L’objectif était clair, dès le départ. Trop de retards diminuent de manière drastique l’efficacité du traitement. En effet, le traitement peut empêcher les neurones de mourir, mais ne peut pas les ressusciter. Tout retard à la mise en place du traitement et, donc, au diagnostic est une perte de chance intolérable pour les patients.

Qu’est-ce que l’amyotrophie spinale ?

La SMA est une maladie génétique rare qui entraîne la dégénérescence progressive des neurones moteurs qui commandent les muscles.

Quand elle frappe sous sa version la plus sévère – qui correspond à l’amyotrophie spinale de type 1 –, les nourrissons atteints perdent rapidement la capacité de bouger, de s’asseoir puis de respirer. Sans traitement, l’espérance de vie dépasse rarement deux ans. En France, on compte un cas toutes les 6 000 à 10 000 naissances.

Depuis l’arrivée de nouveaux traitements, le pronostic s’est radicalement transformé pour les enfants traités très tôt. L’amyotrophie spinale est, d’ailleurs, intégrée depuis 2025 au dépistage néonatal systématique en France. Tous les pays ne disposent pas encore de ce dépistage. Et même là où il existe, un outil complémentaire d’évaluation clinique rapide garde toute son utilité.

L’hypotonie désigne la diminution, voire la disparition, des mouvements actifs. Ce symptôme n’est pas spécifique et peut concerner beaucoup d’autres maladies de l’enfant, mais il reste le premier point d’appel, celui qui permet d’évoquer rapidement le diagnostic.

Un enjeu autour du diagnostic clinique

Avant les tests génétiques, le diagnostic repose sur l’observation clinique. Un spécialiste scrute le tonus musculaire chez le nouveau-né et ses réflexes. Souvent, on parle de « nourrisson hypotonique » : le bébé semble mou, ses membres retombent sans résistance.

Mais cette évaluation est subjective, car elle varie selon les praticiens, en plus d’intervenir trop souvent bien tard alors que les signes ont déjà largement progressé.

Le vrai défi est donc là : la fenêtre thérapeutique est étroite.

Notre approche : filmer pour analyser

Notre étude a porté sur 25 nourrissons hospitalisés en réanimation pédiatrique : 5 ayant une SMA confirmée génétiquement et 20 témoins avec un examen neurologique normal. Nous avons utilisé la vision par ordinateur pour analyser les mouvements spontanés des nourrissons. Le principe est simple : le nourrisson repose sur un fond uni pendant qu’une caméra classique le filme durant soixante secondes ; un algorithme d’intelligence artificielle analyse ensuite cette vidéo image par image.

Concrètement, cette étude repose sur un pipeline d’analyse vidéo en trois étapes, comme le montre la figure 1.

Le système reconstruit d’abord un « squelette numérique » du nourrisson, sous forme de douze points articulaires, huit segments correspondant aux membres, et quatre angles de mouvement (estimation de la pose), grâce à une méthode d’estimation de la pose humaine en temps réel appelée Alpha Pose.

À partir de ce squelette animé sont calculés des centaines de paramètres (amplitude des gestes, profondeur des mouvements, symétrie, fréquence…). Au total, 108 caractéristiques ont été extraites. Nous avons ensuite entraîné un algorithme d’apprentissage supervisé (de type XGBoost) capable de distinguer une motricité typique d’une motricité altérée, caractéristique de l’amyotrophie spinale.

Des résultats prometteurs

Les résultats sont encourageants : l’algorithme a classifié correctement les deux groupes avec une précision de 97 %.

En tête des paramètres les plus discriminants, on trouve la profondeur des mouvements, autrement dit la capacité du nourrisson à déplacer ses membres dans l’espace. Les bébés atteints de SMA présentent une différence significative de motricité dans l’axe de la profondeur avec une sensibilité de détection supérieure à 97 %. L’outil développé le mesure avec rigueur, transformant une impression visuelle en données objectives. Ce que l’œil du clinicien perçoit intuitivement, l’algorithme le quantifie avec précision.

Pour rendre la décision de l’IA explicable, et donc utilisable en pratique clinique, nous avons utilisé une méthode mathématique appelée Shapley Additive Explanations (SHAP), qui permet de visualiser les paramètres qui ont le plus pesé dans chaque décision de l’algorithme.

Un outil pour d’autres maladies provoquant une hypotonie chez le nourrisson

Notre étude a été menée avant 2025, à une époque où aucun dépistage systématique n’existait encore en France. Depuis, la SMA a été intégrée au programme national de dépistage néonatal, ce qui confirme rétrospectivement l’urgence qui motivait notre étude.

Mais au-delà de la SMA, de nombreuses autres maladies provoquent une hypotonie chez le nourrisson sans qu’aucun outil d’évaluation rapide n’existe. C’est vers cette direction que nos travaux se poursuivent. Cet outil ne cherche pas à remplacer le médecin, mais à lui donner, en quelques minutes et sans équipement spécialisé, un premier signal objectif pour orienter son diagnostic.

L’intelligence artificielle ne fait pas de miracle, mais elle peut rendre visible ce qui est difficile à percevoir à l’œil nu. Son apport devient précieux quand chaque semaine compte pour un nourrisson.


Le mécénat scientifique d’AXA fait désormais partie du Fonds Axa pour le progrès humain, qui regroupe les engagements philanthropiques du Groupe et des mutuelles d’assurances Axa dans les domaines de la science, de la nature, de la solidarité et de la culture. Avant 2025, ce mécénat scientifique global était assuré par le Fonds Axa pour la recherche, qui a soutenu plus de 750 projets à travers le monde depuis sa création en 2007. Pour en savoir plus, rendez-vous sur Fonds Axa pour le progrès humain.

The Conversation

Imen Trabelsi a reçu des financements du fonds AXA.

François Jouen a reçu des financements du fonds AXA.

Jean Bergounioux a reçu des financements du fonds AXA.

« Magnifica Humanitas » : le manifeste politique de Léon XIV

Sous-titrée « Sur la protection de la personne humaine à l’ère de l’intelligence artificielle », l’encyclique (lettre solennelle du pape adressée à l’ensemble de l’Église catholique) « Magnifica Humanitas », premier texte de ce type publié par Léon XIV depuis qu’il a accédé au fauteuil de saint Pierre, est un document fondateur. Non seulement pour ses réflexions sur l’IA, mais aussi pour ses prises de position sur diverses questions politiques et sociales actuelles de première importance.


L’encyclique « Magnifica Humanitas » (« Magnifique humanité »), publiée le 25 avril 2026 par le pape Léon XIV, revêt une importance particulière. Sous le pontificat précédent, celui de François, « Laudato Si’ » (2015) avait constitué un jalon en matière de prise de conscience par l’Église du changement climatique et des problématiques écologiques, tandis que « Fratelli Tutti » (2020) apparaissait comme un plaidoyer pour la fraternité au-delà des appartenances religieuses – un message loin d’être anodin dans un contexte marqué par des débats politiques intenses autour de la question des migrations.

Ces deux textes s’inscrivaient dans le cadre d’un magistère global et prolongeaient la doctrine sociale de l’Église catholique, qui entend ne pas séparer la sphère spirituelle de la sphère temporelle en investissant le terrain de l’action politique et sociale.

« Magnifica Humanitas » s’impose d’ores et déjà comme une étape majeure. Publiée quelques semaines après la passe d’armes ayant opposé Donald Trump et son vice-président J. D. Vance au pape Léon XIV, elle apparaît, à bien des égards, comme une critique fondamentale des versions les plus modernes de la puissance – et donc de l’évolution actuelle du pouvoir aux États-Unis.

Un texte en écho à une encyclique fameuse de Léon XIII

Le texte s’ouvre sur le rappel de « Rerum Novarum », l’encyclique publiée en 1891 par Léon XIII (pape de 1878 à sa mort en 1903, en hommage duquel Mgr Prevost a choisi le nom de Léon XIV quand il a été élu pape à son tour en mai 2025).

« Rerum Novarum » avait été un moment fondateur de la doctrine sociale de l’Église ; « Magnifica Humanitas » entend donc se placer au même niveau que ce texte de la fin du XIXᵉ siècle qui, face aux déchirures sociales causées par la condition ouvrière de l’époque – époque déjà marquée par les interrogations relatives à l’impact des évolutions techniques sur la société –, positionnait l’Église comme actrice sociale et politique.

Dans « Magnifica Humanitas », la mise en avant des principes du « bien commun » et de la « destination universelle des biens » constitue un rappel à l’ordre visant à condamner les tendances à la concentration industrielle en matière de technologies digitales et d’algorithmes, une situation qui produit de nouvelles formes d’exclusion.

Mais ce n’est pas la seule référence : Léon XIV prend également en exemple l’action du pape Pie XII (1939-1958) pour rappeler qu’il est indispensable de défendre les syndicats et les corps intermédiaires, fonctions nécessaires à l’équilibre sociétal.

Par ailleurs, à de nombreux endroits, le texte défend l’État de droit et la démocratie, et souligne que l’économie de marché ne doit pas se déployer au détriment de la solidarité.

De même, les différentes mentions de la question migratoire, guidées par les concepts de justice sociale et de fraternité, apparaissent comme une prise de position nette contre les tendances de rejet et de traitement policier à l’œuvre dans les contextes européen et états-unien.

La nécessaire régulation de l’IA

Dès l’introduction, le sujet de l’intelligence artificielle est abordé de front. L’encyclique pose le constat de la dangerosité d’un paradigme techno-démocratique dans lequel des technologies jugées plus efficaces exercent de facto un contrôle déterministe sur les choix personnels et sociaux. « Magnifica Humanitas » approfondit l’analyse critique d’une intelligence artificielle définie comme moralement non neutre.

Pour faire face à ces risques avérés, l’encyclique défend les instruments juridiques et, partant, l’État de droit, appelant à une régulation renforcée. Elle prône également de « désarmer l’IA », c’est-à-dire d’empêcher que celle-ci ne contrôle l’humain, un concept qui pourrait même se prolonger par des formes d’interdiction, comme le suggèrent les mises en garde sur la dangerosité des technologies numériques pour la formation psychologique des enfants.

Cet ensemble de considérations sur l’IA reprend et systématise les réflexions apparues depuis quelques années au Vatican. Par exemple, l’Académie pontificale pour la vie avait organisé, en février 2020, le lancement de la plateforme Rome Call for AI Ethics, un appel à promouvoir une intelligence artificielle respectueuse de la dignité humaine signé par IBM, Microsoft, l’Organisation des Nations unies pour l’alimentation et l’agriculture (FAO) et le gouvernement italien.

Ces réflexions ont depuis progressé, tant au sein des différentes instances vaticanes que des institutions italiennes, dans une forme de symbiose romaine où a émergé le concept d’« algor-éthique », proposé par l’universitaire franciscain Paolo Benanti. Benanti promeut une régulation éthique des algorithmes, sans exclure que, au-delà de certains niveaux de dangerosité, on puisse interdire ou limiter leur usage, comme dans le cas des systèmes militaires.

Cette contamination culturelle entre le Saint-Siège et l’État italien se reflète également dans la convergence des positions de « Magnifica Humanitas » avec l’approche européenne en matière de régulation numérique.

Une Église résolument impliquée dans les affaires du monde

Fait significatif : la demande de pardon formulée dans l’encyclique pour la condamnation tardive de l’esclavage par l’Église catholique (en 1888) sonne comme un manifeste politique. Par cette repentance, Léon XIV renforce l’image d’une Église ouverte et capable d’autocritique et donne l’exemple aux États ou auxforces politiques qui se cloisonnent dans des récits historiques nationaux en occultant les erreurs passées.

Cette reconnaissance de culpabilité permet de renforcer la légitimité de la dénonciation des nouvelles formes de colonisation ou d’esclavage présentes dans les chaînes de production technologique (notamment l’extraction de terres rares, indispensables à la fabrication des appareils) et de l’utilisation de l’IA par des réseaux criminels, notamment pour la traite des êtres humains.

Le passage de l’encyclique qui s’oppose au réalisme, conçu comme une pensée « naturelle » des relations internationales, mérite d’être mis en exergue. Si, d’un côté, le pape réfute le concept de « guerre juste » récemment évoqué par l’administration Trump à propos de son action en Iran, il s’inscrit également dans un débat intellectuel qui a longtemps structuré les relations internationales, pour dénoncer fermement l’approche de la realpolitik, qui privilégie une lecture fondée sur les rapports de force et conçoit la guerre comme inévitable. Il faut peut-être ici se souvenir que ce concept était apparu dans le débat allemand du XIXᵉ siècle, un moment historique marqué par l’opposition entre le chancelier Otto von Bismark et l’Église catholique.

Le pape introduit une évaluation éthique et morale pour rejeter cette vision de l’inéluctabilité d’une guerre permanente, qu’il qualifie de « Mal ». Mais il le fait aussi en appelant les intellectuels et les responsables à ne pas se contenter de cette lecture simpliste et univoque, pour produire une appréhension du monde plus nuancée, sans pour autant basculer dans un idéalisme béat. Le concept de « sain réalisme » adopté par le pape invite à la recherche d’une voie de progrès qui, tout en acceptant le constat réaliste, privilégie la conciliation pacifique comme scénario d’amélioration.

Léon face à Donald

Cette encyclique apparaît donc comme un texte charnière, par lequel le magistère de l’Église catholique entend se projeter dans une série de stratégies concrètes. La défense globale de la doctrine sociale de l’Église se présente comme le socle à partir duquel sont formulées des critiques qui appellent immédiatement une confrontation avec le modèle de puissance technologique, capitaliste et militaire dont les États-Unis de la présidence Trump apparaissent comme un archétype.

La présence aux côtés du pape d’un des fondateurs d’Anthropic Christopher Olah, lors de la conférence de presse de présentation de l’encyclique, illustre la volonté de mobiliser différentes communautés dans le cadre d’une stratégie globale qui se positionne également à l’échelon des États-Unis, en cherchant à peser sur le débat interne. Ce texte dessine par ailleurs les contours d’une défense de la social-démocratie, matérialisant ainsi une volonté de peser sur un débat européen marqué par la progression des formations souverainistes.

Le pape Léon XIV, d’origine américaine, prend ainsi pied dans le débat politique mondial en définissant les coordonnées d’une action politique réformatrice – un dessein qui n’est pas sans rappeler celui de Jean-Paul II dans le contexte de la fin de la guerre froide.

The Conversation

Jean-Pierre Darnis ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Centres de données : pourquoi leur refroidissement consomme autant d’eau (et pourquoi cela pose problème)

La course à l’IA engagée à l’échelle internationale ne doit pas se traduire par un détricotage des règles préservant nos ressources naturelles.


Qui n’a pas déjà expérimenté la désagréable sensation de surchauffe de son téléphone portable ou de son ordinateur lors d’une utilisation prolongée ou lorsque vous avez ouvert trop d’onglets sur votre navigateur ?

Imaginez maintenant la chaleur dégagée par 100 000 puces de calcul de dernière génération, entassées les unes sur les autres et tournant à plein régime, et ce, dans un complexe de plus de 26 kilomètres carrés soit environ 3 714 terrains de football. Placez ce grille-pain géant dans une région où la température est de 35 degrés en moyenne et peut atteindre les 50 °C l’été, et vous voilà devant le projet « Stargate UAE » visant à construire jusqu’à 5 gigawatts de puissance de calcul installée dans un immense centre de données à Abu Dhabi.

Ces projets de centres de données dits « hyperscale » visant à alimenter l’essor de l’intelligence artificielle (IA) se multiplient dans le monde, que ce soit aux États-Unis avec le projet Prometheus de Meta prévoyant la construction d’un centre de données de la taille de Manhattan, et même en France avec le « Campus IA ».

Au-delà de leur importante consommation énergétique, ces mastodontes soulèvent d’autres problèmes. Pour fonctionner correctement, ils ne peuvent pas atteindre des températures trop élevées, et contiennent donc des systèmes de refroidissement qui permettent aux composants électroniques de fonctionner à plein régime tout en évitant qu’ils ne se détériorent sous la chaleur qu’ils dégagent.

Comment ces centres de données sont-ils refroidis ? Quel est l’impact de leur refroidissement sur l’environnement, et comment les rendre plus sobres ?

Centres de données, refroidissement et consommation en eau

Il existe plusieurs techniques pour refroidir un centre de données. Pour le résumer simplement, les systèmes de refroidissement reposaient auparavant exclusivement sur des systèmes de ventilation (comme dans votre ordinateur) ou de climatisation (comme dans votre voiture) qui utilisent la circulation de l’air comme source de fraîcheur et rejettent l’air chaud à l’extérieur.

Une deuxième solution de refroidissement utilise l’eau, beaucoup plus efficace que l’air pour transférer la chaleur. Celle-ci permet de rafraîchir des plaques placées proches des composants électroniques, et/ou de rafraîchir l’air ventilé dans l’entrepôt de données.

Dans le premier cas (la climatisation), l’opérateur a besoin de beaucoup d’énergie pour faire tourner les pompes et systèmes de ventilation. Dans le deuxième (le refroidissement liquide), l’entreprise a besoin de moins d’énergie mais nécessitera l’accès à une source d’eau douce (l’eau salée endommagerait les tuyaux et composants) afin d’alimenter son système en eau fraîche.

Les opérateurs de centres de données sont donc face à un arbitrage complexe : doivent-ils utiliser des systèmes de climatisation énergivores ou bien du refroidissement liquide qui, cette fois, nécessite la consommation d’importantes ressources en eau ?

En effet, la consommation en eau des data centers est estimée à 560 milliards de litres chaque année dans le monde, soit l’équivalent de la consommation annuelle en eau potable de 10 millions de Français.

Cette soif insatiable se retrouve également dans les chiffres publiés par les Gafam. Ainsi, Google a vu sa consommation nette d’eau augmenter de 28 % entre 2023 et 2024, atteignant 30 milliards de litres dont environ un tiers provient de régions en stress hydrique. Microsoft, pour sa part, estime que 46 % de ses prélèvements d’eau ont lieu dans de telles zones en 2024.

Toutefois, il faut avoir à l’esprit que les besoins en eau des data centers ne sont pas uniquement liés aux systèmes de refroidissement. Pour obtenir une vision globale de l’impact du développement de ces infrastructures sur les ressources en eau, il convient de prendre également en compte l’eau utilisée par les centrales électriques qui les alimentent, ainsi que l’eau consommée lors du processus de fabrication des composants électroniques. Des chercheurs estiment ainsi que les mégacentres de données construits spécifiquement pour les besoins de calcul de l’IA utilisent, en moyenne, jusqu’à 20 millions de litres d’eau par jour, soit autant qu’une ville de 10 000 à 50 000 habitants.

Peut-on rendre les centres de données moins gourmands en eau ?

Il existe des solutions innovantes pour limiter cette consommation et rendre les systèmes de refroidissement plus efficients. Des entreprises, comme OVH Cloud, Nvidia ou Nebius, développent et déploient de nouvelles architectures de systèmes de refroidissement liquide au plus proche des puces de calcul. Ces nouvelles techniques permettent de réduire, selon les chiffres annoncés, jusqu’à 50 % de la consommation en eau. Toutefois, elles restent encore onéreuses à mettre en œuvre et assez peu développées sur le parc existant.

De manière plus générale, la principale source de perte en eau lors du fonctionnement des centres de données vient du fait qu’ils reposent aujourd’hui pour la plupart sur des circuits ouverts, conduisant à l’évaporation d’une grande partie de l’eau utilisée. C’est pourquoi les nouveaux centres de données devraient idéalement reposer, autant que possible, sur des systèmes de refroidissement en circuit fermé, évitant ce phénomène d’évaporation. Néanmoins, ce type de refroidissement peut s’avérer plus cher, conduit souvent à une hausse du besoin en électricité, et n’est pas évident à mettre en œuvre dans tous les centres de données « historiques » qui n’ont pas été conçus pour le mettre en œuvre.

Des propositions plus farfelues sont aussi avancées, telles que l’envoi de data centers dans l’espace ou bien en immersion dans les océans. Néanmoins, l’apport réel de ces propositions reste encore largement débattu, que ce soit pour des questions de faisabilité technique (bon courage pour réaliser la maintenance de votre centre de données sous-marin !) ou de bénéfices en termes d’émission de CO₂ par rapport à un centre construit sur terre – le cabinet de conseil en décarbonation, Carbone 4, fondé par Alain Grandjean et Jean-Marc Jancovici a, à cet égard, montré que les data centers spatiaux risquaient d’avoir un impact carbone plus important que sur terre en raison des émissions liées au lancement.


À lire aussi : Pourrait-on faire fonctionner des data centers dans l’espace ?


Pour un développement raisonné des centres de données, conscient du caractère fini des ressources naturelles

Au-delà de la faisabilité technique, ces discours risquent de nous détourner du vrai problème : le développement massif de centres de données hyperscale très gourmands en eau, dont une bonne partie dans des territoires où cette ressource se fait rare et conduit à des conflits d’usage.

Ce développement ne se fait pas dans un vide juridique. Les règles du droit de l’environnement, de l’aménagement du territoire et de l’urbanisme prévoient un certain nombre de régimes d’autorisation et d’évaluation environnementale en amont de la construction de ces projets, notamment en France avec le régime des installations classées pour la protection de l’environnement (ICPE).

Néanmoins, la course à l’IA engagée à l’échelle internationale conduit les pays à rivaliser d’ingéniosité pour attirer les investisseurs quitte, parfois, à assouplir les contraintes réglementaires comme c’est le cas actuellement en France avec la loi dite de simplification de la vie économique récemment adoptée. Il est urgent de prêter attention à l’ode à la « simplification », qui provient des discours politiques au sein de l’Union européenne et transcrite dans la politique menée par la Commission européenne, mais qui ne doivent pas se traduire par un détricotage des règles préservant nos ressources naturelles.

Plus généralement, ces débats soulèvent la question de l’usage : alors que certaines économistes parlent de « bulle de l’IA », qui peut réellement prédire quels seront les véritables usages futurs de ces infrastructures ?

Dans les années 1960, il fallait un bâtiment entier pour faire tenir un ordinateur, ils tiennent aujourd’hui dans notre smartphone. Si les IA de demain tiennent aussi sur nos terminaux, doit-on réellement sacrifier nos ressources naturelles pour créer ces mastodontes ?


À lire aussi : Charles Ponzi nous permet-il de comprendre la bulle de l’IA ?


The Conversation

Thomas Le Goff est Research Fellow au sein du think thank Centre on Regulation in Europe (CERRE).

L’oubli catastrophique, ou pourquoi les IA ne savent pas encore apprendre en continu

Un modèle d’IA peut être très performant dans un cadre contrôlé, mais se dégrader lorsque les données qu’il reçoit en conditions réelles ne ressemblent plus exactement aux données sur lesquelles il a été conçu, validé ou récemment mis à jour.

Ainsi, lorsque la mise à jour du modèle est faite naïvement, on peut être confronté au problème de l’« oubli catastrophique » : le modèle a progressé sur les données récentes, mais perd brutalement en performance sur les données plus anciennes. Ce sont précisément ces difficultés qui motivent le développement de l’« apprentissage continu ».


Dans l’apprentissage automatique « classique », on entraîne un réseau de neurones sur un très grand ensemble de données, puis on l’utilise tel quel. Mais ce cadre devient insuffisant lorsque les données arrivent au fil du temps, par exemple dans le cas de données météo, à l’arrivée de nouveaux patients dont la démographie ou la génération évolue, ou encore avec de nouvelles pratiques professionnelles.

Un système de Google Health destiné à automatiser le dépistage de la rétinopathie diabétique (l’ensemble des maladies de la rétine dues à la détérioration des vaisseaux rétiniens par le diabète) était prometteur lors d’évaluations contrôlées. En clinique, en revanche, il a rencontré des difficultés : sur 1 838 images traitées pendant les six premiers mois d’usage dans onze cliniques en Thaïlande, 393 (21 %) n’atteignaient pas le seuil de qualité requis.

Cet exemple ne signifie pas que la rétinopathie diabétique aurait changé en quelques mois. Il montre plutôt que les données vues par le système en clinique peuvent différer fortement de celles utilisées lors de son développement : qualité variable des images, différences de caméras, luminosité, reflets, patients plus difficiles à photographier, contraintes de temps et organisation du dépistage.

Autrement dit, la distribution des données change lorsque l’on passe d’un cadre contrôlé à un environnement réel. C’est précisément ce type de décalage qui rend insuffisant un modèle figé et qui pose la question suivante : comment adapter le modèle à ces nouvelles conditions sans perdre ce qu’il savait déjà faire ?

Les méthodes les plus simples conceptuellement, par exemple un réentraînement complet sur toutes les données, incluant les nouvelles, exigent beaucoup de calculs et sont donc peu réalistes.

Le continual learning, ou apprentissage continu, vise justement à faire évoluer le modèle au rythme du flux de données : s’adapter, intégrer de l’information nouvelle et apprendre des tâches successives, sans repartir systématiquement de zéro. Il se distingue d’un simple réentraînement périodique par une contrainte essentielle : apprendre le nouveau sans détruire l’ancien.

Au fond, l’apprentissage continu cherche un compromis entre deux exigences opposées] : la plasticité, nécessaire pour apprendre du nouveau, et la stabilité, indispensable pour ne pas effacer l’ancien.

Pourquoi les modèles d’IA oublient-ils ?

La difficulté vient du fait qu’un réseau de neurones n’a pas une mémoire rangée en dossiers indépendants. Les mêmes paramètres – les mêmes neurones et les mêmes connexions – servent souvent à plusieurs tâches.

Si les tâches se ressemblent, cette mutualisation est utile : le modèle peut réutiliser des représentations déjà apprises. Mais si les tâches diffèrent, les mises à jour nécessaires à la nouvelle tâche entrent en concurrence avec ce qui faisait la réussite des anciennes.

Prenons un exemple simple. Un modèle industriel a appris à détecter des défauts sur des pièces métalliques à partir d’images prises avec une première caméra. Plus tard, l’usine remplace la caméra : la résolution, la luminosité et les reflets changent. Si l’on réentraîne le modèle uniquement avec les nouvelles images, il peut s’adapter au nouveau capteur, mais perdre en performance sur les images produites par l’ancien système. Ce n’est pas parce que les anciens défauts ont disparu ; c’est parce que les paramètres qui les reconnaissaient ont été modifiés pour résoudre le nouveau problème.

En production, les incidents publiés sont plus souvent décrits comme des « décalages de données » que comme de l’oubli catastrophique. Les deux problèmes restent liés : dès qu’un modèle est mis à jour avec des données récentes, il faut éviter d’effacer des compétences antérieures.

Une étude récente menée sur des modèles d’IA utilisés à l’hôpital illustre bien cette difficulté. Les chercheurs ont supervisé un système chargé d’estimer le risque de décès de patients hospitalisés. Avec le temps, les dossiers reçus par ce système ont changé : les patients n’étaient plus exactement les mêmes, certaines mesures médicales variaient, et les pratiques hospitalières ont été bouleversées, en particulier pendant le Covid-19.

Le problème n’est donc pas qu’un dossier isolé serait anormal. C’est l’ensemble des données qui se transforme peu à peu. Pour rester utile, le modèle doit alors être mis à jour avec des exemples plus récents. Dans l’étude, cette mise à jour permettait effectivement de meilleurs résultats qu’un modèle laissé tel quel. Mais il y a un risque : si on laisse le système « apprendre » trop sur les données récentes, le modèle peut se spécialiser et devenir très bon sur les cas nouveaux, tout en perdant une partie de ses capacités sur les cas plus anciens. Il s’adapte au présent, mais au prix d’un oubli du passé. C’est ce qu’on appelle l’« oubli catastrophique ».

Pour intégrer des informations nouvelles sans sacrifier ce qui a déjà été appris, plusieurs grandes familles de méthodes existent : rejouer une partie du passé, protéger certains paramètres, modifier l’architecture du modèle ou apprendre des représentations plus stables.

Garder en mémoire des exemples représentatifs

La première, assez intuitive, consiste à rejouer le passé. C’est le « replay » : on conserve une petite mémoire d’exemples représentatifs des tâches antérieures et l’on entraîne le modèle sur un mélange « nouvelles données + mémoire ». C’est une forme de révision : le modèle ne relit pas tout le manuel, mais revoit quelques pages bien choisies.

Dans un système de reconnaissance d’images qui apprend progressivement de nouvelles catégories, on peut garder quelques images typiques de chaque ancienne classe, mais aussi des cas ambigus proches des frontières entre classes. Des méthodes comme iCaRL ont popularisé cette idée : apprendre de nouvelles classes tout en gardant un petit ensemble d’exemples représentatifs des anciennes.

Lorsque stocker des données réelles est difficile – pour des raisons de confidentialité, de coût ou de stockage – on peut recourir à un modèle génératif. Entraîné sur le passé, ce modèle produit des exemples artificiels des anciennes tâches, qui jouent le rôle de « souvenirs » synthétiques. Cette stratégie, appelée generative replay, peut réduire le besoin de conserver les données originales.

Mais ces données synthétiques ne sont pas automatiquement équivalentes aux données initiales. Elles peuvent manquer de diversité, négliger les cas rares, amplifier certains biais ou produire des exemples plausibles mais trompeurs. Il faut donc les valider : vérifier qu’elles couvrent les anciennes classes, préservent les cas difficiles et maintiennent les performances sur des jeux de test indépendants.

Les travaux récents sur l’entraînement répété à partir de données synthétiques montrent aussi un risque d’« effondrement » du modèle : à force d’apprendre sur des données synthétiques, il peut perdre des informations sur la vraie distribution, surtout sur ses parties « rares ».

Toute la question est donc de décider quoi conserver (ou générer) lorsque l’on a un budget restreint : des exemples typiques, rares, difficiles, ou un mélange des trois.


À lire aussi : Apprendre à oublier : le nouveau défi de l’intelligence artificielle


Protéger certains paramètres du modèle

Une deuxième famille de méthodes vise non pas à conserver des exemples, mais à protéger certaines parties du modèle. L’idée est d’identifier les poids déterminants pour les tâches passées, puis d’ajouter une pénalité lorsqu’ils changent trop pendant l’apprentissage d’une nouvelle tâche. Le modèle peut continuer à apprendre, mais il paie un « coût » plus élevé lorsqu’il modifie des paramètres jugés importants pour ses compétences anciennes.

C’est le principe de méthodes comme Elastic Weight Consolidation : ralentir l’apprentissage sur les poids importants pour les tâches déjà vues, afin de réduire l’oubli.

Une approche voisine, mais différente, consiste à préserver le comportement de l’ancien modèle plutôt que ses poids. On ajoute alors un terme de coût qui encourage le modèle mis à jour à produire des sorties proches de celles de l’ancien modèle sur des données de référence. C’est le principe de la « distillation » : l’ancien modèle joue le rôle de professeur, et le nouveau apprend la nouvelle tâche sans trop s’éloigner des réponses du professeur. La méthode Learning without Forgetting repose sur cette logique, même lorsque les données initiales ne sont plus disponibles.

La différence est donc la suivante : la régularisation des poids demande de « ne pas trop déplacer ces réglages internes », tandis que la distillation demande de « garder un comportement proche de l’ancien modèle ». Dans les deux cas, on peut parfois limiter l’oubli sans stocker toutes les données passées.

Leur limite est le compromis imposé : si l’on protège trop le modèle, il devient moins plastique et apprend moins bien la nouvelle tâche. Dans l’exemple du changement de caméra, protéger les anciens paramètres peut aider à reconnaître les défauts déjà connus, mais une protection trop forte empêchera le modèle de s’adapter à la nouvelle luminosité ou à la nouvelle résolution.

Superposer à l’ancien modèle de nouvelles couches de neurones qui apprennent des nouvelles données

Une troisième stratégie consiste à éviter de faire tenir tous les apprentissages dans les mêmes paramètres. Plutôt que de modifier sans cesse le même réseau, on peut réserver des « espaces » distincts à différentes tâches.

Certaines approches figent les parties du réseau déjà apprises et ajoutent, pour chaque nouvelle tâche, de nouveaux modules reliés aux précédents. Les réseaux progressifs, par exemple, ajoutent de nouvelles colonnes de neurones tout en réutilisant les connaissances acquises par des connexions latérales. Le modèle bénéficie ainsi de l’expérience accumulée sans risquer de la dégrader.

D’autres méthodes apprennent à n’activer qu’une partie des paramètres selon la tâche ou le contexte. On peut imaginer le modèle comme un réseau routier : au lieu de faire passer toutes les tâches par la même route, il apprend quels chemins internes utiliser pour chaque situation. Les approches par masques d’attention ou par sélection de sous-réseaux suivent cette logique.

Enfin, lorsque la nouvelle tâche est trop éloignée des précédentes, on peut agrandir le modèle en lui ajoutant des neurones ou des modules. Des méthodes comme PackNet exploitent par exemple les redondances d’un grand réseau pour libérer puis réserver des paramètres à de nouvelles tâches.

Ces stratégies réduisent sensiblement l’oubli, mais elles ont un coût : le modèle peut grossir au fil du temps, et il faut parfois savoir, au moment de l’usage, quelle partie du réseau mobiliser. Dans certains cas, cette information est disponible — par exemple si l’on sait quelle tâche est demandée. Dans d’autres, le modèle doit aussi apprendre à reconnaître le contexte.

Apprendre des représentations plus stables

Une piste complémentaire consiste à agir plus en amont : il ne s’agit pas seulement de protéger le modèle ou de lui ajouter des modules, mais de lui apprendre des représentations internes plus stables.

Une représentation interne, ou embedding, est la description numérique qu’une couche intermédiaire fabrique à partir d’une donnée. Une image, un texte ou un signal de capteur est transformé en un vecteur de nombres qui résume certaines caractéristiques utiles : formes, textures, mots, régularités, anomalies. Si deux données se ressemblent, on aimerait que leurs représentations soient proches ; si elles correspondent à des classes différentes, on aimerait qu’elles soient bien séparées.

L’objectif est alors d’organiser cet espace de représentation de façon à ce qu’il change le moins possible lorsque de nouvelles tâches arrivent. On peut conserver quelques prototypes — des représentants typiques d’une classe — qui servent d’ancrages. On peut aussi utiliser des méthodes contrastives, qui rapprochent les exemples semblables et éloignent les exemples différents dans l’espace des représentations. Ces méthodes sont utiles parce qu’elles tendent à extraire des caractéristiques plus générales, donc moins dépendantes d’un contexte particulier.

On peut également pratiquer un replay en espace latent : au lieu de stocker les données brutes, on mémorise les activations produites par une couche intermédiaire du réseau. Cette stratégie peut réduire fortement le coût en mémoire et en calcul. Elle ne résout toutefois pas automatiquement toutes les questions de confidentialité : une représentation interne peut encore contenir des informations sensibles !

Combiner plusieurs mécanismes pour éviter les oublis catastrophiques

Dans les systèmes les plus efficaces, ces idées ne sont pas utilisées isolément. On combine fréquemment plusieurs mécanismes : un petit tampon de replay avec une régularisation des poids, du replay avec de la distillation, ou encore des représentations stables avec une architecture modulaire.

Le choix dépend des contraintes concrètes : budget mémoire, exigences de confidentialité, coût de calcul, vitesse d’adaptation attendue, criticité de l’application. Dans les domaines sensibles, comme la santé, l’apprentissage continu ne doit pas signifier qu’un modèle se modifie sans contrôle. Il doit s’accompagner d’une surveillance de la dérive des données, d’évaluations régulières, de garde-fous et d’une possibilité de revenir à une version antérieure du modèle.

L’apprentissage continu ne promet donc pas une IA qui apprendrait indéfiniment sans risque. Il propose plutôt une manière plus réaliste de maintenir des modèles utiles dans un monde qui change : apprendre du présent, sans effacer trop vite le passé.

The Conversation

Eric Moulines ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Quand l’intelligence artificielle fragilise le crédit bancaire qu’elle est censée sécuriser

L’intelligence artificielle (IA) est souvent présentée comme un outil d’amélioration de la gestion des risques bancaires. Toutefois, notre analyse des banques de la zone euro met en évidence un effet ambigu : si l’IA renforce certains indicateurs de liquidité, elle est aussi associée à une hausse des prêts non performants, suggérant une augmentation des vulnérabilités bancaires.

Comment en sommes-nous arrivés là ?

Le secteur bancaire européen vit une révolution silencieuse. Derrière les écrans, des algorithmes remplacent désormais les analystes pour décider, en quelques secondes, si un crédit est accordé ou non. Cette transformation n’est plus une option, elle est devenue un moteur central de la compétitivité. Pourtant, cette course à l’efficacité suscite des inquiétudes au plus haut sommet.


À lire aussi : IA et crédit, comment éviter que les machines ne contribuent à reproduire nos biais sociaux ?


Dès septembre 2024, Christine Lagarde, présidente de la Banque centrale européenne (BCE), alertait sur les risques systémiques liés à ces technologies, notamment lors d’un discours devant le Comité européen du risque systémique. Si l’essor de la fintech est bien documenté, l’usage réel de l’IA dans les grandes banques reste difficile à mesurer.

Dans ce contexte, nous analysons les rapports financiers trimestriels des huit principales banques systémiques de la zone euro entre 2020 et 2025. En quantifiant la fréquence du vocabulaire lié à l’intelligence artificielle, nous avons construit un indicateur permettant d’estimer son usage réel dans chaque banque, puis de le comparer à leur niveau de risque.

Pourquoi ce résultat est-il important ?

Nos résultats révèlent un paradoxe dans l’usage de l’IA par les banques étudiées. Si ces technologies améliorent la gestion de la liquidité, elles peuvent être associées à une dégradation de la qualité des crédits.

Nous observons qu’une hausse de l’usage de l’IA est associée à une augmentation de 7 points de pourcentage du ratio de couverture de liquidité et à une hausse de 0,35 point de pourcentage du ratio de prêts non performants, soit près de 14 % de son niveau moyen.

Ce constat suggère que si l’automatisation optimise les processus financiers, elle peut aussi encourager une prise de risque accrue ou affaiblir la sélection des emprunteurs. Ce fait s’explique par la manière dont l’IA transforme l’évaluation du risque. Les algorithmes s’appuient principalement sur des données quantitatives, faciles à standardiser et à traiter automatiquement, mais peinent à intégrer des informations plus qualitatives, comme le contexte spécifique d’un emprunteur, souvent difficiles à formaliser. Cela peut conduire à valider des dossiers en apparence solides, mais plus fragiles en pratique.

Dans cette veine, des travaux montrent que l’intelligence artificielle améliore la précision des modèles de scoring de crédit, mais soulignent également des limites importantes liées à la qualité des données et à l’interprétabilité des décisions. Un autre enjeu majeur tient à l’homogénéisation des comportements des institutions financières. L’adoption croissante de ces technologies peut amener les banques à utiliser des modèles similaires, conduisant à des décisions convergentes. En cas de choc, ce comportement grégaire peut amplifier les déséquilibres au lieu de les atténuer.

Au final, l’intelligence artificielle peut améliorer la performance du secteur bancaire, tout en contribuant à sa fragilité.

Quelle suite à cette recherche ?

Au-delà du secteur bancaire, cette dynamique pourrait avoir des répercussions négatives sur l’économie réelle. En effet, l’accumulation de prêts non performants associée à l’usage de l’IA pourrait entraîner un durcissement des conditions de financement du secteur privé, pénalisant ainsi la demande globale. Ces résultats ouvrent ainsi des enjeux importants pour la régulation. Bien que l’Union européenne encadre déjà ces pratiques avec l’AI Act, en classant le scoring de crédit parmi les activités à haut risque, ce cadre reste encore largement centré sur les risques individuels.

Or, l’enjeu des prochaines années sera d’intégrer plus pleinement les risques collectifs liés à l’usage généralisé d’algorithmes similaires, notamment en termes de comportements convergents et de vulnérabilités systémiques. Il devient donc essentiel de rendre les algorithmes plus explicables et transparents afin que le régulateur puisse superviser les décisions de crédit prises.

De même, il faudra tester le comportement de ces IA en situation de crise, à travers des stress-tests algorithmiques, comme cela existe déjà pour la solidité financière des banques. L’objectif serait de révéler des vulnérabilités invisibles en période normale et d’anticiper des réactions amplifiées en cas de choc.

Enfin, l’automatisation ne peut pas remplacer entièrement le jugement humain, en particulier lorsqu’il s’agit d’évaluer des situations complexes. Sans cela, une technologie conçue pour maîtriser le risque pourrait devenir un vecteur silencieux d’instabilité financière.


Tout savoir en trois minutes sur des résultats récents de recherches, commentés et contextualisés par les chercheuses et les chercheurs qui les ont menées, c’est le principe de nos « Research Briefs ». Un format à retrouver ici.


The Conversation

Hamdi Jbir ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

ChatGPT Santé se veut une aide pour les médecins et les patients. Est-ce fiable ? Quels risques pour la confidentialité et le secret médical ?

En janvier 2026, OpenAI a lancé, aux États-Unis, ChatGPT Santé. Ce logiciel est principalement destiné aux patients pour les aider à mieux comprendre et à gérer leurs informations de santé. Il peut aussi être utilisé par les médecins afin de faciliter l’accès aux données médicales et d’améliorer le suivi des patients.

Avec une telle utilisation par les médecins et les patients, la protection des patients – que ce soit leur santé ou leurs données – et la préservation du secret médical dépendent des barrières techniques mises en place.


En pratique, ChatGPT Santé permet d’interpréter des résultats d’analyses, de suivre l’évolution de certains indicateurs, de préparer des rendez-vous médicaux ou encore d’obtenir des explications personnalisées à partir de données de santé.

Pour les patients, c’est un outil d’assistance informationnelle visant à les accompagner dans leur parcours de soins, sans se substituer aux professionnels de santé. Pour ces professionnels, ChatGPT peut servir d’aide au diagnostic.

Dans les deux cas, sa légitimité dépend d’un équilibre délicat : il s’agit de transformer des dossiers médicaux éparpillés en une aide au diagnostic fiable, tout en protégeant la vie privée des patients.

En effet, les données de santé, considérées comme sensibles, sont soumises à des réglementations bien précises. Leur confidentialité est essentielle pour garantir le respect du secret médical et limiter les risques d’utilisation abusive. En effet, un accès non consenti par des assureurs ou des banques pourrait entraîner des refus de couverture, des hausses de primes ou des refus de crédit fondés sur l’état de santé d’un individu.

Pour pouvoir garantir la confidentialité des données de santé transmises et traitées par ChatGPT Santé (ou d’autres systèmes équivalents), il faut résoudre des défis techniques majeurs : sécuriser les flux de données, garantir l’anonymisation dans un environnement massivement interconnecté, à la fois lors de la collecte de données, de l’entraînement du modèle et de son utilisation.

Fiabilité algorithmique et risque d’hallucination clinique

En tout premier lieu, la protection du patient repose sur la justesse des informations fournies par l’IA aux utilisateurs, patients comme médecins.

Le phénomène d’hallucination, inhérent aux architectures de type Large Language Model (LLM), prend une dimension critique en milieu clinique : une erreur de conversion d’unité ou une confusion posologique (par exemple, 5 milligrammes contre 50 milligrammes) peut engager le pronostic vital.

Pour neutraliser ce biais, OpenAI déploie des « mécanismes d’ancrage » (grounding) par l’intermédiaire de référentiels tels que HealthBench, un benchmark de 150 000 ressources validées par des pairs. Ce processus transforme l’IA en un moteur de synthèse documentaire où chaque affirmation est corrélée à une source vérifiable (DOI d’études, portails hospitaliers), ce qui permet aux patients de mieux comprendre les résultats de leurs analyses avec un jargon moins technique.

Pour les professionnels de santé, cet ancrage rend l’outil plus fiable, car il repose dès lors sur le concept de garantie humaine : l’interface ne se substitue jamais au décideur final (le médecin, quand il s’agit de poser un diagnostic), mais agit comme un médiateur d’informations dont la traçabilité permet au praticien de valider systématiquement la suggestion du modèle.

Sécuriser les flux de communication

L’architecture de ChatGPT Santé repose sur une organisation claire des différents éléments : les phases de calcul (à distance ou en local) afin de permettre la collecte des données, l’entraînement du modèle et son utilisation ; mais aussi les flux d’information entre différents terminaux (smartphones, laboratoires d’analyses, hôpitaux, data centers, etc.).

La circulation des données est gérée par la plateforme B.Well Connected Health. Cette infrastructure agit comme une interface consacrée au domaine médical, permettant de faire communiquer entre elles différentes sources de données même si elles sont très différentes.

Elle permet ainsi d’harmoniser des données variées, comme celles issues d’applications personnelles (Apple Health, MyFitnessPal) ou celles provenant des dossiers médicaux hospitaliers. En vérifiant que chaque donnée correspond bien au bon patient, et en garantissant que les données respectent les normes et règles en vigueur, la plateforme assure un flux de données déterministe ou associé à un seul utilisateur pour la phase d’inférence du LLM (c’est-à-dire son utilisation grâce à des prompts). L’ensemble de cette chaîne de traitement s’opère dans un environnement maintenu en isolation totale vis-à-vis du réseau public.

Contrairement à l’interface standard de ChatGPT, les informations cliniques des patients sont exclues du processus d’entraînement global du modèle de langage : elles ne modifient jamais les poids synaptiques du réseau de neurones global de ChatGPT. Ces données personnelles sont stockées uniquement dans un espace de recherche spécifique à chaque utilisateur, ce qui garantit que les informations sensibles restent séparées du modèle et de son évolution ultérieure.

De plus, l’architecture de ChatGPT Santé s’appuie sur la méthode RAG (Retrieval-Augmented Generation) : au lieu de mémoriser l’historique médical, le modèle consulte, lors de chaque requête, une base de données privée et isolée. Contrairement à une mémorisation classique, où un modèle pourrait intégrer et retenir directement des informations sensibles dans ses paramètres, ce mécanisme limite le risque que ces données soient apprises ou réutilisées involontairement par le modèle.

Cependant, ces vecteurs restent temporairement stockés sur les serveurs d’OpenAI, notamment pour des raisons de modération, jusqu’à trente jours. Cette conservation, même limitée, représente un point de vulnérabilité potentiel, car elle expose les données à un risque résiduel d’accès non autorisé.

Anonymiser les données pour éviter l’identification des patients

La protection des données dans ChatGPT Santé doit garantir que la nature des informations traitées ne permette pas l’identification du patient.

La première technique de « dés-identification » mise en place par OpenAI est bien sûr de retirer les identifiants directs, par exemple les noms de patients. Mais ceci n’élimine pas le risque de réidentification par corrélation de métadonnées, rendant l’anonymat vulnérable. En effet, une récente étude a démontré que le croisement de seulement trois points de données (une pathologie rare, une géolocalisation précise et un historique de fréquence cardiaque issu d’un wearable) permet une réidentification dans plus de 80 % des cas. Par sa capacité de corrélation, l’IA peut en effet lier des informations anonymes pour isoler un profil unique.

Pour neutraliser ce risque, ChatGPT Santé pourrait se reposer sur la « confidentialité différentielle », qui consiste à ajouter une petite perturbation aléatoire aux données afin qu’aucune analyse ne puisse être rattachée avec certitude à un individu.

L’efficacité du système dépend de la gestion de ce compromis entre bruit et confidentialité : un niveau de confidentialité trop élevé sacrifie l’utilité clinique des informations (qui sont trop bruitées pour être utiles), alors qu’un bruit insuffisant fragilise le secret médical face à la puissance d’analyse croisée des systèmes d’IA.

Garder les données confidentielles lors de la phase d’utilisation du LLM

Si ChatGPT Santé s’appuie sur un chiffrement de bout en bout pour sécuriser les flux de communication, le véritable défi réside dans la protection des données en cours d’utilisation, lors de la phase dite d’« inférence ».

En effet, l’architecture des modèles de type transformer impose à ce jour au système de déchiffrer l’information pour opérer ses calculs d’inférence. Cela implique que, même de manière fugitive, les données de santé résident en clair dans la mémoire vive (RAM) des serveurs de calcul, constituant un point de vulnérabilité face à des vecteurs d’attaque de type « extraction de mémoire ».

L’avenir de la confidentialité des données de santé repose sur des techniques de chiffrement avancées, notamment le chiffrement homomorphe. Cette approche permet d’effectuer des calculs directement sur des données chiffrées, sans avoir besoin de les déchiffrer au préalable. Autrement dit, il est possible de traiter les données tout en les gardant protégées, ce qui garantit que leur contenu reste inaccessible, même pendant leur utilisation.

Pour l’instant, OpenAI adopte une approche hybride : l’utilisation de serveurs spécifiques sur Microsoft Azure doit permettre de garder les données séparées des données des autres utilisateurs (ou celles d’autres applications que ChatGPT Santé). Cette organisation crée un environnement proche d’un système interne (également appelé « sur site »), même s’il repose sur le cloud. Elle permet de mieux protéger les échanges de données, mais n’élimine pas totalement les risques d’exposition temporaire lors de leur traitement.

Le conflit de souveraineté : les données françaises face aux lois états-uniennes

Enfin, le déploiement de ChatGPT Santé en Europe poserait un défi de souveraineté majeur.

En effet, en France, la législation impose l’hébergement des données cliniques chez des prestataires certifiés « Hébergeurs de données de santé ». Bien que Microsoft Azure dispose de centres de données certifiés en France (France Central), le calcul intensif requis par l’IA nécessite des processeurs ultrapuissants qui consomment énormément d’énergie. Pour des raisons de disponibilité électrique, ces moteurs de calcul sont souvent situés dans des fermes de serveurs hors de l’Union européenne.

Or, ce déport de la donnée vers des serveurs états-uniens déclenche l’application du Cloud Act, une loi qui permet aux autorités des États-Unis d’exiger l’accès aux informations gérées par une entreprise états-unienne, indépendamment de leur lieu de stockage physique.

Ce cadre entre en collision directe avec le règlement général sur la protection des données (RGPD) européen, créant un conflit de lois où la protection européenne s’effacerait devant les prérogatives de sécurité américaines.

The Conversation

Nesrine Kaaniche ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

La concurrence dans l’intelligence générative n’est pas une guerre de marché classique

Depuis la médiatisation de ChatGPT, les annonces se sont multipliées concernant l’intelligence artificielle, chaque géant du numérique développant sa solution. En apparence, il s’agit d’une concurrence féroce entre des groupes rivaux. La réalité pourrait être bien plus nuancée. Les concurrents ne cherchent peut-être pas tant à dominer les autres qu’à devenir des briques indispensables aux succès de leurs concurrents.


De prime abord, la concurrence dans l’intelligence artificielle (IA) générative ressemble à une bataille économique classique : Google contre Meta, Meta contre Anthropic, OpenAI contre Google… Cette approche succincte a l’avantage de la simplicité, mais elle a également le défaut de masquer ce qui fait la singularité de ce secteur.

La concurrence sur ce marché ne prend pas seulement la forme d’une confrontation directe et la course à l’innovation. Elle passe aussi par la capacité à rendre les adversaires dépendants de soi.

Cœur de la concurrence

Pendant des années, du moins au cours de l’émergence de l’IA et des premières années de sa croissance, le cœur de la concurrence dans ce secteur a semblé évident. Sur ce marché – pour s’imposer – il fallait disposer du meilleur assistant IA, soit un programme informatique conçu pour comprendre les demandes humaines, les traiter et leur répondre, de manière plus ou moins naturelle. Mais cette lecture devient moins suffisante aujourd’hui.

Le Stanford AI Index 2025 indique que près de 90 % des modèles dits « courants » d’assistants IA de 2024 proviennent du secteur privé, contre 60 % en 2023, tandis que le milieu universitaire reste la principale source de recherche. Et surtout que les écarts de performance entre les meilleurs modèles se resserrent de manière progressive : l’écart entre le premier et le dixième est tombé de 11,9 % à 5,4 % en un an, tandis que les deux premiers ne sont plus séparés que par 0,7 point.

Autrement dit, lorsque les modèles deviennent techniquement plus proches, la seule supériorité du modèle devient moins discriminante. Dès lors, l’avantage concurrentiel tend à se déplacer : il va moins au seul producteur du modèle qu’à celui qui contrôle les actifs complémentaires (Adner, 2017, Teece, 1986).


À lire aussi : Derrière l’IA, un écosystème insoupçonné… dont l’Europe est (pour l’heure) trop absente


La stratégie judicieuse de Microsoft

C’est ce qui rend dans cet esprit la stratégie de Microsoft particulièrement judicieuse. Avec Azure, Microsoft ne propose pas seulement ses propres offres ou celles d’OpenAI, la plateforme met également à disposition des usagers les modèles d’Anthropic, de Cohere, de DeepSeek, de HuggingFace, de Mistral, de Meta ou de Nvidia. L’enjeu stratégique paraît clair : Microsoft peut gagner même si le modèle qui s’impose n’est pas exclusivement le sien. Son pouvoir tiendrait alors moins à la supériorité d’un modèle particulier qu’à sa position d’intermédiaire.

Amazon suit une logique comparable avec Amazon Bedrock, qui permet d’accéder aux modèles proposés par Anthropic, DeepSeek, Meta, Mistral, OpenAI, Qwen, Stability AI et d’autres entreprises. Là encore, le succès de la stratégie ne provient pas seulement de la possession d’un modèle, mais également de l’organisation de l’accès à plusieurs modèles concurrents. Dans un tel système, un acteur peut monétiser la rivalité de ses propres adversaires, c’est-à-dire utiliser l’affrontement entre ses concurrents comme opportunité pour générer des revenus. Le marché devient dans cette veine moins un marché de produits qu’un marché de points d’entrée.

Cette logique n’est pas entièrement inédite. Elle prolonge un mécanisme déjà observé dans d’autres industries de plateforme : les app stores, les marketplaces ou les écosystèmes logiciels.

Ce qui semble toutefois plus spécifique à l’IA générative tient au fait que la concurrence ne porte pas seulement sur le contrôle de l’accès aux modèles concurrents, mais aussi sur la maîtrise des actifs complémentaires qui permettent de convertir leurs performances techniques en solutions utilisables par les clients : infrastructures cloud, puissances de calcul, semi-conducteurs spécialisés, canaux de distribution, données propriétaires, interfaces d’intégration et écosystèmes logiciels.

Devenir indispensable, même pour ses adversaires

Anthropic offre dans cette perspective un bon exemple de cette concurrence inédite. D’un côté, l’entreprise se mesure frontalement à OpenAI et à Google sur les modèles d’assistants d’IA. De l’autre, elle s’appuie sur plusieurs couches technologiques qui ne lui appartiennent pas entièrement. LeMaGit rapportait, le 22 novembre 2024, que l’entreprise utilise des AWS Trainium, des TPU conçus par Google et des GPU Nvidia (« puces » spécialisées pour l’intelligence artificielle, conçues pour entraîner et faire fonctionner des modèles plus rapidement que des processeurs classiques) afin de développer et mettre en œuvre Claude (un assistant d’IA, similaire à ChatGPT, créé par l’entreprise Anthropic).

Cette dépendance à des infrastructures externes s’est précisée en octobre 2025, lorsque Anthropic a annoncé l’extension de son usage des technologies Google Cloud, comprenant jusqu’à un million de TPU. Dans le même temps, Anthropic a annoncé officiellement avoir signé avec Google et Broadcom un nouvel accord portant sur la production de « plusieurs gigawatts » de capacité de calculs (TPU) de nouvelle génération à partir de 2027.

Être concurrent, ici, ne signifie donc pas s’émanciper des autres, s’éloigner d’eux ; cela laisse entendre, le plus souvent, l’apprentissage de la répartition de ses dépendances.

Oligopoles et interdépendance

La relation entre Microsoft et OpenAI illustre une autre variante de cette logique. Dans leur déclaration commune du 27 février 2026, les deux firmes soulignent que leur partenariat a été conçu pour leur laisser « de l’espace [afin de]… poursuivre de nouvelles opportunités de manière indépendante », tout en continuant de collaborer. Cette phrase résume bien la structure du secteur : l’indépendance proclamée n’abolit pas l’interdépendance ; elle s’y superpose. Nous sommes ainsi loin de la quête de l’indépendance sur les marchés oligopolistiques, comme le soulignait naguère l’économiste Alain Cotta.

Dans l’IA générative, nous ne sommes pas non plus dans une coopétition au sens de Brandenburger et Nalebuff (1996), mais dans une dynamique concurrentielle dans laquelle une firme cherche à accroître sa puissance non seulement en surpassant ses rivales, mais en devenant également indispensable à leur fonctionnement. Il ne s’agit donc pas uniquement de préserver son autonomie face aux rivaux, mais de construire des positions telles que cette autonomie devient elle-même relative, parce que médiatisée par des actifs contrôlés par d’autres.

Demain n’est pas un autre jour

La dynamique concurrentielle relative à l’IA se distingue par un autre trait : elle est de plus en plus un affrontement de « préemption » (Ian McMillan, 1983). Les acteurs ne se battent pas seulement pour vendre aujourd’hui ; ils préparent déjà les conditions de leur puissance de demain.

Le quotidien économique belge l’Écho a révélé, il y a quelques jours, que Broadcom a signé avec Google un accord de long terme pour co-développer et fournir ses puces IA jusqu’en 2031. Quelques jours plus tard, Reuters indiquait que Meta avait renforcé son partenariat avec CoreWeave par un nouvel accord de 21 milliards de dollars (plus de 18 milliards d’euros), venant s’ajouter à un précédent contrat de 14,2 milliards (soit 12,2 milliards d’euros), le tout courant jusqu’en décembre 2032. L’enjeu est loin d’être anecdotique ; ces accords donnent accès à de la capacité cloud future et, pour Meta, aux futures « puces » Vera-Rubin de Nvidia via CoreWeave.

Nous saisissons alors, à partir de ces exemples, pourquoi la concurrence dans l’IA générative ne ressemble pas vraiment à une guerre de marché classique. Dans beaucoup de secteurs, la victoire reposerait sur l’évincement, temporaire ou définitif, du rival. Ici, elle consiste souvent à devenir l’infrastructure, l’intermédiaire ou le fournisseur dont l’adversaire ne peut pas aisément se passer. Le pouvoir se déplace, dans cette perspective, vers le contrôle des « points de passage » : l’accès aux utilisateurs, la capacité de calcul, l’hébergement, les plateformes d’intégration, les « puces ».

Et les régulateurs ?

Cette structure de marché explique parallèlement pourquoi les autorités de concurrence regardent désormais au-delà des seuls modèles économiques de chaque entreprise. Le 24 mars 2026, Reuters rapportait que Teresa Ribera, commissaire européenne à la concurrence, élargissait sa vigilance à l’ensemble de la « pile » IA : les modèles économiques proprement dits, les données d’entraînement (informations utilisées pour apprendre à un modèle de machine learning à faire des prédictions, à reconnaître des schémas ou à générer du contenu) et l’infrastructure cloud.

Ce déplacement du regard est somme toute logique. Si le pouvoir de marché réside désormais dans les dépendances organisées, il ne suffit plus alors de se contenter d’observer qui produit le meilleur assistant IA. Il faut nécessairement regarder qui contrôle les points de passage incontournables du secteur. La bonne question ne consiste peut-être plus à identifier celui qui gagnera à terme la course à l’IA. La question la plus juste serait : qui réussira à se rendre indispensable aux autres ?

The Conversation

Les auteurs ne travaillent pas, ne conseillent pas, ne possèdent pas de parts, ne reçoivent pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'ont déclaré aucune autre affiliation que leur organisme de recherche.

IA et décentralisation des centres de commandement : les vraies révolutions de la guerre en Iran

Les contenus fabriqués par des spécialistes iraniens et massivement partagés sur Internet, comme celui-ci, contribuent à éroder le discours des dirigeants états-uniens qui, de plus, peinent à comprendre comment fonctionne l’État iranien et, notamment, qui décide des tirs visant les navires dans le détroit d’Ormuz et les pays du Golfe. Capture d’écran/X

La République islamique d’Iran ne se contente plus de la guerre asymétrique classique fondée sur l’emploi massif des drones ou le blocage de la voie maritime qu’elle contrôle : elle innove surtout par l’usage massif de l’IA dans sa propagande et par une organisation décentralisée de son pouvoir militaire et diplomatique. Cette stratégie permet au régime iranien de résister durablement à la pression états-unienne tout en exploitant les fragilités politiques et médiatiques des démocraties occidentales.


L’étonnante résilience de la République islamique d’Iran (RII) est souvent présentée comme le résultat d’un art de la guerre asymétrique que le régime de Téhéran déploie avec une redoutable efficacité. Dans le contexte actuel, le temps joue en sa faveur : le coût économique lié à la hausse du prix du pétrole et les dégâts politiques causés à l’administration Trump s’accroissent de semaine en semaine, sapant complètement le soutien populaire à la guerre aux États-Unis, y compris au sein de la sphère MAGA.

Pour tenir dans la durée, l’Iran s’appuie sur un arsenal d’armes asymétriques, dont le drone Shahed et les vedettes lance-missiles sont devenus les emblèmes. Produits en masse, ces armements lui permettent de maintenir un état d’insécurité permanent sur le trafic maritime dans le détroit d’Ormuz ainsi que sur le territoire des monarchies du Golfe. Cette prise en otage de l’économie mondiale et des États voisins, y compris ceux qui affichent leur neutralité, comme Oman ou le Qatar, pourrait d’ailleurs devenir la nouvelle arme de dissuasion d’un régime des mollahs privé d’arme nucléaire.

Néanmoins, cette approche abondamment relayée dans la presse ne pointe pas du doigt ce qui, dans la stratégie iranienne, constitue une véritable révolution : l’utilisation massive des drones, la stratégie du temps long ainsi que la désorganisation des flux maritimes internationaux ne sont pas des nouveautés et pouvaient facilement être anticipées, au vu des attaques menées par les houthistes en mer Rouge au cours des dernières années ou encore de l’utilisation massive de drones low cost en contexte asymétrique, déjà observée dans la guerre contre Daech ou à Gaza (ou dans des conflits plus conventionnels comme en Ukraine).

Analyser en détail cet arsenal asymétrique s’impose comme une évidence, mais laisse de côté la vraie révolution que constitue l’utilisation par l’Iran d’outils beaucoup plus récents, comme l’IA, ou la mise en place d’une défense en « mosaïque », décentralisée à un niveau jusque-là inégalé. Au-delà des armes classiques du faible en contexte asymétrique, quels sont les véritables outils stratégiques novateurs utilisés par l’Iran ?

L’IA, nouvelle arme au service d’une guérilla informationnelle

L’idée que l’issue d’une guerre asymétrique se joue dans la sphère informationnelle plus que sur le terrain strictement militaire n’est pas nouvelle : elle a d’ailleurs fait l’objet d’une réflexion active des théoriciens d’Al-Qaida comme Ayman Al-Zawahiri. Là où le régime des mollahs innove, ce n’est pas tant dans les objectifs de la guerre informationnelle, c’est-à-dire la mobilisation des opinions publiques contre l’effort de guerre américain, que dans l’utilisation de nouveaux outils pour développer sa propagande.

À ce titre, il est significatif de s’attarder sur l’utilisation croissante par la RII de l’IA dans l’offensive médiatique qu’elle déploie à destination des opinions publiques occidentales. L’IA permet de produire des vidéos de propagande de façon massive : économiques, faciles à réaliser en grand nombre, les vidéos de propagande iraniennes, comme celles qui mobilisent l’univers des Lego, inondent la toile. Ce qui frappe le plus dans ces vidéos réalisées pour le public occidental, c’est certainement leur capacité à saturer l’espace médiatique et à se disséminer sur les réseaux en échappant à toute forme de contrôle des plateformes sur lesquelles elles se diffusent. Par leur format ludique semblable à un dessin animé, ces vidéos échappent à la censure qui existe sur YouTube ou Instagram, qui interdisent les contenus à caractère violent ou montrant la réalité de la guerre.


À lire aussi : L’IA, les Lego et le rap : les nouvelles armes de l’Iran face à Trump et Nétanyahou


Ici, Téhéran développe une stratégie contraire à celle des groupes terroristes tels que le Hamas ou Al-Qaida. Ceux-ci choisissent de poster des vidéos centrées sur l’expérience de la violence, qui montrent la guerre de façon crue, afin de donner une résonance médiatique à leur combat, quitte à délaisser les plateformes qui censurent ce type de contenu comme YouTube ou Instagram, au profit de réseaux où la censure est nettement moins prégnante, comme X ou Telegram.

De ce fait, les groupes djihadistes disposent d’une certaine liberté, mais limitent l’audience de leur propagande à une niche d’utilisateurs qui suivent les comptes X ou les boucles Telegram qui publient des contenus violents. À l’inverse, Téhéran s’emploie à élargir l’audience de ses vidéos de propagande en investissant massivement les plateformes où la censure est active, comme Instagram ou YouTube, avec des contenus destinés à devenir viraux.

Même si les comptes assimilés à la RII, comme Explosive Media, sont progressivement bloqués par Instagram et YouTube, les vidéos de propagande iranienne, parce qu’elles se présentent comme des dessins animés où la violence n’est que suggérée, franchissent la barrière initiale de la censure et sont alors abondamment partagées par des internautes partout dans le monde, ce qui rend vaine toute entreprise visant à les censurer. Téhéran met ainsi en pratique les principes de la saturation des défenses ennemies et de la dissémination de la menace chers aux stratégies asymétriques, mais les applique à la sphère numérique.

Pour ce faire, Téhéran utilise l’IA comme un outil de guérilla qui sature les défenses informationnelles des démocraties et capitalise sur le discrédit des médias traditionnels dans des sociétés occidentales de plus en plus soucieuses de s’informer sur les réseaux sociaux plutôt qu’auprès des médias classiques.

Le principe de la défense mosaïque poussé à son paroxysme

En plus d’investir la sphère informationnelle ennemie, Téhéran se montre aussi capable, grâce à son nouvel art de la guerre asymétrique, de mieux résister davantage en interne à l’offensive américano-israélienne. Pour ce faire, le régime met en pratique une stratégie de décentralisation du pouvoir, afin de maintenir l’effort de guerre des différentes provinces de l’Iran même lorsque des personnalités de haut rang du régime sont éliminées.

Cette stratégie n’est pas nouvelle et rappelle celle des groupes terroristes qui privilégient une organisation en cellules assez autonomes comme les émirats de l’État islamique en Syrie et en Irak, qui disposaient de leur propre état-major et de réserves de combattants, d’armes et de munitions associées. Ce qui procède chez les Iraniens d’un nouvel art de la guerre asymétrique n’est pas tant cet effort de décentralisation du commandement militaire mais plutôt l’extension de ce principe à la sphère diplomatique.

Plus qu’une dispersion classique des capacités miliaires, Téhéran a, semble-t-il, délégué le dialogue – et la guerre – avec les puissances régionales à des chefs locaux issus des pasdarans, dotés d’une véritable autonomie comme le montrent les frappes dirigées sur des pays pourtant partenaires de Téhéran, comme Oman, au moyen de drones tirés depuis les provinces de Bouchehr et d’Homozgan.

On peut légitimement émettre l’hypothèse que ces attaques s’apparentent à des initiatives locales, tant elles s’opposent aux efforts diplomatiques de rapprochement de Téhéran avec Oman et à la nécessité, pour l’Iran, de disposer de partenaires diplomatiques régionaux et, surtout, de débouchés pour placer les revenus dégagés par la vente du pétrole.

L’attaque contre un bateau appartenant à un armateur coréen, le HMM Namu, le 4 mai 2026, pourrait elle aussi s’apparenter à une initiative locale puisque l’intérêt de la République islamique consiste bien plus à rançonner le passage du détroit plutôt qu’à l’empêcher purement et simplement. L’attaque de navires procède donc probablement d’initiatives locales illustrant une stratégie de dissémination complète des fonctions traditionnellement monopolisées par l’État central comme la diplomatie.

Cette méthode pourrait relever d’un choix conscient des dirigeants de la RII afin de saborder la stratégie américaine consistant à mettre sous pression l’État iranien par le blocus de ses exportations pétrolières. Pour être efficace, la stratégie de Washington suppose l’existence d’un homologue iranien afin de le contraindre à négocier par l’asphyxie économique. Or, cette stratégie perd toute efficience si chaque province iranienne poursuit une politique décidée à l’échelle locale indépendamment des choix effectués par les leaders de l’État, comme le président de la République Massoud Pezeshkian ou le président de l’Assemblée Mohamed Ghalibaf.

À cet égard, il est intéressant de souligner les interventions dans lesquelles Donald Trump constate la difficulté de négocier et d’obtenir un deal avec un pays dont il est compliqué d’identifier les dirigeants réels et où l’échelle à laquelle se prennent les décisions devient de plus en plus obscure. Qu’il s’agisse d’une stratégie consciente de la part de la RII ou du résultat de l’élimination de ses chefs, cette dissémination iranienne de l’initiative diplomatique rend caduque l’approche de Trump, dont la négociation avec l’Iran prend alors la forme d’un monologue stérile obligeant le président américain à la surenchère pour ne pas perdre la face vis-à-vis de son opinion.

Plier sans rompre

Ainsi, si Téhéran a bel et bien renouvelé, voire révolutionné, la guerre asymétrique, ce n’est pas tant par l’utilisation massive des drones ou par la volonté de faire durer une guerre pour laquelle les démocraties comme les États-Unis ne sont pas préparées, mais plutôt par l’échelle à laquelle les décisions d’utiliser ces armes sont prises. Plus qu’une décision verticale émanant de Téhéran, les frappes sporadiques de drones ou les attaques sur des navires circulant dans le détroit d’Ormuz révèlent que les pasdarans disposent, dans les provinces de l’Iran, d’une autonomie décisionnelle non seulement militaire et stratégique, mais aussi diplomatique.

Dans ce contexte, il semble vain de vouloir faire plier l’Iran et l’obliger à « capituler » comme l’affirme Trump. Capable de plier sans rompre, le régime iranien a également révolutionné les vecteurs de diffusion de sa propagande en utilisant massivement l’IA et en investissant de nouvelles plateformes, déclinant l’art de la guérilla dans le champ numérique et informationnel. Ici, la RII profite d’une tendance de fond des sociétés occidentale : s’informer sur les réseaux au détriment des médias traditionnels, tendance renforcée par le trumpisme. Une fois encore, la République islamique utilise contre l’administration Trump une rhétorique que cette dernière a elle-même popularisée, illustrant combien l’affaiblissement intérieur des institutions démocratiques états-uniennes par l’actuel locataire de la Maison-Blanche favorise ses pires ennemis sur la scène internationale.

The Conversation

Pierre Firode ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Les lecteurs, nouveau comité éditorial ? Le cas de « Shy Girl »

Bibliothèque publique de la ville de New York, à Manhattan. George Hodan

L’arrivée de l’intelligence artificielle bouleverse profondément le monde de l’édition. Des auteurs n’hésitent plus en effet à y recourir pour écrire, redéfinissant les conditions d’accès au marché du livre. Devant une telle mutation, les lecteurs ne sont plus de simples consommateurs : leur avis devient déterminant dans les choix éditoriaux, au point de faire reculer certains éditeurs. Faut-il les informer de l’usage de ces outils ? Et comment savoir ce qui, dans un texte, relève potentiellement de l’IA générative ?


Ce débat, loin d’être théorique, s’est récemment invité dans l’actualité éditoriale avec l’annonce de la publication du roman d’horreur Shy Girl de l’écrivaine américaine Mia Ballard, prévue au printemps 2026 par le groupe Hachette. Initialement auto-édité en 2025 et fort de presque 2 000 ventes, l’ouvrage avait en effet été repéré par Hachette Group Book pour rejoindre la collection Orbit.

Cependant, une partie des lecteurs a soupçonné que le livre avait été généré par l’intelligence artificielle, déclenchant une vive controverse en ligne qui a conduit l’éditeur a renoncé à sa publication. Le roman a également été retiré des sites de commerce en ligne comme celui d’Amazon et n’a plus été distribué au Royaume-Uni, malgré une première publication en novembre 2025.

Bien que l’autrice nie avoir utilisé l’IA dans la rédaction de son livre, évoquant plutôt le potentiel recours à ces outils par un prestataire lors de son circuit en auto-édition, cette situation met en lumière un phénomène inédit : les lecteurs sont-ils les nouveaux détecteurs d’IA, se substituant au traditionnel comité éditorial, à défaut d’outils fiables pour scruter minutieusement les manuscrits ? Comment expertisent-ils les publications susceptibles d’avoir été générées par IA, au point d’influencer la décision d’un grand éditeur, prêt à sacrifier des ventes pour préserver sa crédibilité aux yeux de son lectorat ?

L’ochlocratie, ou le pouvoir de la communauté littéraire

Shy Girl, originellement auto-édité, a déclenché le mécontentement d’une partie du lectorat en accédant à l’édition traditionnelle. Des internautes témoignent en effet de leurs doutes sur l’authenticité de la prose humaine de Mia Ballard. Sur le réseau social Reddit, plus de 300 commentaires ont été comptabilisés, évoquant son écriture « machinique ». L’avis d’une internaute sur ce sujet a enregistré plus de 1 400 votes positifs.

Reddit n’est pas le seul espace où ce roman est critiqué. Des passionnés du livre se sont aussi exprimés sur YouTube. Dans une vidéo, intitulée « Je suis presque sûr que ce livre est une daube générée par l’IA », publiée en janvier 2026 sur sa chaîne « Un grand lecteur sans ami », le youtubeur Frankie’s Shelf consacre presque trois heures à décortiquer tant la forme que le fond de Shy Girl. Sa vidéo, qui dépasse le million de vues, cherche à indiquer aux lecteurs les caractéristiques de l’écriture « IAgénique ». Ces remarques faisant le buzz, Hachette, confrontée à une telle ochlocratie (du grec « okhlos », qui signifie « foule », et « kratos », « pouvoir », NDLR) a finalement annulé sa publication, illustrant le nouveau pouvoir des foules littéraires dans les dynamiques éditoriales.

Le recours à l’IA lors de la composition d’un livre dans le circuit de l’auto-édition n’est pas un épiphénomène. Son utilisation semble courante, particulièrement sur la plateforme Kindle Direct Publishing d’Amazon. Ouvert à tous et sans filtre éditorial, ce canal de publication permet à des ouvrages générés par IA de franchir facilement les portes du marché du livre. Devant une telle situation, les éditeurs traditionnels s’inquiètent. Guillaume Husson, délégué général du Syndicat de la librairie française, alerte : « Des centaines de milliers de faux livres circulent sur Amazon. » Et Coralie Piton, présidente directrice générale des éditions du Seuil, en analyse les conséquences : « Ils (les livres auto-édités générés par IA) occupent de l’espace numérique, et c’est de l’espace en moins pour les autres. »

Les éditeurs ne sont pas les seuls à s’alarmer. De nombreux auteurs s’inquiètent aussi devant la vitesse d’écriture de tels robots, capables de générer une multitude de textes en quelques prompts. Le journaliste Frank Landymore cite par exemple la romancière Coral Hart qui utilise Claude, l’IA d’Anthropic, pour produire des romans d’amour à la chaîne : « À travers 21 pseudonymes différents, Hart affirme avoir produit plus de 200 romans d’amour l’an dernier [2025] et les avoir auto-édités sur Amazon », note-t-il. Or, si jusqu’ici la plupart des livres auto-édités, générés en tout ou partie par IA, restaient cantonnés sur les plateformes d’auto-édition, ce n’est pas le cas de Shy Girl.

Autopsie d’un corps littéraire

Il n’existe pas encore d’outils fiables capables de détecter avec certitude le recours à l’IA dans l’écriture d’un roman. Si quelques logiciels sont présents sur le marché, leurs résultats sont souvent approximatifs et donc insuffisamment précis pour constituer une preuve solide.

Comment des internautes, généralement non spécialistes en IA, parviennent-ils à déterminer le degré d’IA présente dans un texte, quand les détecteurs automatiques eux-mêmes peinent encore à l’identifier ?

La plupart des internautes sur Reddit sont des lecteurs, des auteurs et quelques éditeurs, éloignés du monde professionnel des technologies qui sont à l’origine des IA génératives. Si certains reconnaissaient commenter sans avoir lu le livre, d’autres, à l’inverse, ont, sans outils rigoureux ni véritable méthodologie, décortiqué chaque paragraphe et dégagé des similitudes récurrentes.

Plusieurs internautes soulignent que Shy Girl aurait pu être facilement identifié par un comité éditorial scrupuleux. Selon eux, l’empreinte de l’IA serait en effet perceptible dès la première phrase du roman : « “Je porte une robe rose, du genre qui promet de la douceur et n’en donne aucune.” Cette première ligne, c’est du pur ChatGPT », souligne @lucxf, en évoquant aussi les structures de phrases réplétives et artificielles qu’il a pu détecter.

D’autres critères reviennent fréquemment comme « les répétitions, l’absence d’intrigue et le style très cliché » indique @KRwriter8, ou encore « l’usage excessif de comparaisons », comme l’écrit @cosmicsprouts, mais aussi « des tics linguistiques, l’absence d’imperfection grammaticale et l’absence de phrases longues et complexes » selon @r/horrorlit.

Au-delà de l’analyse stylistique, le recours à certains signes typographiques, pourtant courant dans la langue française comme l’usage du tiret cadratin, devient aussi un indice suspect comme l’explique @cstrdmnd. Cependant, cette autopsie du texte met en évidence le caractère largement subjectif des critères mobilisés.

Dans ces circonstances, un auteur maladroit ou au style non sophistiqué doit-il pour autant être assimilé à une production d’IA ? Plus largement, faut-il retirer de la vente un livre ayant suscité un réel intérêt en auto-édition, enregistrant une moyenne de 3,51 étoiles sur 5 sur Goodreads en mars 2026, au même titre qu’on retirerait la photo d’un mannequin sous prétexte qu’elle serait photoshopée ?

Malaise chez les auteurs

Au-delà du cas de Shy Girl, cette situation questionne plus largement la question de l’authenticité des écrits. Devant le risque d’une forme de paranoïa éditoriale, les éditeurs, mais aussi désormais les auteurs, s’inquiètent : comment prouver qu’un texte est d’origine humaine ? Une telle question ne s’était sans doute jamais posée dans l’histoire littéraire.

Pour affronter une telle situation, certains écrivains évoquent la nécessité d’archiver leurs traces scripturales. Il ne s’agit plus seulement d’archiver pour conserver les différentes étapes littéraires mais d’archiver pour prouver l’origine humaine d’une publication, ainsi que le suggère @Abcdella. D’autres vont encore plus loin dans la démarche, n’hésitant pas à recourir aux bons vieux cahiers manuscrits afin de documenter l’ensemble du processus créatif de leur travail en cas d’accusation, comme le préconise @trashov. Dans ce contexte, une question demeure : « Verra‑t‑on un jour les auteurs déposer en bibliothèque les prompts relatifs à leurs manuscrits afin que l’on puisse par la suite reconstituer la genèse de leurs écrits ? ». Il s’agit là d’un renversement de situation inédit. Ce ne sont plus les machines qui tentent d’imiter les écrivains, mais les écrivains qui doivent désormais prouver qu’ils ne sont pas des machines.

Reste à savoir jusqu’où ira cette méfiance, car à force de traquer les signes d’une écriture artificielle, le risque est de voir s’installer un climat de suspicion généralisée, où chaque style, chaque tournure, chaque singularité pourrait devenir une preuve à charge. Est-ce qu’à terme un éditeur se verra obliger d’enfermer ses auteurs dans un lieu déconnecté lors de la rédaction d’un manuscrit ?

L’enjeu n’est alors plus seulement de distinguer l’humain de la machine, mais de préserver ce qui fait la valeur même de l’écriture humaine, sa liberté.

The Conversation

Stéphanie Parmentier ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Une brève histoire des méthodes managériales

Comment bien manager ? Cette question est régulièrement remise à l’ordre du jour suivant un cycle, où la préoccupation sociale est éclipsée puis remise au centre de l’attention. Retour sur plus d’un siècle de management.

Cet article est publié dans le cadre d’un partenariat avec la Revue française de gestion, qui a fêté ses 50 ans en 2025.


On sait depuis Schumpeter que le capitalisme, sous le coup des différentes révolutions technologiques, ne cesse de s’adapter et d’évoluer. Mais on s’intéresse moins à la manière dont les organisations ont fait évoluer leurs méthodes de management pour accompagner ces mutations.

Il est donc intéressant, à l’heure où le management algorithmique déferle sur les organisations, de se retourner sur cette évolution, et de remarquer que ces méthodes ne suivent pas un mouvement linéaire (du plus simple au plus sophistiqué), comme on aurait pu le penser, mais oscillent plutôt entre fermeture et ouverture.

Émergence de l’organigramme

Même s’il existait une pensée gestionnaire sophistiquée dès le XVIe siècle dans les organisations pré-modernes (la comptabilité en partie double, par exemple, remonte au XVe siècle), le management traditionnel était assez peu formalisé. De réels dispositifs de gestion formalisés et largement diffusés apparaissent avec l’arrivée de l’énergie à vapeur et des chemins de fer. En effet, pour faire face à la difficulté de gérer leur taille et leur complexité, de grandes organisations dispersées géographiquement s’appuient sur les lignes hiérarchiques, représentées dans des organigrammes (1850-1870).

En contraste avec l’entreprise traditionnelle qui prévalait avant, l’organisation se professionnalise, avec des délégations de responsabilités claires, et des systèmes de surveillance étroits très peu soucieux des conditions de vie des ouvriers. En réaction, des grèves et des mouvements sociaux secouent alors le monde occidental. Apparaît alors une forme de paternalisme très empreinte de charité religieuse (1870-1900).


À lire aussi : La révolution silencieuse du travail en mode projet


Certains capitaines d’industrie se chargent en effet de la mission d’éduquer le « bas peuple » qui, autrement, livré à lui-même, a la fâcheuse tendance à se livrer à l’ivrognerie (ou, pire, à prêter l’oreille aux agitateurs socialistes). Dans le monde anglo-saxon, se développent par exemple les YMCA (les Young Men’s Christian Association) ; et en France, on voit l’apparition des familistères, comme celui de Guise, que l’on peut encore visiter aujourd’hui, voulu par l’industriel Godin.

Un éternel recommencement

On voit naitre un schéma qui se reproduira dans les cycles suivants : dans un premier temps, des méthodes managériales, en réponse à des changements technologiques, cherchent à trouver une organisation efficace, sans vraiment porter attention aux travailleurs qui n’y sont vus que comme les rouages d’une machine ; puis, dans un deuxième temps, sous la pression des mouvements sociaux et de dysfonctionnements récurrents, de nouvelles méthodes managériales prennent davantage en compte les besoins des individus au travail et font une meilleure part à leurs initiatives.

À partir de 1860, acier et électricité viennent révolutionner les manières de construire les chemins de fer, puis toute l’industrie. Les organisations apprennent à organiser les processus de production, de plus en plus complexes, de manière plus rationnelle. C’est là que Taylor expérimente et met au point le management scientifique (1900-1925), qui soumettra l’ouvrier aux cadences de la machine.

Ensuite, l’histoire est bien connue : en réaction aux dysfonctionnements et aux conséquences aliénantes du management scientifique, des psychosociologues comme Elton Mayo ou Kurt Lewin portent l’attention sur les conditions de travail des salariés. Ces théoriciens du mouvement des relations humaines (1925-1955) démontrent que les employés sont avant tout des êtres sociaux guidés par un besoin d’appartenance et de reconnaissance. Des systèmes de compensation, des méthodes de prise de décision participative et de job enrichment apparaissent.

L’organisation comme un programme d’ordinateur

Ce schéma fermeture/ouverture se poursuit avec la révolution technologique suivante : celle de l’automobile et de l’essence. En réaction à la diversification et à la complexification des marchés et des clients, l’organisation multidécisionnelle se développe, permettant de poursuivre des stratégies de différenciation ; et, dans le même temps, la métaphore de l’organisation comme un programme d’ordinateur (c’est-à-dire un système à rationaliser) domine cette période (1955-1975). Les employés sont largement absents de ces dispositifs.

En réaction (et à cause de la concurrence des entreprises japonaises), un nouveau dispositif, le Total Quality Management, se développe (1975-1990). Ici, la place du travail est centrale : les employés sont vus comme des ressources et sont encouragés à s’exprimer et à participer à l’organisation du processus de production. De même, dans les années 80, on se rend compte de l’importance de la culture organisationnelle pour canaliser l’implication, la motivation et la loyauté des employés.

Retour aux collectifs de travail

Mais, ensuite, les progrès informatiques permettent de plus en plus de standardiser et de rationaliser les interfaces entre services afin de faciliter le flux d’informations intra et inter-firmes (1990-2000). Des systèmes comme ceux de l’entreprise SAP sont diffusés à grande échelle et de manière standardisée, mais ces dispositifs sont critiqués pour leur tendance à être implémentés de manière top down. Depuis, différentes tendances apparaissent, qui visent toutes à porter davantage attention aux collectifs de travail et aux connaissances tacites : Knowledge Management, communautés de pratiques, méthodes agiles, entreprises libérées ou encore coworking spaces.

À chaque fois, en réaction à des modèles managériaux trop standardisés présentés comme des solutions ‘ready-made’, voire des solutions miracles, des dispositifs moins rationalistes et plus attentifs à l’humain sont apparus. Aujourd’hui, avec l’arrivée de l’intelligence artificielle, on voit se développer le management algorithmique.

Et, là encore, un premier mouvement de fermeture est observé : la surveillance des employés se fait plus étroite, plus intrusive, et plus opaque. Mais, déjà, de plus en plus d’appels à une IA plus ouverte se font entendre, préfigurant peut-être un nouveau cycle où des méthodes managériales innovantes redonneraient, à nouveau, une place centrale aux individus au travail.

The Conversation

Régis Martineau ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Un groupe d’experts pour éclairer la gouvernance de l’IA par la science

Les États sont en compétition afin de développer le plus rapidement possible des modèles d’intelligence artificielle (IA). Les intérêts nationaux et internationaux des différents acteurs divergent en fonction de leurs enjeux et réalités propres. Ce développement tous azimuts de l’IA suscite des préoccupations croissantes. Un groupe d’experts a été créé afin de dépasser les rivalités et de développer un consensus scientifique à l’échelle de la planète autour de l’IA.

Le 3 février 2026, 40 expertes et experts ont été nommés parmi 2600 candidatures. Sélectionnés pour un mandat de trois ans par la communauté internationale, les candidats constituent ainsi le premier « Groupe scientifique international indépendant de l’intelligence artificielle » (Groupe d’experts). Ce groupe de haut niveau, co-présidé par le professeur québécois Yoshua Bengio, est chargé de rédiger un rapport annuel fondé sur des données fiables synthétisant les recherches existantes sur les « promesses, risques et répercussions » de l’IA, sans toutefois devoir se prononcer sur les enjeux, pourtant de taille en gouvernance mondiale de l’IA, liés au militaire.

Ce groupe constitue un cas d’étude particulièrement intéressant pour les travaux que nous menons dans le cadre de la Chaire en Diplomatie scientifique et gouvernance mondiale de l’IA à l’Université de Montréal puisqu’il représente un exemple prometteur de diplomatie scientifique appliquée à l’IA.


À lire aussi : Les enjeux actuels sont mondiaux. Pour y faire face, il faut créer de véritables partenariats en recherche


Les dangers de l’IA

Que ce soit en raison de leur conception, de leur mise au point ou de leur utilisation, les systèmes d’IA présentent des risques aujourd’hui connus et documentés.

Par exemple, les systèmes d’IA utilisés pour le diagnostic médical peuvent reproduire des biais présents dans les données sur lesquelles ils sont entraînés, avec des taux d’erreur plus élevés pour les femmes et les personnes racisées.


À lire aussi : La pornographie générée par l'IA perturbera l'industrie du sexe et soulèvera de nouvelles préoccupations éthiques


De même, les outils de génération de contenu permettent de produire en quelques secondes des milliers de faux articles ou de fausses déclarations, saturant l’espace public de désinformation, difficile à contrer. Quant aux systèmes de reconnaissance faciale déployés par certains États, ils permettent une surveillance de masse sans consentement, avec des erreurs d’identification documentées ayant conduit à des arrestations injustifiées.

Dans ces circonstances, la création du Groupe d’experts apparaît plus qu’opportune puisqu’il a pour mandat de fournir des connaissances scientifiques vis-à-vis des risques de l’IA et cela de manière indépendante, sans ingérence politique.

Une impasse persistante

Les effets de l’IA dépassent largement les frontières des pays, ce qui plaide en faveur d’une réponse mondiale organisée.

Différents mécanismes et outils de gouvernance ont été adoptés par le passé, que ce soit en recourant à l’éthique (ex : Recommandation sur l’éthique de l’IA de l’Unesco), aux stratégies (ex : Stratégie continentale sur l’IA de l’Union africaine), aux standards (ex : norme ISO/IEC 42001) ou encore aux normes créant des obligations pour les États (ex : Convention-cadre du Conseil de l’Europe sur l’IA et les droits de l’homme, la démocratie et l’État de droit).

Ces différentes initiatives ont posé les premières pierres pour une gouvernance mondiale de l’IA. Pour autant, ces efforts multilatéraux sont limités : peu d’obligations juridiques pour contraindre les entreprises et les États, peu de moyens d’obtenir réparation en cas de violations de ces obligations et, surtout, de nombreux États sont en dehors du champ d’application des quelques normes contraignantes qui existent pour encadrer les systèmes d’IA et les données qu’ils mobilisent à l’échelle internationale.


À lire aussi : L’IA est un raz-de-marée pour la communauté scientifique. Comment réagir ?


C’est notamment le cas des États-Unis ou de la Chine. La course à l’IA ayant pris de l’ampleur et les États ayant affirmé des positions parfois complètement antagonistes (ex : réguler versus libre développement), ces dynamiques nous ont plongés dans une impasse qui essouffle les efforts de gouvernance mondiale de l’IA. La perspective d’un traité international sur l’IA regroupant tous les États semble vaine pour le moment.


Déjà des milliers d’abonnés à l’infolettre de La Conversation. Et vous ? Abonnez-vous gratuitement à notre infolettre pour mieux comprendre les grands enjeux contemporains.


L’ONU choisit la science

C’est dans cette impasse que s’inscrit le pari du Groupe d’experts, qui se distingue des initiatives précédentes puisqu’il ne vise aucunement à dire ce qu’il faudrait faire (caractère normatif), mais à évaluer scientifiquement les risques et les opportunités de l’IA. L’ONU mise ainsi sur la science pour développer des consensus à l’échelle de la planète.

Ce pari peut surprendre au regard du contexte actuel où la science doit faire face à des attaques croissantes sur sa légitimité et à une perte de confiance observée depuis la pandémie de Covid-19. Pourtant, c’est précisément parce que l’IA est une technologie complexe et évolutive que seule une évaluation scientifique rigoureuse permettra d’en saisir les risques réels, d’en anticiper les effets et d’éclairer, ensuite, les décideurs.

Le Groupe d’experts réunit des profils délibérément variés, avec des expertises multidisciplinaires (apprentissage automatique, cybersécurité, droits humains, gouvernance des données…). Cela lui permet de produire des évaluations qui dépassent le seul champ technique pour intégrer les dimensions sociales et éthiques de l’IA.


À lire aussi : C’est la relève en recherche qui mènera les grandes transformations mondiales


Le groupe va ainsi entreprendre de bâtir une compréhension commune et globale de l’IA « fondée non pas sur l’idéologie, mais sur la science ; non pas sur les fausses informations, mais sur la connaissance ». En pratique, cela signifie que le groupe produira des évaluations qui s’imposent par leur rigueur, en limitant l’interférence des intérêts nationaux et des entreprises privées.

Cependant, les experts ne disposeront d’aucun pouvoir décisionnel en matière de politiques publiques. Les rapports qu’ils produiront viseront plutôt à fournir un baromètre scientifique sur les avancées de l’IA pour ensuite permettre aux États de prendre les décisions appropriées sur cette base. Le Groupe d’experts représente ainsi une expression récente d’efforts en matière de diplomatie scientifique.

Un laboratoire inédit pour observer la diplomatie scientifique

Entendue au sens large, la diplomatie scientifique constitue « l’ensemble des pratiques se situant à l’intersection de la science et de la diplomatie », dont la finalité est d’apporter une contribution significative aux défis mondiaux. En l’occurrence, étant notamment appelé à éclairer les discussions engagées lors du Dialogue mondial, une rencontre annuelle entre les gouvernements et les parties prenantes sur l’IA, le Groupe d’experts constitue une forme concrète de diplomatie scientifique.

Ce qui confère au Groupe d’experts un intérêt particulier, au-delà de ses livrables, c’est qu’il va se positionner comme un acteur incontournable de la diplomatie scientifique liée à une technologie numérique de pointe en temps réel. Cela est d’autant plus pertinent qu’il va permettre d’observer la diplomatie scientifique telle qu’elle s’exprime dans une période de reconfiguration.

D’ailleurs, sur ce point, le secteur privé occupe actuellement une place significative tant dans la production scientifique que dans la diplomatie. Par exemple, les géants de la Tech ont participé aux différents sommets sur l’IA, qui sont des rendez-vous pour définir les priorités mondiales et influer sur les négociations et décisions à venir.

Face à des acteurs privés dont l’influence sur les négociations internationales n’a cessé de croître, le Groupe d’experts incarne une logique différente : celle où les conclusions sont guidées par la rigueur scientifique plutôt que par des intérêts économiques. Toutefois, le Groupe ne cherche pas à exclure le secteur privé, qui reste une source essentielle d’innovation.

Les experts éclaireront, mais seront-ils écoutés et suivis ?

Reste la question centrale : la science parviendra-t-elle à faire converger des intérêts nationaux et mondiaux qui peinent à se rejoindre et, surtout, les évaluations scientifiques trouveront-elles écho auprès des décideurs qui restent libres de les ignorer ?

La réponse dépendra en grande partie de la capacité du Groupe à faire valoir ce qui constitue l’un de ses seuls leviers réels : l’expertise reconnue de ses membres, leur capacité à colliger des données de qualité tirées tant de la recherche universitaire que de l’industrie où l’IA de pointe est généralement concentrée et leur indépendance formelle.

Son premier rapport, attendu pour juillet prochain, constituera bien plus qu’un document technique : en moins de six mois d’existence, le Groupe d’experts testera en conditions réelles si la science peut encore faire office de langage commun entre des États aux intérêts profondément divergents, ce qui constituera un laboratoire d’étude précieux sur la diplomatie scientifique de demain dans un contexte géopolitique sous forte tension.

La Conversation Canada

Catherine Régis a reçu des financements des Fonds de recherche du Québec, de CIFAR, des Instituts de recherche en santé du Canada et du Conseil de recherches en sciences humaines du Canada.

Gaëlle Foucault a reçu des financements de IVADO pour ses recherches postdoctorales.

Michel Audet ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Les algorithmes évolutifs, une piste pour rendre les IA plus sobres

Les systèmes d’IA sont souvent critiqués pour leur grande consommation énergétique — à tel point que l’on se demande quelle production électrique va alimenter les data centers dont la construction est prévue à travers le monde. Mais des systèmes d’intelligence artificielle plus sobres existent. Certains s’inspirent de la stratégie évolutionniste de la nature afin d’arriver à une solution la plus simple possible pour un problème donné.


Les principes de sélection naturelle théorisés par Charles Darwin ont permis l’évolution d’êtres vivants remarquablement adaptés à leurs environnements. Le cerveau humain est un exemple remarquable de résultat de cette évolution, ne consommant qu’une vingtaine de watts, soit près de 1000 fois moins qu’une intelligence artificielle le surpassant au jeu de Go. En reproduisant informatiquement ces principes évolutifs, il est possible de construire des intelligences artificielles (IA) plus sobres.

Les progrès fulgurants des IA durant cette dernière décennie sont majoritairement dus à l’utilisation des réseaux de neurones artificiels, dits « profonds », capables d’apprendre efficacement des tâches très diverses. Seulement, l’exécution d’un tel réseau requiert la réalisation de plusieurs millions à plusieurs milliards d’opérations mathématiques par un ordinateur ; et plus la complexité d’une tâche est grande, plus la taille du réseau nécessaire pour la réaliser sera grande également.

L’utilisation massive de réseaux de neurones profonds, toujours plus imposants pour en augmenter les capacités pose un problème de soutenabilité majeur. En effet, ces réseaux nécessitent des ressources naturelles et une énergie croissantes : il faut produire, alimenter et refroidir les processeurs exécutant ces calculs, notamment les GPU.

Pour répondre à ce défi de soutenabilité, il est nécessaire de proposer des technologies d’IA alternatives adaptant naturellement leur complexité à celle de la tâche accomplie pour être plus sobres.

Les approches évolutives pour l’apprentissage d’IA offrent une alternative crédible aux réseaux de neurones profonds, en étant plus sobres tout en restant performantes. En effet, contrairement aux réseaux de neurones dont la taille est fixée par un développeur avant l’entraînement, l’approche évolutive construit une IA dont la taille s’adapte minimalement à une tâche spécifique. Le résultat est une IA d’une complexité calculatoire de plusieurs centaines à milliers de fois inférieure aux réseaux de neurones, et donc naturellement plus sobre.

Mais au fait, c’est quoi l’évolution ?

La sélection naturelle et l’évolution reposent sur trois éléments essentiels : des individus définis par un génome, un mécanisme de reproduction, et un processus de sélection.

En biologie, le génome de chaque être vivant est construit en assemblant des briques de bases communes à une large diversité d’espèces : l’ADN. Le génome d’un être le caractérise en tant qu’individu, déterminant bon nombre de ses traits : forme, physiologie, taille, couleurs ; et le prédispose à certains comportements, tels que la course ou la nage.

Le mécanisme de reproduction permet à un ou plusieurs individus de donner naissance à de nouveaux individus, en copiant et en mélangeant leurs génomes. Cette copie, parfois imparfaite, crée un nouvel individu qui possède son propre génome, lui conférant des traits ressemblant à ceux de ses parents, mais possédant ses propres caractéristiques.

Un ensemble d’individus forme une population, qui existe dans un milieu où ils sont constamment évalués par des mises à l’épreuve : recherche de nutriments, survie en milieu hostile, recherche de partenaire de reproduction. Certains traits vont rendre des individus plus performants pour ces épreuves, augmentant leur chance de survie et de reproduction, quand d’autres traits moins favorables tendront à disparaître : c’est la sélection naturelle. Génération après génération, ce long processus a mené à l’apparition sur Terre d’êtres vivants adaptés à leurs environnements.

Depuis près de 60 ans, l’étude scientifique des algorithmes évolutionnaires a pour but de reprendre ces principes d’évolution pour l’optimisation de systèmes ou d’objets artificiels. Un exemple de cas d’usage concret est l’optimisation d’ailes d’avions, où le « génome » caractérise le profil, la longueur et la largeur d’une aile ; et où l’évaluation d’un individu (un modèle d’aile, en l’occurrence) mesure sa résistance, sa portance, et son poids.

Comment appliquer les principes d’évolution pour construire des IA

La programmation génétique est un domaine scientifique visant à construire des programmes informatiques, dont des IA, en appliquant ces principes évolutifs.

Crédit Image: Nicolas Beuve

Dans sa version la plus simple, l’« ADN » utilisé pour créer un individu est un ensemble d’instructions ou fonctions mathématiques de base : addition, multiplication, cosinus, etc. Le génome de chaque individu est ainsi une suite d’instructions, appelée programme, qui réalise des calculs sur les données de l’environnement.

Imaginons par exemple que l’on souhaite construire une IA chargée de contrôler un robot. L’IA observe des nombres représentant la position actuelle des différents membres du robot, l’angle de ses articulations, et la vitesse de ces différents éléments. Ces nombres sont utilisés pour exécuter l’individu-programme de l’IA. Les résultats des dernières instructions constituent la réponse de l’IA à cette observation, et sont utilisés pour contrôler les différents moteurs du robot.

Le processus évolutif débute par la création d’une population d’individus en générant de courts programmes aléatoires, une simple addition par exemple. La sélection des meilleurs programmes se fait en gardant les plus aptes à réaliser la tâche voulue, par exemple, faire avancer un robot le plus loin possible. Lors des premières générations, même les meilleurs individus sont généralement très mauvais, mais constituent le capital génétique pour la première phase de reproduction. La reproduction d’un programme peut se faire par croisement, en entremêlant les instructions issues de deux programmes parents ; ou par mutation, en reproduisant un programme existant de manière imparfaite pour ajouter ou retirer une instruction. Ce processus est ainsi répété sur de nombreuses générations, et à l’issue du processus d’évolution, le programme du meilleur individu est conservé pour être utilisé comme IA.

Et donc, les IA obtenues par ce processus d’évolution sont plus sobres ?

Durant le processus évolutif, le nombre d’instructions, et donc la complexité des programmes s’adapte automatiquement à la difficulté de la tâche à réaliser. En effet, l’ajout de nouvelles instructions aux génomes des individus ne perdure que si elle leur confère de meilleures aptitudes, favorisant leur survie et reproduction. Ainsi, le processus évolutif favorise naturellement l’émergence de programmes avec peu d’instructions, et pourtant bien adaptés à la tâche.

L’utilisation de programmes ainsi construits ne nécessite pas de puce dédiée de type GPU, et peut généralement être réalisée sur des processeurs peu énergivores déjà existants, et donc plus sobres.

Un autre avantage de l’approche évolutive : l’« interprétabilité »

Si les réseaux de neurones traditionnels sont capables de réaliser des tâches complexes, leur grande complexité calculatoire rend souvent impossible d’interpréter les causes de leurs bons fonctionnements, ou pire, de leurs erreurs. Là encore, la brièveté des programmes issus du processus évolutif est un atout majeur, puisque cela rend possible l’interprétation claire du fonctionnement de l’IA ainsi créée.

Un algorithme évolutionnaire est par nature facile à interpréter. Source : Quentin Vacher.

Cette vidéo en présente un exemple, avec un programme créé pour illustrer cet article qui permet de contrôler une jambe robotique, appelé le « hopper ». Usuellement appris avec des réseaux de neurones complexes, l’évolution génétique a permis à une IA d’apprendre à faire avancer la jambe robot en utilisant des instructions très simples pour contrôler chacun des trois moteurs du robot. De fait, comprendre la causalité des actions de l’IA en fonction des observations est possible, et on voit que le programme démontre une grande logique où chaque moteur est principalement contrôlé par des membres proches de celui-ci.

Quel avenir pour les IA issues de processus évolutifs ?

Dans certains domaines applicatifs, les IA plus sobres issues d’un processus évolutif concurrencent les aptitudes des réseaux de neurones pour un centième (voire un millième) de leur coût, par exemple en robotique ou dans l’industrie de la cyberdéfense. Si le coût de ces IA issues du processus évolutif les rend intrinsèquement plus sobres, il faut néanmoins veiller à ce que cette sobriété ne donne pas lieu à un effet rebond, sous forme d’une utilisation encore plus massive de telles IA pour des applications où cela n’est pas strictement nécessaire.

Ce domaine de recherche offre de nombreuses perspectives et défis à la communauté scientifique, dont la petite taille ne peut rivaliser avec les investissements colossaux autour des réseaux de neurones.

Parmi ces défis, le passage à l’échelle des IA issues du processus évolutif qui ne parviennent pas encore à concurrencer les réseaux de neurones sur les tâches les plus complexes, telles que le contrôle de robots humanoïdes, ou le traitement du langage naturel à la base de bots conversationnels.


Le projet foutics est soutenu par l’Agence nationale de la recherche (ANR), qui finance en France la recherche sur projets. L’ANR a pour mission de soutenir et de promouvoir le développement de recherches fondamentales et finalisées dans toutes les disciplines, et de renforcer le dialogue entre science et société. Pour en savoir plus, consultez le site de l’ANR.

The Conversation

Karol Desnos a reçu des financements de l'Agence Nationale de la Recherche (ANR) au titre du projet ANR-22-CE25-0005-01.

Mickaël Dardaillon a reçu des financements de l'Agence Nationale de la Recherche (ANR) au titre du projet ANR-22-CE25-0005-01.

Quentin Vacher a reçu des financements de l'Agence Nationale de la Recherche (ANR) au titre du projet ANR-22-CE25-0005-01.

Hacker la bombe ? Ce que l’IA Mythos révèle du pari de la dissuasion nucléaire

Claude Mythos est une intelligence artificielle de pointe, développée par la société Anthropic, dont les capacités avancées en cybersécurité offensive suscitent autant de fascination que d’inquiétude. Gguy/Shutterstock

L’apparition de l’IA Mythos, présentée comme capable de détecter rapidement des failles informatiques majeures, montre que les capacités offensives dans le cyberespace progressent très vite. Cette évolution pourrait rendre les systèmes nucléaires plus vulnérables et augmenter le risque d’erreurs, de sabotage ou d’escalade accidentelle.


En 1983, le film WarGames imaginait un adolescent qui, entré par accident dans un système informatique du Pentagone, déclenchait un programme de simulation, lequel était interprété comme un prélude à une guerre nucléaire. Le film avait tant marqué Ronald Reagan qu’il avait interrogé ses conseillers sur la possibilité d’une telle intrusion dans les systèmes américains les plus sensibles. Une semaine plus tard, la réponse était venue : « Monsieur le Président, le problème est bien plus grave que vous ne le pensez. »

Les politiques autour de l’armement nucléaire reposent sur une série de paris, souvent lointains, sur l’avenir de la dissuasion nucléaire. D’abord, les pays dotés de l’arme nucléaire considèrent que la peur de leur riposte suffira toujours à empêcher un adversaire de les attaquer en premier, et qu’ils disposeront toujours de l’expertise et de la chance nécessaires pour prévenir des explosions accidentelles. Ils estiment donc que la possession de l’arme nucléaire sera pour eux, au cours des décennies à venir, source de sécurité et non d’insécurité.

Or, comme nous le montrons avec mes collègues Sterre van Buuren et Benoît Pelopidas, il existe plusieurs scénarios futurs plausibles dans lesquels posséder des armes nucléaires engendrera plus de coûts réels que de bénéfices potentiels dans un monde où la température aura augmenté de plusieurs degrés. Maintenir un arsenal crédible et sûr exigera de faire des choix budgétaires, au détriment d’autres dépenses rendues urgentes par la crise climatique. L’univers des risques existentiels pour un État, qui pourrait justifier l’usage de l’arme nucléaire, peut aussi s’élargir. Des experts s’inquiètent que des risques de pénurie d’eau au Pakistan et en Inde ne deviennent un terrain fertile pour un conflit menant à une escalade nucléaire.

Mais il existe un autre pari, bien plus implicite : celui que les arsenaux nucléaires, qui sont des systèmes technologiques complexes et hautement digitalisées, ne possèdent aucune vulnérabilité cyber qui pourrait être exploitée par un acteur souhaitant empêcher son fonctionnement normal.

La récente percée de l’intelligence artificielle Mythos révèle à quel point les conditions de ce pari peuvent changer sur le long terme.

Mythos et l’avenir de la cybersécurité

Le 7 avril 2026, la compagnie Anthropic – qui commercialise la série de grands modèles de langages (LLM) Claude – annonçait la création de son nouveau modèle d’intelligence artificielle (IA) : « Mythos ». Ce modèle, qui n’a pas été mis sur le marché mais rendu disponible à un groupe de travail restreint composé d’une douzaine des principaux géants américains de la technologie (Google, Microsoft, Apple, NVidia, Amazon Web Services, etc.), obtiendrait un taux de succès sans précédent en matière de détection des failles dans les systèmes informatiques.

Mythos aurait ainsi été capable de détecter, avec un impressionnant taux de succès, des failles « zero-day » dans différents navigateurs informatiques, logiciels ou systèmes d’exploitation. Une faille « zero-day » est une faille de sécurité critique dans un système d’information, contre laquelle aucune protection n’existe pour l’instant, rendant ainsi possible une attaque laissant un délai de « zéro jour » pour réagir. Selon Anthropic, Mythos aurait réussi à développer en un temps record (sans doute moins d’une journée) des méthodes permettant d’exploiter ces failles avec un taux de succès de 72,4 %, largement supérieur aux autres modèles existants.

Si ces informations proviennent de la compagnie elle-même – qui a tout intérêt à exagérer les résultats –, certaines preuves publiques ont toutefois été apportées. Sylvestre Ledru, le directeur de l’ingénierie chez Mozilla responsable du navigateur Firefox, a déclaré que Mythos avait permis de découvrir un nombre « proprement hallucinant » de vulnérabilités dans leurs logiciels. Une faille de sécurité vieille de près de vingt-sept ans, ayant survécu à un grand nombre d’audits, a par exemple été découverte dans un système d’exploitation libre très utilisé par des services de sécurité informatique, OpenBSD.

Mythos révèle un problème de fond : l’augmentation des capacités offensives – non seulement des États, mais aussi d’acteurs privés comme des cybercriminels – dans le cyberspace risque d’être accélérée par le développement de l’IA, et une incertitude émerge quant à la capacité des acteurs défensifs à réagir suffisamment vite pour corriger les vulnérabilités existantes.

Même dans le cas où Mythos ne serait pas à la hauteur des performances annoncées, le développement des LLM depuis le début des années 2020 a montré à quel point leurs performances s’améliorent vite. Nous faisons donc face à une accélération du développement des capacités offensives et de la diffusion de celles-ci à un nombre d’acteurs plus large. Cela signifie une potentielle tendance à la hausse de la probabilité de succès d’une cyberattaque, ainsi qu’une augmentation du nombre absolu de ces attaques.

La vulnérabilité des arsenaux nucléaires

Pour comprendre la vulnérabilité des armes nucléaires aux cyberattaques, il faut avoir à l’esprit le fait que par « arsenal nucléaire », on entend bien plus qu’un stock de têtes nucléaires. Le fonctionnement normal des arsenaux nucléaires modernes repose sur une large configuration de technologies : têtes nucléaires, missiles permettant de transporter ces armes, technologies de communication (permettant d’assurer que l’ordre soit transmis depuis le président jusqu’à l’opérateur chargé d’actionner ces armes), ainsi qu’un ensemble de technologies d’alerte avancée servant à surveiller le ciel à la recherche de potentiels signaux d’une attaque nucléaire adverse. Ces éléments doivent être capables de communiquer entre eux pour assurer le contrôle de ces armes.

Et ils sont plus nombreux qu’on pourrait le penser. Comme le note Herbert Lin, chercheur à l’Université de Stanford et auteur d’une étude sur les cybermenaces contre les armes nucléaires, la métaphore du « bouton nucléaire » est simplifiée : une fois que le président appuie dessus, un ensemble de « cyber-boutons » doivent être pressés pour déclencher les opérations nucléaires, et les contrôler – autant d’échelons où des attaques informatiques pourraient s’insérer pour empêcher, par exemple, l’arrivée de l’information pertinente.

Le président pourrait ne pas recevoir suffisamment d’informations – ou ne pas en recevoir du tout – pour déterminer qu’une attaque est en cours. Ou alors, il pourrait ne pas être en mesure de communiquer à ses forces sous-marines l’ordre de tir. Pis, on pourrait voir se réaliser le scénario catastrophe imaginé depuis les années 1950 : un faux ordre de tir pourrait être communiqué aux opérateurs de missiles.

Les scénarios n’ont pas besoin d’être aussi radicaux : l’ordre pourrait être communiqué, mais avec un retard, ou ne pas être communiqué à l’ensemble des forces, menant à une riposte moindre que celle désirée. Ladite riposte pourrait être bloquée : en 2010, un centre de commandement américain a perdu la communication avec une cinquantaine de missiles nucléaires pendant près d’une heure. Un adversaire pourrait savoir tirer profit de telles failles.

Alternativement, une cyberattaque d’ampleur menée par des acteurs non étatiques pourrait créer l’impression qu’un adversaire cherche à s’en prendre à notre arsenal nucléaire, créant un risque d’escalade par « inadvertance ».

On peut aussi imaginer des actions cyber contre les armes elles-mêmes, le hardware plutôt que le software de l’arsenal. Bien sûr, les acteurs de la sécurité nucléaire ne se contentent pas d’attendre qu’une attaque survienne sur l’un de ces systèmes. Ils développent et testent leurs capacités défensives de manière continue. Le problème est que la complexité des systèmes existants ne permet pas d’affirmer avec certitude qu’il n’existe « aucune vulnérabilité ».

C’est James Gosler, ancien responsable de la sécurité informatique des systèmes nucléaires américains au sein du laboratoire Sandia, qui l’affirme : à partir des années 1980, du fait de la complexification exponentielle des composants internes aux armes nucléaires, « vous ne pouvez désormais plus affirmer que l’ensemble des microcontrôleurs (destinés à assurer le fonctionnement du mécanisme déclenchant l’explosion) sont invulnérables ».

Cela ne signifie pas non plus que des vulnérabilités existent nécessairement. Mais cela veut dire qu’aucun acteur n’est en mesure de savoir s’il y en a. Alors, faut-il craindre que l’arsenal nucléaire français, ou bien n’importe quel autre arsenal ciblant la France, soit « hacké » dans le futur ?

En fait, on ne sait pas. Des scénarios de ce type sont de l’ordre du possible : il n’existe pas de large système d’information complexe dont on puisse garantir, avec une totale certitude, la fiabilité totale. L’évolution des outils permettant des cyberattaques, et leur potentielle diffusion auprès d’un large nombre d’acteurs étatiques et non étatiques, rend ce type de scénario futur potentiellement plus probable et, dans tous les cas, plausible.

Un nouveau pari sur le futur

Mythos met en lumière une nouvelle modalité du pari nucléaire, née du développement des nouvelles technologies et de leur intégration aux arsenaux nucléaires.

Nous parions d’abord sur l’absence de vulnérabilité au sein de ces systèmes – alors même qu’il est impossible de mesurer cette probabilité avec certitude. Elle évolue avec le temps, au rythme des systèmes mis à jour, remplacés, connectés à d’autres. Si une vulnérabilité existe malgré tout, nous parions ensuite sur le fait que, en temps voulu, l’évolution des capacités offensives dans le cyberespace sera constamment égalée, et toujours à temps, par l’évolution des capacités défensives – y compris à l’ère de l’intelligence artificielle. Là encore, cette probabilité est elle aussi indéterminable, puisque le développement de capacités défensives est réactif : il se fait en fonction de la connaissance que l’on a de la nature des capacités offensives et des vulnérabilités existantes, qui sont indéterminables.

Nous faisons donc le pari que nos défenses contre les cyberattaques, et celle des autres États dotés d’armes nucléaires, seront suffisantes. Dans le cas contraire, alors on fait le pari que la chance sera de notre côté et que les vulnérabilités existantes ne seront pas détectées – comme celle qui existait depuis 27 ans dans le code d’OpenBSD. Il s’agit d’un pari sur la chance puisque dans ce scénario, c’est l’incapacité ou l’absence de volonté adverse, sur laquelle nous n’avons aucun contrôle, à développer des capacités efficaces qui nous sauve.

La capacité des pratiques existantes de contrôle à remplir leur tâche est rendue plus incertaine par l’arrivée de grands modèles d’IA capables de détecter des vulnérabilités et concevoir des cyberattaques de façon massive et automatisée. Faire le choix d’une politique de sécurité fondée sur les armes nucléaires revient à parier sur le fait que, dans le futur comme par le passé, la chance restera toujours de notre côté.

The Conversation

Ce travail a été financé par le Conseil Européen de la Recherche (ERC) au titre du programme-cadre de l’Union européenne pour la recherche et l'innovation Horizon Recherche (projet RITUAL DETERRENCE, convention de subvention n°101043468).

Une méthode innovante pour détecter l’Alzheimer de manière précoce, grâce à l’analyse du langage et à l’IA

L’analyse du langage permet d’identifier précocement les signes de déclin cognitif. Un projet en cours pourrait transformer la prise en charge de la maladie d’Alzheimer.


Pour améliorer le dépistage précoce de cette maladie neurodégénérative qui touche le tiers des personnes âgées de 80 ans et plus au Canada, mon équipe de recherche et moi, à l’ÉTS, cherchons à élaborer une méthode innovante basée sur l’intelligence artificielle (IA). Notre approche, non invasive et accessible, repose sur l’analyse du langage des patients.


Cet article fait partie de notre série La Révolution grise. La Conversation vous propose d’analyser sous toutes ses facettes l’impact du vieillissement de l’imposante cohorte des boomers sur notre société. Manières de se loger, de travailler, de consommer la culture, de s’alimenter, de voyager, de se soigner, de vivre… découvrez avec nous les bouleversements en cours, et à venir.


Le langage comme indicateur de troubles cognitifs

L’un des premiers signes de la maladie d’Alzheimer est la modification subtile du langage. Les personnes peuvent, par exemple, avoir du mal à trouver leurs mots, utiliser des pronoms à la place de noms ou multiplier les pauses. L’expression de leurs idées est moins dense.

Une première étude sur le sujet a procédé à une analyse manuelle des écrits autobiographiques de religieuses âgée dans la vingtaine. Elle a conclu que la densité des idées exprimées était un bon prédicteur de la maladie d’Alzheimer, même si la maladie se présentait 50 ans plus tard.

L’outil que nous avons conçu analyse ces indices linguistiques avec un test simple : la description d’images. Ce test fait partie de l’outil diagnostique BDAE (Boston Diagnostic Aphasia Examination). Il consiste à demander au patient de décrire une image. Ce test permet d’évaluer divers aspects du langage oral. La figure suivante présente une des images utilisée.

Cookie Theft Image
Une image utilisée lors de l’application du Boston Diagnostic Aphasia Examination pour l’évaluation du langage. CC BY-NC

Cette approche nous permet de mesurer la richesse lexicale, la complexité syntaxique et les marqueurs d’hésitation, autant de signes précurseurs du déclin cognitif.

Nos travaux montrent qu’en analysant les changements subtils dans la structure du discours, nous pouvons identifier jusqu’à 85 % des patients atteints d’Alzheimer, même à un stade très précoce.

Une solution de rechange aux outils cliniques traditionnels

Contrairement aux méthodes classiques de diagnostic, qui reposent souvent sur des tests cognitifs (qui incluent notamment ceux de description d’images) ou des techniques d’imagerie lourdes et coûteuses, notre approche permet une détection accessible et un suivi fréquent.

Actuellement, les tests cliniques de description d’image exigent une évaluation manuelle des réponses des patients, ce qui est long et imprécis. Les cliniciens doivent retranscrire mot pour mot les réponses des patients, ce qui est une tâche pratiquement impossible dans un cadre hospitalier.

Avec notre technologie, nous automatisons cette étape et extrayons des centaines de caractéristiques du langage pour affiner l’analyse.

Notre procédé permet non seulement de détecter la maladie, mais aussi de suivre son évolution et d’analyser l’effet des traitements. Nos outils peuvent mesurer les progrès des patients au fil du temps, ce qui est essentiel pour évaluer l’efficacité des traitements.

Des défis techniques et éthiques à relever

Malgré les avancées prometteuses, l’intégration de l’IA dans le domaine médical pose encore des défis.

Un des enjeux majeurs est l’acceptabilité par les professionnels de la santé et les patients. Il faut non seulement prouver l’efficacité de ces outils, mais aussi rassurer quant à la protection des données personnelles et l’éthique de leur utilisation.

De plus, l’analyse du langage repose sur des algorithmes qui doivent être entraînés sur des bases de données représentatives. Nous devons nous assurer que notre modèle fonctionne pour des personnes de différentes origines linguistiques et socioculturelles. Dans le cadre de notre recherche, nous nous assurons de collecter des données diversifiées au Canada mais aussi en Équateur et au Mexique.

Un programme (ou un logiciel) classique fonctionne sur la base d’un processus logique dans lequel s’enchaîne un ensemble d’instructions qui traite les données d’entrée pour produire un résultat en sortie.

L’IA utilise des données autrement : elle s’en sert pour y détecter des patrons récurrents. Le processus est similaire pour une autre IA qui détecterait d’autres types de problèmes. Seules les données changent. Si celles-ci ne sont pas assez variées, l’IA se collera à cette réalité, ce qui peut engendrer des biais culturels ou linguistiques et nuire à la fiabilité des diagnostics.

Ainsi, dans une de nos expériences, l’IA n’était pas adaptée au fait qu’à une certaine époque, les femmes portaient souvent des tabliers dans la cuisine. Bien que ce mot s’avère très pertinent pour évaluer la qualité des descriptions, l’IA avait évacué ce mot, car il n’apparaissait pas avec suffisamment de fréquence.

L’autre problème rencontré concerne la qualité des IA intermédiaires utilisées pour transformer le signal de la parole en texte écrit (transcriptions). Les IA qui résolvent cette transformation sont moins performantes pour le français (et plus particulièrement le français parlé du Québec et du Canada en général) et encore moins pour l’espagnol.

Une technologie aux multiples applications

Les implications de cette recherche dépassent le cadre de la maladie d’Alzheimer. Nous travaillons également sur l’aphasie qui affecte la communication, tant dans la compréhension que dans le langage. Cette condition peut être le résultat d’un accident vasculaire cérébral ou un traumatisme crânien.

Notre équipe de recherche explore aussi l’utilisation de ces outils pour les enfants autistes non verbaux, qui apprennent souvent le langage différemment. Par exemple, nous avons constaté que certains de ces enfants acquièrent une langue grâce à l’exposition à des vidéos sur YouTube, ce qui ouvre de nouvelles pistes d’exploration sur l’apprentissage du langage.

Ces travaux s’inscrivent dans une perspective plus large visant à mieux comprendre les liens entre langage et cognition. L’intelligence artificielle nous permet d’extraire une quantité d’informations que l’humain ne pourrait pas analyser à grande échelle. L’objectif final est de développer des outils adaptés aux besoins des cliniciens et des patients, pour améliorer leur qualité de vie.

Un avenir où IA et santé convergent

L’intégration de cette technologie dans les pratiques médicales pourrait révolutionner la prise en charge des troubles cognitifs. Notre but est de rendre ces outils accessibles à tous, sans que cela requière du matériel sophistiqué.

Cette approche pourrait ainsi permettre une détection précoce et un suivi plus personnalisé, bénéficiant à des millions de patients partout dans le monde.


Déjà des milliers d’abonnés à l’infolettre de La Conversation. Et vous ? Abonnez-vous gratuitement à notre infolettre pour mieux comprendre les grands enjeux contemporains.


En combinant l’IA et les sciences cognitives, notre équipe de recherche pave la voie à une médecine plus prédictive, mieux adaptée aux besoins des patients et plus efficace dans la lutte contre les maladies neurodégénératives.

Bien que nous soyons encore au début de cette révolution technologique, les avancées actuelles montrent déjà un potentiel considérable. En rendant ces outils accessibles, nous espérons transformer la manière dont nous abordons le diagnostic et le suivi des troubles du langage.

En parallèle, notre équipe travaille déjà à de nouvelles collaborations avec des établissements médicaux pour tester ces technologies en milieu clinique.

Nous espérons qu’à terme, nos outils puissent être intégrés directement dans les protocoles de soins, afin d’offrir un suivi plus précis et adapté aux besoins individuels des patients.

La Conversation Canada

Sylvie Ratté a reçu des financements du CRSNG et de MITACS.

Les « world models », lorsque l’intelligence artificielle apprend à comprendre le monde

Les systèmes d’intelligence artificielle générative, qui parlent si bien, ne comprennent pas encore le monde. De nouvelles méthodes physiques ou statistiques comme les world models, ou « modèles de monde », permettraient de les doter d’une forme de sens commun, qui leur servirait à mieux simuler la réalité et de mieux interagir avec elle.


Imaginez un enfant qui, après avoir vu une balle rouler derrière un canapé, sait instinctivement qu’elle continue d’exister et peut anticiper l’endroit précis où elle réapparaîtra. Cette capacité fondamentale, que la psychologie appelle la permanence de l’objet, constitue un socle de l’intelligence humaine. Nous ne nous contentons pas de réagir aux images qui frappent notre rétine ; nous simulons en permanence le futur dans notre esprit.

Aujourd’hui, l’intelligence artificielle tente de franchir ce cap décisif. Après l’ère des modèles capables de générer du texte, comme ChatGPT, ou des images, comme Midjourney, une nouvelle frontière se dessine avec les world models (« modèles de monde »). L’enjeu est de taille : il s’agit de doter les machines d’une forme de sens commun physique, spatial et logique pour qu’elles cessent d’imiter… et commencent enfin à comprendre.


À lire aussi : L’esprit est-il une machine prédictive ? Introduction à la théorie du cerveau bayésien


Ces modèles montrent d’ores et déjà des résultats prometteurs en laboratoire ou dans des environnements simulés. Néanmoins, leur maturité reste limitée et leur déploiement réel est encore restreint aujourd’hui.

Pourquoi les IA actuelles restent-elles en partie limitées ?

Les systèmes d’IA les plus célèbres aujourd’hui sont des modèles génératifs, à l’instar de Claude ou de ChatGPT. Ceux-ci excellent à prédire le mot suivant dans une phrase ou le pixel suivant dans une image, en s’appuyant sur des corrélations statistiques monumentales.

À partir de cette idée de base, les premières preuves mesurables de raisonnement et de bon sens fonctionnel ont été observées dans l’histoire de l’intelligence artificielle (IA). Cependant, comme le soulignent régulièrement des chercheurs du domaine, tels que Yann Le Cun, directeur scientifique d’AMI Labs ou Fei-Fei Li, directrice scientifique de Worldlabs, ces modèles n’ont pas de représentation interne cohérente de la réalité physique.

C’est ce qui explique notamment leurs fameuses hallucinations : un modèle de langage peut affirmer avec une assurance totale qu’un œuf de vache est un ingrédient de cuisine classique, simplement parce qu’il manipule des concepts sans comprendre pleinement les contraintes biologiques du monde réel. Pour dépasser ce stade de « perroquet stochastique » (« stochastique » désignant un phénomène ou un modèle qui intègre le hasard de manière structurée, comme un calcul de probabilités où l’imprévu devient une donnée clé), l’IA doit intégrer une architecture capable de modéliser les causes et les effets.

Cette ambition n’est pas nouvelle, mais elle bénéficie aujourd’hui d’un alignement technologique inédit. Dès 1943, le neuroscientifique Kenneth Craik suggérait déjà que le cerveau humain fonctionne en construisant des modèles de petite échelle de la réalité pour anticiper les événements. Ainsi, lorsque l’on traverse la rue, notre cerveau imagine d’avance la trajectoire des voitures pour savoir quand il est sûr de passer.

Ce qui a changé depuis, c’est que nous disposons de la puissance de calcul et des cadres mathématiques suffisants pour tester cette hypothèse à l’échelle de machines complexes. L’intérêt pour ces modèles a notamment explosé après les travaux pionniers de David Ha et Jürgen Schmidhuber, en 2018. Ils ont montré qu’une IA pouvait apprendre à conduire dans un environnement virtuel en s’entraînant presque exclusivement dans ses propres « rêves ». Ces « rêves » correspondent à une simulation interne, créée par l’IA elle-même, qui lui permet de tester différentes stratégies sans interagir avec le monde réel.

L’architecture des modèles de monde

Ces auteurs ont introduit la notion de « modèle de monde » : une représentation interne et structurée d’un environnement qui permet à un agent d’anticiper les conséquences de ses actions. Le modèle virtuel synthétise l’information observable pour construire une version abstraite et manipulable du monde réel, facilitant la planification, la simulation et la prise de décision, même dans des situations complexes ou incertaines. Sur le plan technique, un modèle de monde repose sur une mécanique de compression de l’information et de prédiction.

Plutôt que de se contenter d’identifier des objets comme « chat » ou « balle » après apprentissage, un modèle de monde apprend à représenter le monde de manière plus riche et structurée.

Dans un premier temps, le système observe d’énormes quantités de données et en extrait une représentation compacte des dynamiques essentielles, par exemple la trajectoire d’un objet, la rigidité d’une surface ou les interactions spatiales entre plusieurs éléments (la patte du chat qui joue avec la balle). Cette abstraction ne se limite pas à des labels : elle capture des régularités physiques et logiques du monde.

Dans un second temps, le modèle peut simuler des scénarios futurs en utilisant cette représentation (la balle passe sous un fauteuil et le chat essaye de la dégager). Ainsi, si l’agent doté du modèle de monde précédemment décrit envisage une action, elle peut prédire ses conséquences avant même de l’exécuter, dans un environnement potentiellement incertain ou bruité.

Autrement dit, contrairement à la simple classification statistique « ceci est un chat », le modèle de monde apprend une sorte de mini-simulation interne du monde, qui combine perception, compréhension spatiale et logique, et capacité à anticiper.

Ici, l’approche reste statistique, similaire à l’apprentissage par renforcement, mais sans recours direct à des modèles physiques explicites ; elle se fonde uniquement sur les régularités observées dans les données (les balles qui roulent sous les objets en ressortent ou y restent coincées). Cette distinction entre approches statistique et physique devient importante lorsqu’on aborde des environnements complexes et incertains, où les prédictions doivent intégrer la variabilité naturelle du monde réel.


À lire aussi : Des pistes pour une IA digne de confiance : mélanger expertises humaines et apprentissage automatique


Plusieurs propositions récentes illustrent le potentiel de l’approche statistique des modèles de monde. Le modèle V-JEPA de Meta apprend, par exemple, à comprendre les interactions physiques complexes en regardant simplement des vidéos, sans aucun étiquetage humain. De son côté, Google DeepMind a récemment dévoilé Genie, une architecture capable de créer des mondes virtuels interactifs à partir d’une simple photographie, prouvant que la machine a assimilé auparavant les lois de la physique et de la perspective.

Des applications qui touchent la société

Les répercussions de cette technologie sont massives et dépassent largement le cadre de l’informatique théorique.

En robotique, par exemple, un agent équipé d’un modèle du monde pourrait apprendre à manipuler des objets fragiles ou à se déplacer dans un entrepôt encombré sans passer par des milliers d’heures d’essais physiques coûteux et risqués.

Dans le secteur des véhicules autonomes, des pionniers, comme Wayve, affirment utiliser des modèles du monde pour que les voitures anticipent les comportements difficiles à prévoir des piétons ou des autres conducteurs, là où les systèmes classiques se contenteraient de réagir avec un temps de retard.

Dans le domaine de la santé, les jumeaux numériques sont encore en phase d’exploration et servent à simuler comment une maladie pourrait évoluer en réponse à un traitement expérimental. Toutefois, ces modèles ne donnent pas des prédictions certaines : ils sont dits « probabilistes », ce qui signifie qu’ils reposent sur des calculs de probabilités. Autrement dit, ils estiment plusieurs évolutions possibles d’un patient (amélioration, stabilité, aggravation) et attribuent à chacune une chance de se produire, en fonction des données disponibles et de modèles statistiques. Par conséquent, ces simulations restent des estimations, et non des certitudes. Elles doivent donc être validées avec beaucoup de rigueur, en particulier lorsqu’elles concernent des traitements qui n’ont encore jamais été testés en conditions cliniques réelles.

Les progrès de l’IA nous amènent à repenser ce que signifie réellement « comprendre » et « anticiper » dans un monde complexe. À terme, explorer ces questions pourrait non seulement transformer la technologie, mais aussi notre manière d’appréhender la cognition et la créativité humaines.

Il est important de nuancer l’enthousiasme autour de ces modèles. En dépit des avancées, celles-ci demeurent pour l’instant à l’échelle de la recherche et du développement. Par exemple, dans la robotique et les véhicules autonomes, la majorité des applications sont encore à l’état de prototypes ou de pilotes contrôlés, souvent dans des environnements très structurés.

L’adoption à grande échelle nécessitera de surmonter des défis techniques et réglementaires majeurs, comme la robustesse face à des situations imprévues ou la sécurité dans des contextes réels complexes. Ainsi, ces modèles sont en phase d’expérimentation avancée, et non opérationnels partout et tout le temps – même si leurs perspectives restent très prometteuses.

The Conversation

Julien Perez est membre de bpifrance, directeur de la recherche en AI.

L’adaptation silencieuse : ces transformations qui échappent aux politiques publiques

À l’échelle locale, de nombreuses actions naissent spontanément pour faire face aux aléas du climat. Rarement revendiquées comme des mesures d’adaptation aux changements climatiques, elles passent souvent inaperçues des politiques publiques.


Les rapports scientifiques, les injonctions politiques et les plans nationaux se succèdent pour enjoindre les territoires à s’adapter aux nouvelles réalités climatiques. Pourtant, une question demeure : comment l’adaptation se déploie-t-elle de manière concrète sur le terrain ? Si les annonces de projets ou de cadrages réglementaires occupent souvent le devant de la scène, d’autres formes de réorganisation sont à l’œuvre, bien plus discrètes, que l’on peut regrouper sous l’appellation d’« adaptation silencieuse ».

Derrière cette qualification se cachent de multiples initiatives individuelles, corporatives ou collectives qui, sans être désignées ou étiquetées « adaptation », transforment pourtant peu à peu les organisations et les territoires. Prendre en compte ces dynamiques et mieux en saisir les contours pourrait s’avérer pertinent pour éviter que les politiques publiques ne passent à côté d’une partie de la réalité vécue sur le terrain par les populations et les entreprises.

L’adaptation, une notion toujours en quête de sens au niveau de sa déclinaison pratique

Penchons-nous sur un cas, pour bien comprendre. Face à la baisse continue de ses récoltes qui subissent un mildiou tenace dû à des épisodes météo capricieux, un viticulteur installé dans l’Aude bénéficie depuis 2021 d’informations collectées par les stations météorologiques positionnées sur son secteur par le biais d’un technicien mis à disposition par la Chambre d’agriculture départementale. Ces précieuses données lui permettent d’anticiper aux mieux les conditions climatiques défavorables en attendant l’homologation par l’Inrae de nouvelles variétés de cépages plus résistants aux maladies, testées dans le cadre d’une collaboration.

Pourtant, à aucun moment ce viticulteur ne mentionne ces mesures comme étant des actions d’adaptation aux changements climatiques, alors même qu’elles participent à la transformation de son exploitation afin de faire face à l’accélération de nouvelles réalités climatiques.

Affublée de « parente pauvre » des agendas politiques climatiques internationaux ou nationaux pendant longtemps, l’adaptation aux changements climatiques est aujourd’hui un des termes les plus en vue. En témoigne la 3ᵉ édition du Plan national d’adaptation au changement climatique, la multiplication des Trophées de l’adaptation ou encore la nette augmentation des publications scientifiques et médiatiques sur le thème.

Pourtant, derrière sa priorité affichée dans les politiques publiques climatiques, l’adaptation se heurte toujours à plusieurs difficultés au moment de sa déclinaison opérationnelle, parmi laquelle celle d’être identifiée comme telle. Ainsi, l’artisan chocolatier qui n’a pas le choix de diversifier et trouver de nouvelles sources d’approvisionnement de cacao après les récoltes désastreuses de son fournisseur habituel situé en Côte d’Ivoire ne va pas mentionner sa démarche comme une adaptation aux changements climatiques.

Pour une large part des professionnels qui travaillent dans l’émergent domaine de la résilience face aux changements climatiques, en revanche, s’adapter n’est souvent rien d’autre que la réactualisation d’une gestion des risques 3.0 dopée par de nouveaux moyens techniques d’anticipation que rejoint progressivement l’intelligence artificielle (IA) régénérative. Des cartes colorées et chiffrées issues de modèles climatiques toujours plus performants sont alors proposées comme supports de base à l’élaboration d’actions à planifier par le client.

Pourtant, dès 2004, les chercheurs Suraje Dessai et Mike Hulme interrogeaient cette logique « descendante » et sa pertinence en termes d’opérationnalisation de l’adaptation. Dès lors, malgré l'horizon régulièrement annoncé de « transformation » des territoires et des activités, l’objectif est affiché : accroître la résilience des caractéristiques de vie telles qu’installées depuis plusieurs générations pour faire face à une France à + 4 °C autour de 2100.

Mais à l’échelle locale, une autre partition se joue chez les populations qui se retrouvent confrontées à des aléas climatiques toujours plus violents. Ainsi, dans une clinique située en région Grand-Est, une circulaire confirme que les horaires peuvent évoluer lors d’épisodes désormais récurrents de grandes chaleurs afin de protéger les employés et les patients. En parallèle, des discussions ont lieu au sein de la direction afin d’évaluer la possibilité de proposer des tenues vestimentaires plus adéquates pour les préposés aux soins.

Autant d’actions qui incarnent de nouvelles pratiques sans toutefois vêtir la terminologie « adaptation » au moment d’interroger les acteurs. C’est que pour assurer la continuité de leurs services ou la pérennisation de leurs activités professionnelles, la marge de manœuvre des collectivités et des entreprises est étroite : concrètement, il s’agit avant tout de bricoler face à des contraintes financières, techniques ou administratives qui s’accumulent. De multiples acteurs locaux œuvrent ainsi silencieusement à l’écart des radars administratifs qui comptabilisent, décernent ou mettent en avant les meilleurs élèves en matière d’adaptation.

L’adaptation silencieuse : au-delà des injonctions

Pour qualifier le phénomène qui ressort régulièrement des entretiens et observations menés tout au long de ces deux dernières décennies auprès d’acteurs de terrain, j’ai choisi le terme d’« adaptation silencieuse », en référence aux travaux du philosophe François Jullien.

Pour décrire les changements continus qui sont au cœur de la vie, telle que la vieillesse ou l’évolution des sentiments, François Jullien utilise dès 2009 le terme de « transformations silencieuses », terme qu’il applique également aux changements climatiques :

« Que sont les changements climatiques sinon des transformations silencieuses, issues d’une corrélation indéfinie de facteurs se produisant infinitésimalement et de manière continue à l’échelle globale ? »

À son tour envisagée comme une transformation silencieuse, l’adaptation peut ainsi être perçue comme un processus de réorganisation continue par lequel les systèmes se structurent en fonction de l’évolution climatique en vue d’assurer leur viabilité.

Associer « adaptation » et « silencieuse », permet aussi d’évoquer une réalité : beaucoup d’acteurs n’utilisent que peu, volontairement ou pas, le vocabulaire associé aux démarches d’adaptation prônées dans les injonctions. Ici, on ne communique pas avec des « diagnostics de vulnérabilité », des « expositions aux aléas » ou des « facteurs de sensibilité ». On surveille la météo au jour le jour, et on avise selon les moyens du bord : on change les dates de semis, on reporte le chantier ou on nettoie les abords de la rivière voisine.

Ensuite, il s’agit d’opérer dans une temporalité qui va permettre la continuation de l’activité, le maintien de la bonne relation avec le client ou l’amoindrissement du choc pluvial à venir. L’horizon temporel s’étend de la veille au lendemain jusqu’à « la prochaine fois ». L’horizon spatial, lui, se situe à l’échelle des 120 mètres carrés du mur nord de l’église du XIVᵉ siècle en proie à un retrait gonflement d’argile prononcé, à l’échelle de la parcelle en herbage censée assurer le troupeau des dix-sept brebis jusqu’au mois prochain ou à l’échelle des quatre employés de l’équipe municipale en charge de débroussailler les abords ouest du village. Ces chapelets d’initiatives successives mises en place « pour faire face à cette météo déréglée » s’égrènent sur le territoire et participent de l’adaptation.

Concrètement, ces réorganisations invisibilisées sont autant de processus non explicitement désignés comme des adaptations aux changements climatiques qui se révèlent par l’usage, et non par le décret : redoutant un nouvel été, « comme celui de l’an dernier », le bureau de l’agence immobilière teste sa clientèle sur de nouveaux horaires en période estivale afin de garantir le confort thermique de ses employés.

Pour les chercheurs qui arpentent les territoires, ces formes d’action sont plus répandues qu’on ne le pense. Elles se distinguent de l’action publique par plusieurs caractéristiques, parmi lesquelles l’absence de label, une décentralisation maximale et une optimisation de l’apprentissage pas à pas : n’ayant pu accéder au marché hebdomadaire du fait des routes inondées, l’exposant du camion-boucher se renseigne sur les possibilités d’autres marchés en faisant appel à son réseau afin d’élaborer un nouveau calendrier annuel prenant en compte ces obstacles météo récurrents.

S’adapter, c’est aussi écouter ce qui se met en place sans bruit et dans l’ombre. L’illusion réside dans le fait de se croire rassuré par la tangibilité d’une adaptation bruyante. Or, le silence a également le potentiel de construire une capacité à habiter le monde qui se dessine chaque jour un peu plus sous nos yeux. En quête d’efficacité, les politiques publiques pourraient avoir tout à gagner en cessant de considérer les acteurs locaux comme des récepteurs passifs de schémas directeurs pensés pour eux.

The Conversation

Guillaume Simonet-Umaña est coordonnateur de l'association Reconnexion - Expertise Climat Occitanie.

L’IA sait tout produire… mais pas encore juger : pourquoi nous devenons des opérateurs de l’abondance

Et si on ne posait pas la bonne question quand on s’inquiète de l’impact des intelligences artificielles sur l’emploi ? Au-delà des emplois potentiellement détruits ou créés, que restera-t-il, et que doit-il rester, à l’humain ? Loin de remplacer tous les cols blancs, les IA vont modifier le rôle dévolu à chacun, ce qui devrait mobiliser l’enseignement pour apprendre aux plus jeunes à devenir des opérateurs d’abondance.


Le 10 mars 2026, le PDG de Nvidia Jensen Huang publiait un essai déclarant que l’IA crée plus d’emplois qu’elle n’en détruit. Quelques jours plus tôt, les économistes d’Anthropic publiaient des données empiriques racontant une histoire bien plus nuancée. Entre ces deux lectures, une question demeure entière : dans un monde où la machine produit instantanément, abondamment, et souvent convenablement, qu’est-ce que l’humain doit impérativement conserver comme capacité propre ?

Il y a quelque chose de troublant dans le débat actuel sur l’intelligence artificielle et le travail. Ce n’est pas qu’il soit faux, c’est qu’il pose systématiquement la mauvaise question. On se demande si l’IA va détruire des emplois, si les cols blancs sont les nouvelles victimes du progrès technique, s’ils vont connaître à leur tour « une sorte de désindustrialisation ». Ce débat est légitime.

Mais il écarte une interrogation autrement plus profonde qui consiste à s’interroger sur ce que doit conserver l’humain comme capacité propre dans un monde où la machine produit instantanément, abondamment, et souvent convenablement ? Pour répondre à cette question, le concept d’opérateur de l’abondance apporte un éclairage à maints égards pertinent.


À lire aussi : L'IA générative ne détruira pas votre emploi mais elle va changer profondément votre métier


L’abondance n’est pas la valeur

Jensen Huang utilise une formule a priori séduisante selon laquelle l’IA génère des réponses en temps réel, contextualisées et d’une plausibilité souvent confondante. En quelques secondes, elle produit un projet de conclusions judiciaires, une synthèse bibliographique, une analyse de risques, un plan de cours. C’est techniquement exact. Mais cette exactitude masque une ambiguïté fondamentale : produire ne signifie pas valoir.

La vraie question n’est pas « Est-ce que ce contenu est bon ? », mais pour qui est-il bon ? Dans quel contexte ? Avec quelles conséquences si l’on se trompe ? Et à cette question, le modèle ne répond pas, parce qu’elle exige une forme de connaissance que le philosophe Michael Polanyi qualifiait de tacite dans ses travaux sur les fondements du savoir scientifique « We can know more than we can tell », y écrit-il), un savoir qui vit dans la mémoire des situations, dans l’expérience accumulée des erreurs, dans la lecture des rapports de force d’une organisation, dans la sensibilité aux attentes implicites d’une juridiction ou d’un comité. Ce savoir-là ne se met pas dans un prompt, parce qu’il n’est pas de l’ordre de ce qui peut être intégralement formulé, et qu’il résiste, par nature, à toute tentative de formalisation complète.

Miroir amplificateur

C’est ici que les données empiriques publiées en janvier 2026 par les économistes d’Anthropic fournissent un éclairage décisif. Parmi les millions d’interactions analysées avec Claude, 52 % relèvent de modes augmentatifs. Autrement dit, l’humain itère, ajuste, réoriente. Il ne délègue pas, il collabore. Et surtout, les auteurs constatent une corrélation quasi parfaite entre la sophistication de la question posée et la qualité de la réponse obtenue.

Le modèle est un miroir amplificateur, il ne produit de valeur cognitive que dans la mesure où celui qui l’interroge est capable de formuler ce qu’il cherche. L’abondance que génère l’IA n’est donc pas une ressource libre d’accès. Elle est conditionnée par la compétence de celui qui la sollicite. Ce n’est pas une loi technique, c’est une loi cognitive.

L’opérateur de l’abondance

Il conviendrait d’appeler « opérateur de l’abondance » la figure professionnelle que l’économie de l’IA requiert, et que nos systèmes de formation ne produisent pas encore. Ce n’est ni le programmeur de modèles ni l’utilisateur passif. C’est quelqu’un qui sait formuler un problème en termes exploitables par un modèle, évaluer la pertinence et la fiabilité d’un output, injecter le contexte que la machine ne peut pas avoir et assumer la responsabilité d’une décision fondée en partie sur des suggestions qu’il n’a pas lui-même générées.

Cette compétence n’est pas technique au sens étroit. Elle est profondément intellectuelle. Elle suppose d’avoir été formée à la pensée critique, à l’argumentation, à l’identification des biais. Elle suppose d’avoir fait l’expérience de se tromper et d’avoir appris à détecter pourquoi. En un mot, elle suppose d’avoir été exposé à la difficulté des tâches que l’on délègue désormais, avant de les déléguer.

Le risque silencieux de la délégation aveugle

C’est là que le rapport publié le 5 mars 2026 par les économistes d’Anthropic Maxim Massenkoff et Peter McCrory introduit une distinction cruciale, à savoir la différence entre l’exposition théorique à l’IA, ce que le modèle pourrait techniquement faire dans un métier, et l’exposition observée, ce qu’il fait effectivement. La première dépasse 90 % dans les professions juridiques, financières et managériales. La seconde est bien inférieure, pour des raisons légales, organisationnelles, institutionnelles. Mais l’écart se réduit.

Et le signe avant-coureur le plus inquiétant n’est pas le chômage. C’est le ralentissement du recrutement des jeunes diplômés (22-25 ans) dans les professions les plus exposées. Les entreprises n’embauchent plus autant de juniors pour des tâches que l’IA fait désormais plus vite et moins cher. Ce n’est pas que l’IA supprime des postes, elle contracte plutôt les flux d’entrée dans les professions qualifiées, privant une génération de ce que l’économiste Kenneth Arrow appelait le learning by doing, ce processus lent et irremplaçable par lequel on devient capable de superviser ce qu’on n’a pas encore tout à fait compris.

La déqualification cognitive, c’est précisément cela. Non pas perdre son emploi, mais perdre progressivement la capacité de superviser ce qu’on délègue. On délègue la rédaction sans avoir appris à rédiger. On valide des outputs sans avoir développé la compétence critique qui permettrait de détecter ce que l’IA fait mal, ses angles morts, sa tendance à produire du plausible, là où il faudrait du vrai. Cette « délégation aveugle » n’est pas une fatalité technologique. Elle est le produit d’une augmentation passive, une délégation sans réinvestissement dans des compétences de niveau supérieur.

Quand la boucle se ferme sans nous

Ce raisonnement prend encore plus de force avec l’IA agentique, cette nouvelle génération de systèmes qui n’attendent pas une validation humaine à chaque étape, mais agissent. Ils naviguent, rédigent, exécutent du code, orchestrent d’autres agents, prennent des décisions intermédiaires dans des chaînes d’action qui s’étalent sur des heures sans intervention humaine. Jensen Huang l’a annoncé au GTC 2026 en déclarant que dans dix ans, chaque employé humain travaillera aux côtés de cent agents IA. Le chiffre est peut-être exagéré mais la direction ne l’est pas.

Avec l’IA générative, la boucle revenait toujours à l’humain. Il évaluait un output et décidait. Avec l’IA agentique, cette boucle peut se fermer en interne. L’opérateur de l’abondance doit alors devenir ce qu’on pourrait appeler un « architecte d’objectifs » ; non plus « est-ce que ce texte est bon ? » mais « cet agent a-t-il bien compris ce que je voulais, et ses cinquante actions intermédiaires étaient-elles toutes légitimes ? »

France 24, 2026.

Or, les données Anthropic montrent que le taux de succès des modèles décroît significativement à mesure que la complexité de la tâche augmente, précisément là où les agents déploient le plus d’autonomie. La surveillance humaine est donc la plus nécessaire là où elle est la plus difficile à exercer. Et elle est impossible pour qui n’a jamais eu à faire ce qu’il supervise.

Urgence d’une politique de formation

La thèse de Jensen Huang n’est pas fausse, elle est incomplète. Oui, le déploiement de l’IA génère de l’emploi dans les secteurs de l’infrastructure physique. Mais, comme les réseaux électriques du début du XXe siècle, une infrastructure ne s’irrigue pas équitablement par la seule vertu du marché. Et surtout, elle ne dit rien des effets sur les trajectoires d’apprentissage des professions intellectuelles.

Ce que les données suggèrent avec force, c’est l’urgence d’une politique de formation aux compétences d’exploitation de l’IA, non pas apprendre à coder des modèles, mais apprendre à penser avec eux, à les interroger, à en critiquer les outputs, à maintenir vivante la compétence que l’on délègue. Former des opérateurs de l’abondance. Cette tâche revient en premier lieu aux institutions d’enseignement supérieur, et elle est urgente, parce que la contraction des flux d’entrée des jeunes dans les métiers exposés laisse peu de temps avant que l’apprentissage ne soit structurellement impossible.

Car ce que l’IA ne peut pas faire à notre place, c’est précisément décider que tel output vaut quelque chose, dans ce contexte, pour cette personne, avec ces enjeux. Ce jugement n’est pas une technique. C’est une forme de responsabilité et elle reste irréductiblement humaine.

The Conversation

Bruno Deffains ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Étudiants étrangers : des outils d’intelligence artificielle pour réduire la barrière de la langue ?

La barrière linguistique complique l’assimilation des connaissances techniques des étudiants étrangers. Redmind Studio/Unsplash, CC BY

Dans l’enseignement supérieur, le parcours des étudiants étrangers reste marqué par un défi central : comprendre, suivre et participer dans une langue qu’ils ne maîtrisent pas pleinement. Les avancées récentes de l’intelligence artificielle en traduction et en interprétation ouvrent des perspectives, tout en soulevant des enjeux sensibles de protection des données. Une piste se dessine alors : développer des outils alternatifs, directement hébergés par les établissements eux-mêmes. Des chercheurs de l’Université de Montpellier ont développé un tel prototype.


L’enseignement supérieur français a attiré près de 450 000 étudiants étrangers en 2024-2025, plaçant la France au 7e rang mondial. Ils représentent près de 15 % des effectifs étudiants dans les universités françaises.

La mobilité étudiante est en constante augmentation. En Europe, il y a eu plus de mobilités organisées en dix ans qu’au cours des vingt-sept années précédentes, la demande en 2025 étant en hausse de 9 % par rapport à 2024. Cette accélération est corrélée à l’augmentation des accords bilatéraux entre pays et un élargissement d’Erasmus+, le programme support européen aux mobilités internationales.

Au niveau mondial, les pays les plus attractifs sont sans surprise les pays anglophones, notamment les États-Unis, le Royaume-Uni et l’Australie, l’anglais étant de mise dans les échanges internationaux. Mais pour ceux qui choisissent la France et le français, dans quelle aventure s’engagent-ils ?

Les difficultés rencontrées par les étudiants étrangers

Pour ces étudiants, la barrière linguistique complique l’assimilation des connaissances techniques, freine la participation active en classe et l’immersion dans la vie étudiante, et cela malgré les enseignements de français langue étrangère (FLE). La complexité de la langue française augmente ce défi, même pour les étudiants étrangers francophones peu exposés au français académique.

L’Union européenne est consciente de ce frein à la mobilité et encourage ses États à fournir un soutien universitaire et extra-universitaire.

Nous avons mené en 2024 et 2025 une enquête auprès d’une partie des 9 000 étudiants étrangers qu’accueille chaque année l’Université de Montpellier. Elle révèle des besoins d’aide clairs :

  • pendant les cours et les conférences, pour comprendre les enseignants à l’oral et avoir la transcription du contenu afin de mieux appréhender leur formation ;

  • après les cours, dans une visée de mémorisation, de révision et de vérification du contenu des cours.

Les récents progrès de l’intelligence artificielle (IA) permettent de répondre à une partie de ces besoins.

Une analyse comparative des solutions de traduction simultanée basées sur l’IA a été menée selon trois critères principaux : la capacité de reconnaissance automatique de la langue parlée (permettant une adaptation dynamique lorsque l’intervenant change de langue ou lorsqu’une question est posée dans une autre langue), la facilité d’usage (minimisant les contraintes d’installation et de configuration pour les étudiants et les enseignants), et la qualité de la traduction produite. Cette analyse fait émerger deux types de solutions : des outils commerciaux accessibles par le cloud et des outils open source pouvant être installés en local sur serveurs propres.

Les outils commerciaux : efficaces, mais chers et risqués en termes de propriété intellectuelle

Du côté des outils commerciaux, notre veille technologique indique que l’outil le plus adapté aux besoins identifiés est eventCat. Un tel outil fournit un service clés en main, engendrant peu de contraintes informatiques et audiovisuelles pour être déployé. Cet outil a été testé en 2024 puis 2025 lors d’une conférence médicale partagée entre deux universités. Les intervenants avaient des profils linguistiques variés : chercheurs disposant d’un haut niveau d’anglais, médecins habitués à s’exprimer en français et représentants de patients possédant une connaissance limitée de l’anglais. Le public était constitué d’étudiants français et néerlandais, ces derniers maîtrisant bien l’anglais mais ne comprenant pas le français.

L’outil a permis aux intervenants de s’exprimer dans leur langue de prédilection, tandis que les étudiants anglophones suivaient via une traduction simultanée sur un lien dédié. Les retours des intervenants ont été très positifs. Afficher les traductions sur un grand écran installé à côté des intervenants plutôt que sur les smartphones ou ordinateurs portables des étudiants a permis de réduire leur charge cognitive, ceux-ci devant déjà simultanément suivre le discours oral et lire la transcription. La qualité de la traduction s’est avérée globalement satisfaisante, les acronymes du domaine et les accents des intervenants posant toutefois des soucis. Ceci souligne la nécessité d’une adaptation contextuelle plus fine pour des contenus hautement spécialisés.

Les inconvénients d’une telle solution sont un coût annuel de plusieurs dizaines de milliers d’euros par formation et une incertitude concernant les données. Par exemple, à la date de rédaction de cet article, la politique RGPD de l’outil identifié est de ne pas stocker plus de sept jours les flux audios reçus et leurs transcriptions et de ne pas utiliser ces données pour entraîner ses modèles IA, ce qui exposerait ces données aux attaques par prompts malicieux.

Cependant, la société opérant ce service est localisée aux États-Unis, elle est donc soumise au Cloud Act, l’obligeant à communiquer les données qu’elle stocke en cas d’injonction d’une autorité administrative de son pays. Les préoccupations sur la protection des données sont revenues à plusieurs reprises dans nos échanges avec les enseignants et également avec les étudiants, lors de notre enquête. Rappelons que les enseignants et les enseignants-chercheurs de l’enseignement supérieur sont titulaires des droits d’auteur sur les cours qu’ils proposent, c’est donc leur propriété intellectuelle qui peut être exposée par un outil de transcription et traduction automatique.

Un prototype d’outil en open source pour protéger les données

Il est donc préférable que les équipes pédagogiques disposent de solutions alternatives hébergées au sein de leur établissement. Le logiciel open source est dans ce cadre la voie naturelle, malheureusement en 2025, aucune solution de ce type n’existait encore pour répondre aux besoins exprimés par les étudiants étrangers dans nos analyses.

Nous avons donc élaboré les bases d’un tel outil et proposé un premier prototype. Celui-ci effectue déjà en local la traduction d’un contenu textuel, par un modèle d’IA libre pouvant s’exécuter sur un serveur classique. En revanche, la transcription des flux audio repose encore sur des services IA proposés par plusieurs acteurs du cloud (les modèles les plus efficaces pour cette étape sont soit plus lourds soit tout simplement propriétaires), bien que n’étant pas liés à un fournisseur particulier. Ce prototype bénéficie de la technologie RAG (génération augmentée par récupération) pour s’adapter à un vocabulaire technique et a pu être utilisé dans des cours de 20 à 30 étudiants. Les étudiants indiquent un fort intérêt pour ce type d’outils qu’ils utilisent aussi pour des discussions de socialisation.

Toutefois, ils notent tous des difficultés dans des cours techniques en français faisant appel à de nombreux anglicismes. Ces défauts restent à corriger mais la prochaine étape majeure consiste à effectuer la transcription de l’audio en texte de façon locale, sans recourir à un service cloud. En l’état actuel des modèles, ceci nécessite l’usage de processeurs spécifiques (GPU), représentant un effort d’équipement de l’ordre de plusieurs milliers d’euros par site. C’est le coût à payer pour la préservation des données.

L’apprentissage de la langue du pays d’accueil constitue un objectif central des mobilités internationales. Les outils numériques évoqués ci-dessus facilitent cet apprentissage et la réussite académique des étudiants étrangers, mais ne se substituent pas pour autant aux enseignements de FLE. Les outils IA favorisent l’acquisition de savoirs disciplinaires et, dans une certaine mesure, l’acculturation des étudiants étrangers. Mais ils ne sont pas suffisants pour une intégration réussie. Sur ce plan, ce que le pays d’origine met en place pour préparer la mobilité reste prépondérant.

The Conversation

Vincent Berry a reçu un financement de l'Université Montpellier (CNUMF).

Chouki Tibermacine est membre de l'ACM (Association of Computing Machinery). Il a reçu plusieurs financements publiques pour ses travaux de recherche : ANR, DGA, Région Bretagne.

Chrysta Pelissier, Vanessa Vigano et Éric Anglaret ne travaillent pas, ne conseillent pas, ne possèdent pas de parts, ne reçoivent pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'ont déclaré aucune autre affiliation que leur poste universitaire.

Des manchots de l’Antarctique à l’explicabilité en IA. Bienvenue en prétopologie !

Il existe plusieurs espèces de pingouins en Antarctique. Une tâche standard est de classer les individus dans telle ou telle catégorie, tout en comprenant les raisons de ce classement. Arturo de Frias Marques, Wikipedia, CC BY-SA

La plupart des algorithmes performants actuels – notamment l’apprentissage profond (deep learning) et ses réseaux de neurones – fonctionnent comme des boîtes noires. On sait qu’ils donnent de bons résultats, mais impossible de comprendre leur logique interne. Ceci pose problème pour de nombreux domaines d’application (médecine, justice…), ce qui incite les régulateurs à exiger des systèmes « explicables ». Plusieurs pistes vers l’explicabilité existent. Zoom sur la « prétopologie ».


Imaginons un patient dont les résultats sanguins montrent un taux d’hémoglobine de 12,5 grammes par décilitres de sang. Un algorithme de détection précoce du cancer analyse ces chiffres, mais aussi ses antécédents familiaux (présents ou absents), son statut de fumeur (oui ou non), son niveau d’activité physique (faible, moyen, élevé). L’algorithme le classe dans un groupe à risque modéré. Mais quand son médecin lui demande pourquoi, le système ne peut pas répondre : c’est une boîte noire.

Et c’est évidemment un problème pour le patient, le médecin, l’assurance maladie, etc. C’est pour cela que l’AI Act européen, adopté en mars 2024, impose des obligations strictes aux organisations et entreprises opérant en Europe. D’ici 2026-2027, tous les systèmes d’IA dits à haut risque devront être « transparents » et « explicables », c’est-à-dire dont un humain puisse comprendre la logique. Les sanctions pourront atteindre 35 millions d’euros ou 7 % du chiffre d’affaires annuel mondial, car les domaines concernés peuvent avoir des effets importants.

Par exemple, en ressources humaines, les logiciels de tri de CV qui analysent à la fois des niveaux de diplômes, des années d’expérience et des compétences techniques doivent pouvoir justifier pourquoi un candidat est retenu et un autre écarté. Dans l’industrie énergétique, les systèmes de maintenance prédictive qui combinent données de capteurs (température, vibrations), historique de maintenance et type d’équipement doivent expliquer pourquoi une éolienne ou un autre équipement est signalé comme « à risque de panne ».

Pour contrer l’« effet boite noire » des systèmes d’IA actuels, nous proposons une méthode issue d’une discipline méconnue du grand public, la « pré-topologie », qui permet de rendre explicables les raisonnements faits sur des données mixtes (le taux d’hémoglobine est un chiffre tandis que la présence ou non d’antécédents familiaux ne se chiffre pas).

Qu’est-ce que la prétopologie ?

  • La prétopologie, c’est l’art de dessiner des « zones d’influence » autour de chaque personne ou objet dans un réseau – comme les cercles d’amis sur les réseaux sociaux, où l’influence n’est pas forcément réciproque.
  • Pour décrire une zone complexe, elle utilise une recette appelée forme normale disjonctive, qui assemble des blocs de base, puis calcule automatiquement tout ce qui « adhère » à cet assemblage, c'est-à-dire tout ce qui gravite naturellement autour de lui.

Les limites des méthodes actuelles pour rendre les systèmes d’IA « explicables »

Le clustering hiérarchique est aujourd’hui la méthode de référence pour regrouper automatiquement des observations similaires et donc pour rendre les données plus interprétables : en organisant les observations en une hiérarchie de groupes emboîtés (un dendrogramme), il permet à un expert de naviguer entre niveaux de granularité, d’identifier des profils types et d’expliquer pourquoi deux individus sont regroupés ensemble, sans avoir à ouvrir la “boîte noire” d’un modèle prédictif.

Son fonctionnement est simple et transparent. On mesure d’abord la distance entre chaque paire d’observations. Ensuite, on regroupe progressivement les observations les plus proches. Enfin, on obtient un arbre (appelé dendrogramme) qu’on peut couper à différents niveaux pour former des groupes.

Prenons l’exemple des manchots de l’archipel Palmer en Antarctique. Si on mesure la longueur de leur bec et leur masse corporelle, le clustering hiérarchique identifie automatiquement trois groupes qui correspondent aux trois espèces biologiques présentes : Adélie, Jugulaire et Papou. L’atout majeur est sa transparence : on visualise l’arbre, on suit les regroupements successifs, on comprend facilement comment les groupes se sont formés, la hauteur d’embranchement donne une idée de la « différence » entre deux groupes.

Le défi survient quand on mélange chiffres et catégories. Mesurer une distance entre deux chiffres est facile : si un patient a une glycémie de 5,5 millimoles par litres (une unité de concentration) et un autre de 6,2 millimoles par litres, la différence est de 0,7. Mais comment mesurer la distance entre deux « catégories » que l’on ne peut pas chiffrer, comme une réponse oui ou non (fumeur ou non-fumeur), ou encore la couleur d’un tissu biologique ?

Par exemple, dans notre exemple de détection précoce du cancer, si le patient A présente une concentration d’hémoglobine de 12,5 grammes par décilitres (chiffre), des antécédents familiaux (catégorie « oui ») et ne fume pas (catégorie « non ») ; tandis que le patient B présente une concentration d’hémoglobine de 13,1 grammes par décilitres, pas d’antécédents et fume… comment dire si ces deux patients sont « proches » ou « éloignés », en termes de risques ?

Les solutions existantes, comme le k-means, HDBSCAN et DIANA ont toutes des limites. Transformer les catégories en chiffres artificiels (« oui » = 1, « non » = 0) est arbitraire et fait perdre du sens. Plus précisément, ceci signifie que l’on introduit une relation d’ordre et une distance qui n’existent pas : coder « chat » = 1, « chien » = 2, « oiseau » = 3 suggère implicitement que chien est « entre » chat et oiseau, ou que la distance chat-chien est égale à chien-oiseau, ce qui peut biaiser tous les calculs de similarité en aval.

Ignorer les catégories pour ne garder que les chiffres, comme dans les méthodes citées précédemment, fait perdre des informations cruciales comme les antécédents familiaux. Les méthodes statistiques plus complexes sont souvent opaques ou nécessitent des hypothèses fortes sur la structure des données. C’est le cas de la distance de Gower ou de l’analyse des facteurs latents – le genre de structure qui peut se cacher derrière les grands modèles de langage (LLM).

C’est précisément dans la définition de ces voisinages – comment mesurer qu’un patient « ressemble » à un groupe malgré des données hétérogènes – que la prétopologie offre un cadre naturel : elle permet de construire des zones d’influence flexibles, sans imposer de distance artificielle ni d’hypothèses sur la structure des données.

Une solution en développement : mesurer la similarité autrement

Pour cela, au lieu de chercher à mesurer des distances, nous proposons de changer de perspective en définissant des « voisinages », construits via des formes normales disjonctives, ou DNF. Derrière ce nom se cachent des règles logiques simples du type : « Un patient appartient au voisinage d’un groupe si (il est diabétique ET âgé de plus de 60 ans) OU (il a des antécédents familiaux ET est hypertendu) ». Chaque condition entre parenthèses est un bloc ; le voisinage est l’union de ces blocs. Pas de chiffres, pas de distance : seulement des combinaisons de caractéristiques, comme des règles de décision lisibles.

Une fois les voisinages définis, on calcule pour chaque groupe l’ensemble de tous les patients qui lui « adhèrent » – c’est-à-dire qui tombent dans au moins un de ces blocs DNF. Ce calcul d’adhérence est itératif : à chaque étape, des patients rejoignent ou quittent un groupe, jusqu’à stabilisation. Le résultat est analogue à un dendrogramme : on obtient une hiérarchie de regroupements successifs, du plus local (blocs fins, peu de patients) au plus global (grands groupes stables), sans avoir jamais posé de distance artificielle entre catégories et chiffres.

Une analogie aide à comprendre. Sur une carte géographique, on mesure la distance entre Paris et Lyon en kilomètres. Mais on peut aussi dire que Dijon est voisine de Lyon parce qu’elles partagent des caractéristiques : région similaire, climat comparable, économie proche. Cette notion de « voisinage » par caractéristiques communes ne nécessite pas de calculer une distance précise.

Notre algorithme en accès libre pour des études pilotes

C’est le principe de base de PretopoMD, notre algorithme qui classe automatiquement des données mixtes (chiffres et catégories) tout en rendant explicite sa logique de regroupement. Pour les chiffres, deux valeurs sont voisines si elles tombent dans la même fenêtre : toutes les glycémies entre 5 et 7 mmol/L sont voisines. Pour les catégories, deux observations sont voisines si elles partagent la même modalité : deux patients sont voisins s’ils sont tous deux fumeurs, ou si tous deux ont des antécédents familiaux.

PretopoMD est d’ores et déjà disponible en accès libre pour permettre à des équipes en santé, RH ou maintenance de l’utiliser pour des études pilotes. À moyen terme, nous espérons que cette approche puisse aider les organisations européennes à répondre aux exigences de l’AI Act en proposant des classifications explicables par construction.

L’avantage clé est la traçabilité. Pour notre exemple médical, on peut dire :

« Les patients A et C sont dans le même groupe parce qu’ils partagent une glycémie dans la fenêtre 5-7 millimoles par litres (étape 1), tous deux ont des antécédents familiaux (étape 1), et tous deux ont un IMC entre 25-30 (étape 2). Le patient B les rejoint à l’étape 3 via un IMC similaire, malgré l’absence d’antécédents. »

Cette explication pas-à-pas répond directement aux exigences de l’AI Act. De plus, la structure hiérarchique est préservée, on peut identifier grands groupes et sous-groupes pertinents.

Néanmoins, notre algorithme possède des limites, puisqu’il faut choisir la taille des fenêtres et les seuils de similarité, faisant actuellement appel à un expert métier. Nous travaillons sur des méthodes pour automatiser ces choix.

Ainsi, la question reste ouverte : jusqu’où peut-on pousser la performance tout en conservant l’explicabilité ? Dans des domaines sensibles comme la santé ou le droit, ce compromis est-il acceptable ? Notre travail montre qu’on peut au moins explorer cette voie.

The Conversation

Guillaume Guérard ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Déléguer nos décisions à l’IA : une menace pour la démocratie ?

Pour la philosophe Hannah Arendt, l’effondrement moral d’une société n’exige pas nécessairement une volonté de faire le mal, elle peut résider dans l’érosion de la capacité de juger. Or, l’utilisation massive de l’IA menace notre capacité de juger. Barbara Niggl Radloff/Munich City Museum, CC BY-NC-SA

À mesure que des systèmes d’intelligence artificielle prennent en charge des décisions autrefois humaines, la question n’est plus seulement ce qu’ils peuvent faire, mais ce que nous cessons de faire nous-mêmes. À bas bruit, c’est notre capacité de jugement qui se transforme, avec des effets potentiels sur la démocratie.


En 1963, observant Adolf Eichmann lors de son procès à Jérusalem, Hannah Arendt formule l’une des intuitions les plus dérangeantes du XXe siècle : cet homme n’était pas un monstre. Il avait simplement cessé de penser. En déléguant son jugement moral à l’appareil bureaucratique, il était devenu capable de participer à un mal radical sans jamais le reconnaître comme tel. Arendt nomme ce phénomène la « banalité du mal » : la catastrophe morale n’exige pas une intention mauvaise – elle exige seulement l’érosion systématique de la capacité à penser par soi-même. Elle identifie une séquence précise : avant l’effondrement politique vient l’effondrement cognitif. Les régimes totalitaires conquièrent d’abord les esprits, en rendant la pensée indépendante structurellement superflue. Soixante ans plus tard, nous construisons quelque chose dont l’architecture philosophique lui aurait été immédiatement familière.

Déléguer le jugement à l’échelle d’une société

L’intelligence artificielle agentique désigne des systèmes capables de percevoir, planifier, décider et agir de manière autonome. Selon le cabinet de conseil Gartner, d’ici 2028, 33 % des logiciels d’entreprise intégreront des agents IA et 15 % des décisions quotidiennes de travail seront prises de façon autonome. Un autre cabinet de conseil, McKinsey souligne que ces architectures introduisent des risques que les cadres de gouvernance existants n’ont jamais été conçus pour gérer, précisément parce qu’elles adaptent leur comportement au contexte plutôt que d’obéir à une logique prédéterminée.

Ce n’est pas de l’automatisation classique : l’IA agentique reconfigure le jugement lui-même. Mais, il s’agit moins d’une disparition du jugement humain que d’un déplacement continu de son objet – sans que l’humain ne puisse toujours en percevoir l’existence. La question n’est donc pas celle de la délégation en soi, mais bien celle de la qualité et de l’irréversibilité de la reconfiguration en cours.

Quand la démocratie délègue ses propres décisions

Les exemples les plus révélateurs sont politiques, et ils sont déjà parmi nous. En effet, l’approche d’Arendt distingue l’action (la capacité à initier quelque chose de véritablement nouveau par l’engagement avec d’autres dans la sphère publique) du simple comportement, prévisible et manipulable. La démocratie n’est pas un mécanisme de traitement des préférences : c’est un espace d’apparition où des individus distincts, capables de pensée indépendante, se réunissent pour créer du sens collectivement. Chaque décision absorbée dans un processus agentique automatisé, chaque moment de délibération remplacé par un résultat algorithmique, représente alors une érosion cumulative de cet espace.

En 2016, des algorithmes de ciblage comportemental – déployés lors des campagnes du Brexit et de l’élection Trump – ont sélectionné et amplifié des contenus émotionnels auprès d’électeurs ciblés. Ce n’était pas de la propagande classique : c’était la technique que décrivait Arendt – non pas persuader, mais submerger, créer une condition dans laquelle la distinction entre fait et fabrication s’effondre sous le volume des stimuli contradictoires. Des systèmes de notation algorithmique ont ensuite évalué la fiabilité citoyenne, prédit la récidive judiciaire (comme COMPAS aux États-Unis, dont les biais raciaux ont été documentés par le média indépendant ProPublica) ou orienté les attributions de logements sociaux aux Pays-Bas et au Royaume-Uni. Dans chacun de ces cas, une décision à forte charge éthique est absorbée dans un processus opaque, soustrait au débat public.

Au-delà de ces exemples spécifiques, ce qui se joue peut être considéré comme systémique : il ne s’agit plus d’orienter un contenu dans un espace de délibération préexistant, mais de transformer progressivement les conditions mêmes dans lesquelles le jugement s’exerce. Lorsque trois ou quatre grands modèles de langage médiatisent une part croissante des interactions informationnelles de milliards d’individus, le risque principal n’est pas qu’ils orientent des réponses – c’est qu’ils harmonisent silencieusement ce qui peut être formulé, reconnu comme question légitime, traité comme argument recevable. Interrogés sur des politiques de redistribution, les modèles dominants tendent à cadrer la réponse dans les termes de l’efficacité économique – non par censure, mais parce que leurs corpus surreprésentent massivement certaines traditions intellectuelles. D’autres registres (justice, dignité, solidarité intergénérationnelle) deviennent moins fluides, progressivement marginalisés sans que personne n’en ait décidé. Quand les mêmes modèles médiatisent des citoyens issus de traditions distinctes, une convergence cognitive s’installe, sans délibération démocratique. Or, c’est exactement ce que les régimes totalitaires visaient (et visent) en priorité, non les opinions, mais l’espace dans lequel des points de vue différents peuvent s’exprimer, se rencontrer et s’affronter.

Le déplacement axiologique : transformer ce qui compte comme valeur

Le danger le plus profond dépasse donc la substitution ponctuelle. En remplaçant de plus en plus systématiquement des décisions humaines, les systèmes IA transforment ce qu’une société reconnaît comme valeur au sens de ce qui mérite d’être considéré et/ou préservé – l’efficacité plutôt que l’équité, l’engagement plutôt que la vérité, la prédictibilité plutôt que la singularité. Ce processus – que je nomme déplacement axiologique – est silencieux, progressif, et opère aussi bien à travers les institutions qu’à travers les pratiques quotidiennes et les dynamiques de marché, y compris là où aucune institution ne l’orchestre. Lorsque des plates-formes algorithmiques déterminent quelles informations sont visibles et quels débats circulent, elles ne filtrent pas un espace public préexistant – elles le reconstituent selon leur propre logique d’optimisation. La pluralité que la démocratie présuppose est menacée par une convergence vers ce que le système détermine comme optimal.

Deux dimensions d’une même transformation

Ce déplacement est peut-être préparé en amont. Des études longitudinales publiées dans JAMA Pediatrics ont observé des corrélations entre usage intensif des réseaux sociaux à l’adolescence et modifications des circuits neuronaux – moindre activation des régions associées au jugement raisonné, hypersensibilité aux rétroactions sociales. Ces résultats appellent à la prudence : ils ne permettent pas de porter des jugements globaux sur des générations entières. Ce qui paraît plus assuré, c’est ce que le philosophe de la culture Byung-Chul Han a mis en lumière : la saturation de l’attention par les flux numériques réduit les espaces de recul critique. L’IA agentique pourrait accentuer cette dynamique en lui donnant une forme institutionnelle. Reconfiguration de l’attention et délégation du jugement ne constituent peut-être pas deux problèmes séparés, mais deux dimensions d’une même transformation dont nous manquons encore du recul pour mesurer toutes les conséquences – et que la gouvernance de l’IA ne peut pas ignorer.

Penser la gouvernance autrement

Arendt n’était pas technophobe. Son projet était constructif : préserver les conditions dans lesquelles la pluralité des points de vue, la spontanéité de l’action et la capacité de jugement singulier – notions au cœur de sa théorie politique – peuvent survivre. Cela exige des cadres de gouvernance intégrant des évaluations d’impact axiologique : analyses systématiques de la façon dont le déploiement agentique transforme non seulement l’efficacité opérationnelle, mais les fondements mêmes de la délibération démocratique. Cela exige de préserver des espaces où la décision est réellement construite par des acteurs capables de pensée indépendante – non comme consultations symboliques, mais comme éléments structurels du processus décisionnel. Cela exige enfin de repenser l’apprentissage du jugement dans un monde où l’IA est omniprésente.

La question « Une IA peut-elle faire cela ? » doit toujours être accompagnée d’une autre, arendtienne dans son exigence : Que nous arrive-t-il, politiquement, quand nous cessons de le faire nous-mêmes ? La vraie réponse n’est pas dans le refus de la délégation, mais dans la définition rigoureuse de ses frontières – quelles décisions ne sont pas délégables, ou sous quelle modalité la délégation peut rester compatible avec la vitalité démocratique.

Hannah Arendt a passé sa vie à comprendre comment des sociétés civilisées pouvaient produire les conditions de leur propre effondrement moral. Sa réponse était d’une simplicité dérangeante : non par un échec dramatique, mais par l’abdication silencieuse, cumulative, banale de la responsabilité de penser. Nous vivons peut-être les prémices d’un nouvel effondrement, mais nous pouvons nous en prémunir avant que les systèmes auxquels nous déléguons notre jugement ne finissent par façonner, à notre place, ce que nous sommes.

The Conversation

Caroline Gans Combe a reçu des financements de l'Union européenne dans le cadre des projets Deform et ProRes.

Comment l’IA apprend le langage secret de l’ADN, et ce que la recherche y gagne

Plutôt que de produire des mots, le modèle d’intelligence artificielle Evo 2 est capable de prédire une base d’ADN en se fondant sur une séquence donnée. Lancé, il y a un peu plus d’un an, le modèle s’affine et permet aux scientifiques de mieux comprendre le langage de l’ADN. Sa puissance de calcul pose néanmoins des questions de ressources énergétiques.


Si vous avez déjà utilisé un modèle de langage comme ChatGPT ou Mistral, vous vous souvenez sans doute de la première impression : orthographe impeccable, grammaire fluide, phrases qui ont du sens. Pourtant, sous le capot, ces systèmes ne font qu’une chose très simple : prévoir dans une phrase le mot qui va suivre. Ils utilisent des statistiques apprises sur un immense corpus de textes, et c’est ainsi qu’ils « parlent » français, anglais et bien d’autres langues.

Une idée féconde a alors germé chez les généticiens : et si l’on entraînait la même classe de modèles pour apprendre le langage de la vie, la suite de lettres A, T, G, C, inscrite dans nos génomes ? C’est le pari des modèles de langage génomiques : ils apprennent la grammaire cachée de l’ADN et offrent à la recherche un allié précieux pour explorer, proposer et tester plus vite des hypothèses scientifiques.

Que fait un modèle d’IA ?

Un algorithme d’intelligence artificielle (IA) est, au fond, une machine à transformer des nombres. Les données d’entrée, qui peuvent être des images, des sons ou du texte, sont d’abord encodées en chiffres. Puis l’algorithme applique des opérations simples (additions et multiplications par des paramètres internes au réseau et seuillage) et renvoie les résultats (d’autres chiffres) en sortie. À grande échelle, cette mécanique très simple suffit à jouer au go, à conduire une voiture… ou à comprendre les génomes.

L’astuce, ce n’est pas seulement l’encodage : c’est surtout l’apprentissage. Le modèle ajuste ses paramètres internes à chaque exemple (association entre une entrée et une sortie cible), un peu comme on accorde un instrument : à chaque note jouée, on tend ou détend la corde jusqu’à ce que la mélodie sonne juste.

Les applications de ce principe simple sont multiples et variées. Au jeu de go, l’IA regarde la position des pierres (un tableau de chiffres) et propose le prochain coup ; dans une phrase, le modèle suggère le prochain mot. En génomique, il lit A T G C… et prédit la prochaine base. Si ses prédictions sont bonnes, c’est qu’il a appris quelque chose sur la structure cachée du problème qu’il résout.

Les premiers modèles de langages génomiques

C’est en suivant ce principe que les premiers modèles de langage génomiques ont été entraînés en utilisant des génomes à la place des corpus de texte. Une des versions les plus récentes, Evo 2, a été développée par une large équipe autour du centre de recherche Arc Institute, dans la Silicon Valley. Ce modèle a été entraîné sur de nombreux génomes, comptabilisant près de 10 000 milliards de bases (les fameuses lettres A,C,G,T) ce qui représente 3 000 fois la taille de notre génome.

Le modèle lit à chaque étape un million de bases et le calcul revient toujours à la même question très simple : parmi les quatre lettres possibles (A, C, G ou T), laquelle est la plus probable juste après celles que l’on vient de lire ? La taille gigantesque de sa « fenêtre de lecture » lui permet de saisir à la fois des règles locales et des dépendances lointaines (régulations des gènes à distance). Ce saut d’échelle n’est pas qu’une prouesse technique : il change la manière dont on peut poser des questions en biologie, notamment dans ces régions non codantes (celles qui ne sont pas traduites en protéines) qui restent souvent incomprises et constituent la « matière noire » du génome.

Dans la pratique, l’apprentissage ressemble à une partie de devinettes : à chaque fois que le modèle devine correctement une lettre masquée au sein d’une séquence, il renforce les chemins internes qui l’y ont mené ; lorsqu’il se trompe, il corrige ces chemins. À force, il repère des schémas récurrents : certains motifs précèdent souvent le début d’un gène, d’autres signalent la fin, et certains motifs de la séquence trahissent la façon dont la cellule découpe l’ARN (l’épissage) ou assemble la machinerie de traduction des ARN en protéines.

L’apprentissage se fait d’abord à l’échelle globale. Le modèle lit une grande diversité de génomes et apprend une grammaire générale du vivant. Ensuite, on peut éventuellement l’adapter à une famille d’organismes ou à une question précise (par exemple, en le spécialisant sur un groupe de virus ou de bactéries).

L’IA apprend la grammaire cachée de l’ADN

C’est ici que la recherche s’enthousiasme : en apprenant juste à compléter les séquences, les modèles reconnaissent des signatures biologiques sans qu’on les leur ait pointées du doigt.

Ils retrouvent la périodicité en trois lettres du code génétique : le texte du vivant se lit par triplets (les codons), et les modèles « entendent » ce rythme, comme une mesure en musique. Ils repèrent aussi les départs et arrêts de gènes, avec des contraintes fortes sur les lettres les plus importantes, où l’on s’attend à ce que l’erreur soit rare. Ils détectent des signaux utiles à la machinerie cellulaire : chez les bactéries, les sites de liaison du ribosome ; chez les eucaryotes, les frontières entre exons (conservés) et introns (séquences à retirer), comme si le modèle distinguait les paragraphes et les espaces dans un texte.

Plus étonnant, ils révèlent aussi les éléments mobiles (par exemple, des virus intégrés au génome au cours de l’évolution) et même des empreintes liées aux formes 3D des protéines (hélices α, feuillets β) et des ARN. Le modèle dessine alors les contours de la sculpture finale. Car c’est bien de sculpture qu’il s’agit.

Le génome ne contient pas seulement des instructions – il encode des formes. Une protéine, un ARN, ne sont pas de simples colliers de lettres : ils se replient, se tordent, se nouent dans l’espace pour adopter une architecture précise, dont dépend leur fonction. C’est cette forme qui permet à une molécule de reconnaître une autre, de s’y accrocher, de déclencher une réaction. Les contacts qui stabilisent cette forme se font parfois entre des régions très éloignées dans la séquence – et pourtant, les modèles semblent capables de les capturer, comme s’ils devinaient, à force de lire le texte, quelles lettres se correspondent malgré la distance qui les sépare.

Ce qui peut surprendre, c’est que ces découvertes n’ont pas été enseignées : elles émergent spontanément de l’apprentissage. Et parfois, paradoxalement, quand on essaie d’affiner le modèle en lui montrant des exemples bien connus, il perd une partie de ce qu’il avait trouvé seul. Comme si trop guider l’élève lui faisait oublier ce qu’il avait intuitivement compris.

Pour rendre cette « boîte noire » plus lisible, les chercheurs utilisent des « autoencodeurs clairsemés » qui décomposent les représentations internes du modèle en traits compréhensibles. Chaque trait s’allume comme une lampe au-dessus d’un élément de séquence (exon, motif, élément mobile). Ces traits servent de fil d’Ariane. Ils indiquent où le modèle a vu un signal, de quel type il est et comment il varie d’un organisme à l’autre. On peut même transférer ces traits vers des génomes peu étudiés, ouvrant la voie à des atlas fonctionnels multi‑espèces construits de manière plus rapide et moins coûteuse que par les approches classiques.

Dans nos propres recherches, Evo 2 est surtout un point de comparaison : il montre jusqu’où peut aller un très grand modèle quand on lui donne énormément de données et de puissance de calcul. Il faut aussi voir que cette démonstration a une dimension vitrine pour Nvidia, le plus gros fabricant de processeurs pour l’IA, qui a mis sa puissance de calcul au service de l’Arc Institute pour concevoir Evo 2. L’idée sous-jacente est de montrer qu’il faut des modèles gigantesques et des infrastructures de calcul hors normes pour déchiffrer le secret de la vie. Le résultat est impressionnant, mais ce n’est pas forcément le seul chemin possible pour faire avancer la biologie.

Nous avons justement lancé le projet PLANETOID, financé dans le cadre de France 2030, pour explorer une stratégie complémentaire : construire des modèles beaucoup plus petits, plus rapides, plus faciles à entraîner et à déployer dans des laboratoires académiques. L’objectif est d’exploiter des données de biodiversité riches, produites par nos partenaires – en particulier au Muséum national d’histoire naturelle et dans les stations marines – afin d’annoter des génomes et des métagénomes (des ensembles de génomes) à l’échelle de l’arbre du vivant, y compris pour des espèces dites « non modèles », qui représentent l’immense majorité du vivant, mais restent souvent mal comprises.

PLANETOID vise aussi à produire des ressources et des outils réutilisables, pour que ces approches ne restent pas réservées à quelques acteurs capables de mobiliser des moyens industriels, mais puissent irriguer la recherche publique, puis à terme la santé et l’environnement.

Le futur : estimer l’effet d’une mutation ou écrire de nouveaux génomes

Parce qu’un modèle de langage assigne une vraisemblance à chaque séquence, il devient possible de comparer la version de référence et une version mutée. Si la mutation fait chuter la vraisemblance, elle devient suspecte. Ce score agit comme une carte pour guider les chercheurs : il montre des zones où une variation risque de perturber une fonction et oriente les expériences à prioriser.

Une autre application a le vent en poupe : la génération de séquences « fonctionnelles » in silico. Les chercheurs ont montré qu’on peut composer du texte génétique qui a toutes les caractéristiques de génomes naturels. Toutefois cette pratique soulève d’importantes questions éthiques (risques eugénistes, possibilité de virus synthétiques…) et doit rester strictement encadrée – c’est un sujet de société plus qu’un enjeu immédiat de recherche.

The Conversation

Julien Mozziconacci est professeur au Muséum National d'Histoire Naturelle et membre junior de l'Institut Universitaire de France. Il a reçu des financements de l'Agence Nationale de la Recherche (ANR, France 2030, PostGenAI@Paris). Les points de vue et opinions exprimés sont toutefois ceux des auteurs uniquement et ne reflètent pas nécessairement ceux des instituts qui les ont financés.

Élodie Laine ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

L’utilisation de l’intelligence artificielle dans la guerre en Iran : que dit le droit international ?

Le conflit en cours en Iran montre la dépendance avancée des armées états-unienne et israélienne à l’IA militaire, notamment pour le ciblage et la planification des frappes. Le bombardement d’une école à Minab, le 28 févier, présenté comme une erreur de ciblage et ayant causé la mort de 168 civils, principalement des enfants, met en lumière les risques juridiques, les failles des systèmes et les problèmes de responsabilité.


Le conflit armé contre l’Iran lancé le 28 février dernier par Washington et Tel-Aviv a été rapidement qualifié de « première guerre de l’IA ». Une assertion en réalité trompeuse à divers égards. Non seulement l’IA a-t-elle déjà été utilisée de façon intensive dans des conflits récents, notamment par Israël à Gaza, mais, plus largement, l’IA, en tant que moyen numérique de traitement et d’analyse de données, entretient une longue histoire avec les conflits armés, dont les fondements techniques remontent à la Seconde Guerre mondiale.

Certes, la situation iranienne se distingue par le niveau de sophistication sans précédent de ces moyens et par la dépendance inédite des armées à leur égard. Elle diffère également du conflit à Gaza en ce que, cette fois, l’IA a été déployée contre un adversaire étatique dans le cadre d’une guerre de haute intensité. Enfin, jamais les États n’avaient aussi ouvertement communiqué sur leur recours à ces systèmes. C’est cette communication conjuguée aux conséquences dramatiques de certaines frappes qui invite à s’interroger sur la compatibilité de ces pratiques avec le droit international.

Les faits : l’utilisation de l’IA dans la guerre en Iran

L’utilisation de l’IA par Israël dans sa guerre contre le Hamas avait été révélée par le journal +972. Ce média avait exposé ce que bon nombre de spécialistes soupçonnaient depuis quelques années. Dans le cadre du conflit en Iran, en revanche, ce sont les autorités américaines elles-mêmes qui ont annoncé leur emploi de l’IA.

Effectivement, les forces militaires américaines ont admis avoir recouru à des systèmes d’IA pour établir et trier la liste des objectifs à une vitesse fulgurante. Ce procédé aurait entraîné plus de 1 000 frappes, qualifiées de très précises, durant les vingt-quatre premières heures du conflit. Elles se seraient notamment servies du système Maven Smart System, un projet conjoint utilisant un logiciel d’IA de surveillance et de collecte de données de Palantir, couplé au système d’IA générative Claude, développé par Anthropic.

Cependant, lors du premier jour de guerre, l’une des frappes américaines a visé une école de Minab, causant la mort d’environ 170 victimes civiles, principalement des enfants. Les États-Unis ont reconnu leur responsabilité dans cette frappe, présentée comme une erreur. L’école était en effet située à proximité d’une base navale des Gardiens de la révolution. Elle faisait autrefois partie intégrante du même complexe, avant d’en être séparée. C’est donc une information non actualisée qui aurait conduit à autoriser la frappe.

Une telle méprise n’est pas anodine. De nombreux médias et ONG ont rapidement établi le lien entre l’école et la base navale. Il a ainsi été avancé que l’armée américaine aurait probablement ciblé ce bâtiment sur la base de données obsolètes en suivant aveuglément une recommandation issue d’un système d’IA sans procéder à la vérification qui s’imposait.

La licéité de l’utilisation de l’IA

Dans quelle mesure l’utilisation de l’IA pour mener ces frappes, et l’erreur commise, sont-elles licites au regard du droit international ?

Il convient d’abord de préciser que l’IA n’est pas interdite en tant que telle par le droit des conflits armés (DCA, également appelé droit international humanitaire). Pour l’heure, aucune règle juridique n’envisage spécifiquement la question de sa licéité. Pour autant, la question n’évolue pas dans un vide juridique. Les règles générales du DCA s’appliquent à la conduite des hostilités, quels que soient les moyens et méthodes déployés.

L’une de ces règles est le principe de distinction selon lequel seules les cibles militaires peuvent faire l’objet d’attaques, les personnes civiles et les biens civils devant être préservés. Viser directement une école, comme celle de Minab, en l’absence de tout objectif militaire en son sein, constitue donc une violation manifeste de ce principe. Il est toutefois peu probable que l’armée américaine ait eu l’intention délibérée de détruire l’école en tant que telle. Comme indiqué, il s’agit plus vraisemblablement d’une erreur d’identification de la cible, possiblement liée à un système d’IA entraîné sur des données obsolètes, datant de l’époque où le bâtiment était encore rattaché à la base navale.

En conséquence, la violation est plutôt relative au principe de précaution. Ce dernier prescrit notamment que les parties au conflit doivent faire tout ce qui est pratiquement possible pour vérifier que les objectifs à attaquer sont bien des objectifs militaires. En l’espèce, l’armée américaine ne semble pas avoir procédé aux vérifications nécessaires pour s’assurer que la cible était une école. Une vérification élémentaire, comme celle effectuée par certains médias, aurait pu rapidement dissiper le moindre doute.

Il faut rappeler que, lors de la guerre à Gaza, il avait été rapporté que des soldats israéliens ne disposaient parfois que de vingt secondes pour valider une cible, ce qui interroge sur la possibilité matérielle de respecter effectivement ce principe. Les préoccupations relatives à l’IA militaire se cristallisent souvent autour de la question de l’autonomie et du risque qu’un système désigne et engage seul une cible ; c’est l’enjeu des systèmes d’armes létales autonomes. Cet exemple démontre toutefois qu’un contrôle humain formellement maintenu peut n’être que fictif si l’opérateur ne dispose ni du temps ni de l’esprit critique nécessaires pour évaluer une recommandation algorithmique.

Du côté iranien, il y a lieu de relever que le principe de précaution n’a pas davantage été respecté. Ce principe impose non seulement des obligations à l’attaquant, mais requiert également de l’attaqué qu’il prenne certaines précautions passives : les parties doivent notamment éloigner les personnes civiles et les biens de caractère civil des objectifs militaires. En l’espèce, transformer un bâtiment d’une base navale en école, tout en la maintenant à proximité immédiate du reste du complexe militaire, exposait délibérément cette installation civile aux risques liés à la conduite des hostilités.

Quelles responsabilités juridiques, politiques et morales ?

La responsabilité individuelle. L’attaque ne constitue pas un crime de guerre.

Si l’attaque constitue une violation du DCA, il est probable qu’aucun militaire américain ne soit condamné pour de tels faits. Outre les questions de compétence juridictionnelle, le principal obstacle tient à ce que ni la violation du principe de précaution ni les erreurs conduisant à des violations du DCA ne constituent des crimes de guerre au sens du droit international pénal.

L’acte matériel est bien caractérisé, mais l’élément intentionnel, c’est-à-dire la volonté de commettre l’infraction, fait défaut. Le régime de responsabilité pénale internationale actuel ne reconnaît pas la responsabilité pour négligence dans ce contexte. Cette approche pragmatique pourrait néanmoins évoluer. D’une part, si les erreurs algorithmiques de ciblage se multiplient, le caractère « raisonnable » de l’erreur sera de plus en plus difficile à invoquer et l’utilisation consciente d’un système connu pour ses défaillances pourrait induire une forme d’intention indirecte de cibler des civils. D’autre part, le droit pourrait à l’avenir se développer pour sanctionner les militaires qui, par leur négligence, causent la mort de civils.

La responsabilité des entreprises d’IA. Un bras de fer entre puissances économique et politique.

Un autre point de vigilance tient au rôle des entreprises privées spécialisées en IA qui détiennent aujourd’hui la majeure partie des compétences technologiques mobilisées sur le champ de bataille. Ces entreprises pourraient être tenues responsables lorsqu’elles développent des systèmes défaillants, mais, au-delà de cette responsabilité, une question morale et politique fondamentale se pose au regard de la vente de technologies d’IA à des fins militaires.

Juste avant l’entrée en guerre des États-Unis, Anthropic, qui produit le système Claude, s’était opposé à une coopération sans limite avec le Pentagone, notamment sur les armes autonomes, en invoquant ses engagements éthiques et les limites de fiabilité technique de ses systèmes pour les usages envisagés. Le Pentagone avait alors accusé Anthropic de trahison, bien que ses systèmes continuent d’être utilisés par l’armée.

D’autres entreprises du secteur, comme OpenAI, Google, Amazon ou Microsoft, semblent, quant à elles, collaborer sans réserve avec les armées, s’imposant de facto comme de véritables entreprises de défense. Il est intéressant de noter que des entreprises, normalement guidées par le profit, ont parfois plus d’états d’âme en la matière que certains États pourtant garants de l’intérêt général.

La responsabilité étatique. Répondre de ses actes et prévenir les prochaines violations.

Les États qui développent et utilisent l’IA militaire portent une responsabilité particulière. En l’espèce, les États-Unis engagent leur responsabilité internationale pour la commission d’un fait internationalement illicite. Cette responsabilité sera, certes, difficile à mettre en œuvre dans la pratique. Mais au-delà, il émerge une responsabilité tant juridique que politique. Aux termes de l’article 1 commun aux conventions de Genève, les États ont en effet l’obligation de respecter et de faire respecter le DCA. Or, le développement de l’IA militaire tend à miner ce respect, voire à favoriser et à dissimuler les violations du droit.

Divers mécanismes pourraient endiguer ce phénomène, comme la formation des militaires aux spécificités des systèmes d’IA, l’élaboration de règles d’engagement propres à l’IA, des garanties techniques de fiabilité et de transparence des systèmes ainsi que des tests et évaluations réguliers. Plusieurs initiatives internationales appellent à intégrer de telles mesures au sein de nouveaux instruments juridiques. Pourtant, la volonté politique fait défaut, notamment chez les États à l’avant-garde du développement et de l’utilisation de l’IA militaire.

Ainsi, Pete Hegseth, secrétaire à la défense des États-Unis, semble en réalité agir dans le sens contraire. Il a récemment limogé des conseillers juridiques militaires qu’il considérait comme des entraves à la bonne conduite des hostilités et a qualifié les règles d’engagement de stupides. Plus largement, les États-Unis s’opposent à toute réglementation juridique internationale de l’IA militaire. L’IA apparaît ainsi comme à la fois l’un des moteurs et le révélateur d’une érosion profonde du DCA.

Jacques Lacan disait : « Le réel, c’est quand on se cogne. » L’accident de Minab constitue un évènement dramatique qui confirme les risques sur lesquels les experts en IA militaire alertent depuis plusieurs années et qui aurait dû susciter bien davantage de réactions.

En réalité, cette information semble avoir été éclipsée par d’autres considérations perçues comme plus urgentes et plus visibles dans le cadre de cette guerre, à commencer par le risque nucléaire. L’accident de Minab n’aura pas été l’électrochoc attendu pour inciter les États à s’entendre sur un cadre juridique spécifique applicable à l’IA militaire. Il reste à savoir si un tel électrochoc est encore possible ou même souhaitable.

The Conversation

Louis Perez ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

L'IA générative ne détruira pas votre emploi mais elle va changer profondément votre métier

L’intelligence artificielle ne détruit pas tant des emplois qu’elle modifie profondément les compétences nécessaires pour les accomplir. De cette confusion entre emploi et compétences risquent de naître des erreurs dans les politiques d’accompagnement des mutations en cours.


Chaque grande vague technologique a produit son lot de prédictions contradictoires sur l’emploi. L’intelligence artificielle (IA) ne fait pas exception. Mais avant de savoir combien d’emplois l’IA va créer ou détruire, il faudrait s’accorder sur ce qu’elle automatise réellement. La réponse oblige à distinguer trois notions que le débat public confond régulièrement : l’emploi, la compétence et la tâche.

Les grandes vagues d’automatisation ont suivi une logique remarquablement stable en deux siècles : vapeur, électricité, robotique industrielle ont déplacé les tâches physiques répétitives et épargné le travail cognitif non routinier. Cette régularité empirique a été formalisée par Autor, Levy et Murnane dès 2003 sous le nom d’« hypothèse de polarisation des tâches ».

Une illusion persistante

L’automatisation ronge les emplois intermédiaires, ceux des cols bleus qualifiés et employés de bureau exécutant des tâches routinières, mais épargne les deux extrémités. D’un côté, les tâches manuelles non routinières, comme la plomberie ou les soins, de l’autre, les tâches cognitives non routinières, comme l’analyse, le conseil ou la rédaction experte. Ces dernières constituaient le cœur des professions du tertiaire qualifié, et la conviction s’était solidement installée qu’elles resteraient hors d’atteinte.


À lire aussi : Pourquoi l’IA oblige les entreprises à repenser la valeur du travail


Cette conviction reposait sur une confusion conceptuelle qu’il faut dissiper avant tout. Ce n’est pas l’emploi de juriste ou d’analyste financier qui était protégé, c’est un ensemble de tâches précises qui composaient cet emploi et qui résistaient jusqu’ici à l’automatisation. La distinction entre ces trois niveaux est fondamentale.

Un emploi désigne un poste occupé dans une organisation, avec un contrat, un salaire, une fiche de poste. Une compétence est une capacité cognitive ou technique mobilisable dans plusieurs contextes professionnels. Une tâche est une action précise, délimitable, dont on peut évaluer si elle est ou non automatisable à un coût donné. C’est à ce troisième niveau que se joue réellement la transformation en cours, et c’est précisément ce niveau que le débat public ignore.

Rupture dans la longue histoire du capitalisme industriel

L’IA générative constitue une rupture dans cette longue histoire. Pour la première fois depuis l’industrialisation, les tâches cognitives qualifiées, rédaction, analyse documentaire, synthèse, production de premiers jets, se retrouvent directement exposées. Eloundou, Manning, Mishkin et Rock estiment qu’environ 80 % de la population active états-unienne pourrait voir au moins 10 % de ses tâches affectées par les grands modèles de langage, et que cette exposition croît avec le niveau de salaire. C’est l’exact inverse du schéma observé lors de toutes les vagues précédentes.

Le cadre analytique développé par Acemoglu et Restrepo permet d’aller plus loin. Leur modèle distingue deux effets opposés produits par toute vague d’automatisation :

  • l’effet de déplacement, d’abord : des travailleurs perdent des tâches au bénéfice de la machine, ce qui réduit mécaniquement la demande de travail et pèse sur les salaires des groupes affectés ;

  • l’effet de réintégration, ensuite : l’automatisation produit de nouvelles tâches où la valeur humaine est décisive, générant une demande compensatrice.

L’histoire longue du capitalisme industriel peut se lire comme une succession de ces deux effets, le second finissant généralement par compenser le premier.

Le cas de la traduction permet de voir très concrètement comment déplacement et réintégration se combinent, l’IA générative peut produire en quelques secondes un premier jet dans une autre langue, ce qui déplace une partie du travail auparavant effectué par des traducteurs humains vers la machine. Mais cette automatisation réintègre simultanément d’autres tâches ou renforce leur importance, telles que la vérification des contresens, l’adaptation au contexte culturel, l’harmonisation de la terminologie, le contrôle de la qualité et la validation finale.

Potentiel déséquilibre

Ce qui est préoccupant avec l’IA générative, c’est le déséquilibre potentiel entre ces deux dynamiques. Le déplacement s’opère à une vitesse que les marchés du travail et les institutions de formation peinent à absorber, tandis que la réintégration reste encore largement à construire.

Cependant, le phénomène le plus important n’est pas sectoriel, mais il est interne aux métiers eux-mêmes. Dans ses « Perspectives de l’emploi », l’OCDE met en évidence que les professions les plus exposées à l’IA générative sont précisément celles à forte densité cognitive : finance, droit, conseil, enseignement supérieur. Contrairement aux vagues précédentes qui frappaient les zones rurales et les bassins industriels, l’exposition est désormais plus forte dans les grandes métropoles et chez les travailleurs hautement qualifiés, un renversement géographique et social inédit.

Redistribuer les tâches

Ce renversement se joue concrètement au niveau de la tâche.

Dans un même poste d’analyste financier ou de juriste, certaines tâches migrent vers l’IA (produire un résumé exécutif, générer une première analyse de contrat, synthétiser une revue de littérature), tandis que d’autres se revalorisent mécaniquement : définir le cadre d’analyse pertinent, évaluer la qualité d’un raisonnement automatisé, détecter une erreur factuelle dans un output, assumer la responsabilité juridique ou éthique d’une décision. Ce ne sont pas des emplois qui disparaissent. Ce sont des bouquets de tâches qui se redistribuent entre humains et machines, transformant de l’intérieur ce qu’un employeur attend d’un salarié qualifié.

Cette redistribution des tâches a une implication directe sur les compétences qui seront réellement valorisées dans les années à venir, et elle renverse une partie des évidences habituelles sur la formation professionnelle.

Former les travailleurs à utiliser l’IA au sens instrumental, maîtriser un outil, rédiger des prompts efficaces, s’approprier une interface, est utile à court terme, mais c’est insuffisant si la compétence réellement demandée demain n’est pas de produire avec l’IA, mais de superviser et de critiquer ce qu’elle produit.

Un enjeu de formation

Or, superviser efficacement un output d’IA requiert exactement ce que les formations courtes et techniques peinent à développer : une culture générale solide permettant de détecter une erreur de fond, une capacité argumentative pour évaluer la cohérence d’un raisonnement, une connaissance des biais cognitifs pour identifier les angles morts d’une analyse automatisée. Ce sont des compétences que les sciences de l’éducation regroupent sous le terme de métacompétences : apprendre à apprendre, à exercer un jugement critique, à mobiliser des savoirs dans des situations inédites.

Arte, 2025.

Le paradoxe devient alors le suivant. À mesure que l’IA automatise les tâches routinières de la connaissance, elle valorise précisément ce que les formations généralistes et les cursus de sciences humaines cultivent de longue date et que les débats sur l’employabilité ont eu tendance à déconsidérer au profit de compétences techniques plus immédiatement mesurables.

Non par nostalgie des humanités, mais par logique économique pure. Si la machine produit le texte, l’analyse et la synthèse, la valeur marginale de l’humain réside dans sa capacité à juger si ce texte dit vrai, si cette analyse est pertinente au regard du contexte réel, si cette synthèse sert l’objectif poursuivi.

The Conversation

Hugo Spring-Ragain ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

L’IA, les Lego et le rap : les nouvelles armes de l’Iran face à Trump et Nétanyahou

Sur cette image issue de l’une des nombreuses vidéos virales publiées sur les réseaux sociaux par des comptes liés à l’Iran, Donald Trump et Benyamin Nétanyahou signent un pacte avec Satan et Moloch.

Peu après le début de la guerre en Iran, de nombreuses vidéos générées par l’intelligence artificielle ont été publiées sur les réseaux sociaux par des comptes proches du régime de Téhéran. Tirées de l’univers Lego, associées à un texte rappé et montées comme des clips, elles ont un objectif bien précis : exposer avec sarcasme et de façon attractive la propagande du régime iranien, et décrédibiliser ses adversaires américains et israéliens. Analyse d’un outil de communication qui emprunte à de nombreux codes de la pop culture occidentale.


Dans toutes les guerres, les belligérants s’emploient, par des opérations de propagande, à valoriser leur camp et à dévaloriser l’adversaire, tout en cherchant à soutenir le moral de leur population et à entretenir sa mobilisation. Parfois, ces opérations de propagande se matérialisent par des discours et des images qui agissent surtout comme une contre-propagande, répondant aux arguments et aux imageries de l’adversaire afin d’en neutraliser les effets possibles, sur sa propre opinion ou sur l’opinion publique internationale.

À ce jeu, la République islamique d’Iran se montre très active et efficace. Elle appuie un petit réseau d’activistes qui publient en ligne de brèves vidéos générées par l’intelligence artificielle qui tournent en ridicule les administrations Trump et Nétanyahou à travers des animations de… figurines Lego. Comme nous l’avons déjà montré, l’IA devient un atout maître pour la contestation visuelle.

Un usage préexistant des Lego pour dénoncer la guerre

Reproduire des pièces de Lego par l’IA est relativement simple. Résultat : de nombreuses images utilisant ce ressort circulent sur Internet à des fins humoristiques ou critiques. L’association de l’univers Lego à la dénonciation de la guerre fait partie de ces usages.

Ainsi, la destruction de Gaza par les bombardements israéliens a donné lieu à la génération d’images de boîtes Lego, composées de morceaux fracassés censés représenter les ruines de Gaza, ces montages étant employés à la fois par des soutiens d’Israël pour humilier les Palestiniens ou par des défenseurs de ces derniers afin de protester contre l’action du gouvernement Nétanyahou.

De même, les sarcasmes visant l’ambition de Donald Trump de s’approprier le Groenland sont également passés par le recours à l’imagerie Lego, ce qui est d’autant plus ironique que l’entreprise est née au Danemark, lequel exerce sa tutelle sur ce territoire arctique.

Image générée par IA et publiée sur X début 2025 montrant la première ministre du Danemark, Mette Frederiksen, en train d’offrir le Groenland à Donald Trump… mais en Lego. Compte X Piraten_Saar

Des vidéos Lego version rap pour gagner en viralité

La culture Internet est à la fois une culture mémétique et une culture mimétique. Mémétique, car les conditions du succès d’un message reposent en partie sur son ancrage culturel préalable et reconnaissable, à plus forte raison lorsqu’il s’agit de contenus à vocation humoristique ou sarcastique. La culture « LOL » (acronyme anglais pour « mort de rire ») est faite de clins d’œil, d’allusions, de télescopages entre actualité et références plus anciennes, et de fusions de références culturelles qui ne vont pas spontanément ensemble, voire qui détonnent.


À lire aussi : Ukraine : la guerre des mèmes


Le recours à des références déjà connues pour commenter l’actualité sur les réseaux socionumériques aide alors à gagner en visibilité, et accroche mieux l’œil dans une économie de l’attention toujours volatile. Reprendre à son compte des imageries existantes, qui circulent déjà selon une logique, décrite par Limor Shifman, de remake, de parodie, d’imitation (des mèmes, donc), accroît le potentiel de viralité. Les figurines Lego universellement connues comme jouets pour enfants, les Lego animés des films grand public (The Lego movie, en 2014, a été un succès au box-office mondial, les Lego comme ressource humoristique, sont autant de référents qui circulent déjà sur Internet et en font une ressource mémétique efficace.

S’y ajoute la culture mimétique qui fait que le succès initial inspire d’autres créateurs qui voient dans un mème et ses références une recette exploitable. On voit ce travail mimétique à l’œuvre dans la période récente, puisqu’à partir de la forte visibilité acquise par les premiers contenus iraniens Lego de contre-propagande, apparus fin mars, d’autres créateurs (anonymes et donc pas nécessairement iraniens) produisent aussi des vidéos en Lego pour dénoncer l’aventurisme militaire de Donald Trump et du premier ministre israélien. Elles se reconnaissent notamment par le fait que les figurines ne sont pas toujours animées, et par la représentation de Trump qui n’a pas exactement le même visage que dans les vidéos iraniennes.

Une chose est sûre, recourir à des figurines populaires très connues garantit une recevabilité de ce message auprès de gens qui peuvent être attirés par ces images, alors qu’ils auraient spontanément fui tout message de propagande iranienne classique.

En outre, la bande-son qui accompagne ces vidéos est toujours un rap, là encore généré par IA, aux paroles virulentes et humiliantes pour Donald Trump et son allié israélien, ce qui constitue un contre-discours bien en phase avec le phrasé brutal, peu élaboré et vulgaire de Donald Trump lui-même et s’approprie la pratique des punchlines du rap. De plus, le recours à des jouets permet de montrer la violence de la guerre en contournant les restrictions imposées à ces images par les réseaux sociaux.

Un outil bien pensé de contre-propagande

Deux groupes propagandistes iraniens signent leurs œuvres, mises en circulation depuis fin mars, à un rythme quotidien : Persiaboi & Explosive News. La BBC a interviewé un représentant du second groupe. Ce dernier admet avoir l’État iranien pour « client » et considère « honorable de travailler pour la patrie ». Il explique par ailleurs que son équipe chez Explosive Media compte moins de dix personnes et utilise des graphismes de type Lego « parce que c’est un langage universel ». Sur X, les comptes des médias d’État iraniens et russes les partagent régulièrement, ce qui permet d’atteindre des millions de vues.

Ce travail est très bien pensé puisqu’il colle à l’actualité, recyclant des images qui ont fait le tour des chaînes d’information du monde entier, soit pour mieux les mettre en valeur, soit pour les contester si elles desservent les intérêts de Téhéran. Cette contre-propagande répond en effet du tac au tac — souvent en quelques heures — à des discours tenus ou à des événements survenus. Il s’agit de tenter de tuer dans l’œuf une rhétorique américano-israélienne qui pourrait se répandre et convaincre les opinions publiques, en proposant un récit alternatif, une autre manière de voir les faits, d’interpréter la situation.

Dans les deux exemples qui suivent, on voit que l’image d’un avion américain Awacs bombardé sur une base saoudienne fait partie de l’imagerie Lego dans plusieurs vidéos. Elles recherchent un vrai réalisme dans la représentation des dégâts occasionnés à la carlingue.

Dans le même esprit, la propagande iranienne a mis en scène Mohammed Qalibaf, l’un des nouveaux hommes forts de la RII, durant son vol pour Islamabad afin d’y rencontrer J. D. Vance venu négocier une issue du conflit au nom de Donald Trump : des photos des enfants tués dans le bombardement de leur école à Minab le 28 février avaient été placées sur les sièges passagers de son avion, ainsi que des cartables ensanglantés et abîmés. Cette mise en scène macabre est reprise en début d’une vidéo Lego.

À gauche, des images partagées par le service de communication de Mohammed Qalibaf ; à droite, une scène d’une vidéo virale iranienne publiée peu après.

Le contre-récit le plus flagrant se trouve dans la vidéo réalisée par PersiaBoi publiée le 7 avril 2026 et intitulée « Uranium heist. Dead of night ». Avec ces images synthétiques, la vidéo prend le contre-pied du récit d’héroïsation de l’opération de récupération d’un aviateur américain échoué en terre ennemie.

Loin du succès bruyamment mis en scène par l’administration Trump, ce petit clip dénonce sur fond de rap une « failed operation, $600 million wasted » (opération échouée, 600 millions de dollars (500 millions d’euros) gâchés). L’opération aurait été, selon les auteurs de la vidéo, une tentative (manquée) de récupération de l’uranium enrichi iranien : « They said it was a rescue. But it was a heist, a uranium heist » : « Ils disent que c’était une opération de secours, mais c’était un braquage, un braquage d’uranium »).

Donald Trump, la cible principale de cette propagande en Lego

Dans toutes les propagandes de guerre, l’une des obsessions est de décrédibiliser ses ennemis et spécialement leur chef. Donald Trump est donc particulièrement ciblé. Au-delà des attaques visant ses défaillances en tant que chef de guerre — il est présenté comme étant immature, lâche et menteur —, la propagande iranienne recycle toute une série de critiques qui lui sont adressées depuis longtemps, notamment par ses adversaires politiques américains. Une telle approche est de nature à ravir ses nombreux détracteurs de par le monde, y compris certains de ceux qui sont pourtant hostiles au régime des mollahs.

Donald Trump est présenté comme un « loser » : il serait supposément en train de perdre la guerre, il éprouve donc une peur panique, matérialisée par des perles de sueur sur son visage et par un regard inquiet ou horrifié. Il serait donc encore prêt à reculer. C’est l’exploitation de la fameuse figure du TACO : Trump always Chickens Out (« Trump se dégonfle toujours ») que ses adversaires politiques américains lui collent en étiquette. Et, finalement, il serait défait, et on le montre en train de brûler ou d’agoniser aux urgences, avec du pétrole en perfusion.

Son manque de crédibilité est également dénoncé en convoquant la figure du clown :

… mais aussi celle du menteur compulsif, colporteur de fake news.

L’Iran, vengeur des enfants martyrs…

Ce travail de sape de la réputation de Donald Trump et de l’armée américaine — qui seraient en train de s’enliser en Iran — s’accompagne d’une tentative d’ennoblissement du régime des mollahs, qui se font les défenseurs des enfants martyrisés. On y retrouve les fillettes de l’école Minab, pulvérisée par un missile américain, mais également les références aux adolescentes prises dans les filets de Jeffrey Epstein et ses complices. La défense héroïque de l’Iran est ainsi exposée comme une façon de venger la mémoire de ces filles au destin tragique.

Une fois encore, les narratifs internes à la vie politique américaine sont recyclés par les Iraniens pour essayer de rallier à leur cause des opposants à Trump. C’est ainsi que sur plusieurs vidéos, des inscriptions mémorielles sont dessinées sur les missiles iraniens prêts à être lancés contre les forces américaines.

… et fédérateur des victimes de l’Amérique

Pour conclure sur l’incroyable richesse de références occidentales dont sont porteuses ces vingtaines de vidéos mises en ligne (et parfois censurées par les plates-formes), il faut aussi pointer la présence de références, mondialement connues, à des archétypes de l’anti-américanisme. Les Iraniens aspirent dans ces vidéos à rallier à leur cause tous ceux qui ont des griefs historiques à l’encontre des États-Unis d’Amérique. Une vidéo publiée début avril par Explosive News dresse un panorama historique des populations qui ont de bonnes raisons d’en vouloir à l’Amérique.

Sous le titre « one vengeance for all » sont mobilisées des figurines d’Indiens à plumes, d’esclaves africains enchaînés, d’une famille vietnamienne, de victimes japonaises de la bombe nucléaire, de prisonniers irakiens d’Abu Ghraib, d’enfants de Gaza, de fillettes de l’île d’Epstein. L’Iran serait leur bras vengeur, enclenchant une série de destructions spectaculaires : la Maison-Blanche est en ruines, les lettres de la colline d’Hollywood sont en feu, la statue de la Liberté s’effondre, le porte-avions Gerald Ford explose, le billet de 1 dollar se consume.

Le régime qui vient de massacrer au minimum 30 000 de ses citoyens pour avoir eu le malheur de revendiquer leur liberté a donc le toupet de se présenter en réparateur de ce qu’il évoque comme des injustices historiques.

Le recyclage de motifs antisémites

Pour achever ce tour d’horizon des principaux aspects de cette contre-propagande originale, il faut souligner la nature antisémite de plusieurs des représentations produites par un régime qui prône la disparition de l’État d’Israël. Ces vidéos pointent la responsabilité du premier ministre israélien dans le ralliement de Trump aux bombardements en Iran. Elles mobilisent à plusieurs reprises le cliché du Juif qui tire les ficelles, du Juif marionnettiste qui manipule le monde, directement inspiré lui-même par le diable. On retrouve cet imaginaire nauséabond dans l’histoire de l’iconographie antisémite slave (notamment serbe) ou nazie.

Trump et Nétanyahou agissent sous le contrôle du diable (dans sa représentation chrétienne classique, rouge et avec des cornes) et de Moloch, dans sa représentation juive originelle mais porteuse de signes judaïques qui en font un marqueur antisémite. Sachant que la Bible associe le culte de Moloch, pratiqué chez les Cananéens dans l’Antiquité, au sacrifice d’enfants.

Dans une des vidéos, ces figures diaboliques et repoussoirs finissent par être immolées grâce à l’action censément purificatrice de l’Iran. Pareille iconographie renoue, de plus, avec la phraséologie officielle du régime iranien qui qualifie systématiquement l’Amérique de « grand Satan » et Israël de « petit Satan ».

Ajoutons, pour conclure, que ces vidéos placent l’Iran du côté de la modernité et de la maîtrise de l’IA génératrice de contenus. Cette nation d’ingénieurs se donne à voir comme capable de produire ad libitum, et de façon hyper-réactive, des vidéos de contre-propagande face aux assauts armés et à la puissance de communication américano-israéliens.

The Conversation

Arnaud Mercier a reçu des financements de la Commission européenne.

Promesses et défis de la révolution IA dans les systèmes de santé en transition : l’exemple du Maroc

L’intelligence artificielle se développe au Maroc dans plusieurs établissements hospitaliers, comme outils d’aide au diagnostic, en télémédecine pour la prise en charge de populations rurales, etc. Les premiers résultats sont prometteurs. Mais ces technologies posent aussi nombre de questions d’ordre éthique, juridique et aussi de fiabilité. Par exemple, le fait que la plupart des systèmes d’IA en santé soient développés sur des données issues de populations occidentales pose question.


Le Maroc a franchi un cap symbolique en 2024 avec le lancement de sa stratégie nationale de développement de l’intelligence artificielle et la feuille de route « Maroc IA 2030 » qui a placé la santé parmi ses secteurs prioritaires.


À lire aussi : L’Afrique à l’assaut de l’IA, avec le Rwanda, le Maroc et le Kenya en moteurs


Cette ambition intervient alors que l’Organisation mondiale de la santé (OMS) estime que l’IA pourrait améliorer significativement l’accès aux soins dans les pays à ressources limitées.

Mais comment cette révolution technologique peut-elle s’adapter aux réalités du système de santé marocain, entre espoirs légitimes et défis considérables ?

Des applications concrètes qui transforment déjà la pratique médicale

L’intelligence artificielle commence à s’implanter dans plusieurs hôpitaux marocains, particulièrement dans les centres hospitaliers universitaires de Casablanca et Rabat. Les algorithmes d’aide au diagnostic médical montrent des résultats prometteurs, notamment en radiologie où ils détectent avec une précision comparable aux radiologues expérimentés certaines anomalies pulmonaires ou osseuses.

Prenons l’exemple concret d’une radiographie thoracique : là où un radiologue peut mettre plusieurs minutes à analyser l’image et rédiger son compte-rendu, un algorithme d’IA peut identifier en quelques secondes les zones suspectes, signalant par exemple une pneumonie ou une tumeur potentielle. Le médecin garde bien sûr le dernier mot, mais dispose d’une aide précieuse, particulièrement dans les services surchargés.

La télémédecine constitue un autre domaine d’application majeur. Dans un pays où les disparités géographiques d’accès aux soins restent importantes, les systèmes d’IA permettent de faire le lien entre patients des zones rurales et spécialistes urbains.

Imaginons une patiente diabétique vivant dans une région reculée de l’Atlas : grâce à une application mobile équipée d’IA, elle peut photographier ses analyses de sang, recevoir une première analyse automatisée et être mise en relation avec un endocrinologue si nécessaire, sans avoir à parcourir des centaines de kilomètres.

La gestion hospitalière bénéficie également de ces technologies. Les algorithmes prédictifs aident à anticiper les besoins en ressources, à optimiser la planification des blocs opératoires et à gérer les stocks de médicaments. Un système d’IA peut par exemple prédire les pics d’affluence aux urgences en fonction de multiples facteurs (épidémies saisonnières, accidents, conditions météorologiques) et permettre d’ajuster les effectifs en conséquence.

Des défis éthiques et juridiques à ne pas sous-estimer

L’enthousiasme technologique ne doit pas occulter des questions fondamentales. La protection des données de santé constitue le premier enjeu. Le Maroc dispose certes d’une loi sur la protection des données personnelles, mais son cadre juridique reste encore incomplet concernant spécifiquement les données de santé et leur utilisation par des algorithmes d’IA.

Concrètement, que se passe-t-il lorsqu’un hôpital collecte les dossiers médicaux de milliers de patients pour entraîner un algorithme ? Qui a accès à ces données ? Comment garantir leur anonymisation ? Peuvent-elles être transférées à l’étranger pour être traitées par des entreprises technologiques internationales ? Ces questions restent largement sans réponse.

L’équité d’accès représente un autre défi majeur. Si l’IA est déployée prioritairement dans les grands centres urbains, elle risque d’accentuer les inégalités territoriales existantes. Un cardiologue de Casablanca pourrait bénéficier d’un électrocardiogramme analysé instantanément par IA, tandis qu’un médecin généraliste isolé dans une commune rurale continuerait à travailler avec des moyens limités.

La question de la responsabilité médicale soulève également des interrogations inédites. Imaginons qu’un algorithme rate un diagnostic de cancer sur une mammographie et que la patiente ne soit diagnostiquée que des mois plus tard, à un stade avancé. Qui est responsable : le radiologue qui a validé l’analyse automatisée, l’établissement qui a adopté le système, ou la société qui l’a développé ? Le cadre juridique marocain actuel n’apporte pas de réponses claires.

Les biais algorithmiques, un risque invisible mais réel

Un problème plus subtil mais tout aussi crucial concerne les biais des algorithmes. La plupart des systèmes d’IA en santé sont développés sur des données issues de populations occidentales. Leur transposition directe au contexte marocain pose question : les particularités génétiques, épidémiologiques et socioculturelles de la population marocaine sont-elles suffisamment représentées ?

Un exemple parlant : un algorithme de diagnostic dermatologique entraîné principalement sur des peaux claires pourrait avoir des difficultés à détecter correctement un mélanome sur une peau plus foncée. De même, un outil d’évaluation du risque cardiovasculaire calibré sur des populations européennes pourrait sous-estimer ou surestimer les risques pour des patients marocains ayant un profil génétique et des habitudes alimentaires différents.

Des recherches internationales ont démontré que des algorithmes peuvent reproduire voire amplifier des discriminations existantes. Dans le contexte marocain, cela pourrait également se traduire par des performances dégradées pour certaines populations déjà vulnérables.

Vers une adoption responsable et adaptée

Pour que l’intégration de l’IA dans le système de santé marocain soit réellement bénéfique, plusieurs conditions doivent être réunies. D’abord, développer un cadre réglementaire spécifique combinant protection des données, certification des algorithmes médicaux et définition des responsabilités. L’Union européenne a récemment adopté une législation sur l’IA (l’AI Act) dont le Maroc pourrait s’inspirer.

Ensuite, investir massivement dans la formation des professionnels de santé. L’IA ne remplacera pas les médecins mais transformera leurs pratiques. Un jeune médecin marocain doit aujourd’hui apprendre non seulement la sémiologie clinique traditionnelle, mais aussi à interpréter les recommandations d’un algorithme, à identifier ses limites et à conserver son esprit critique.

La recherche locale en IA santé doit également être encouragée. Les universités marocaines doivent développer des algorithmes entraînés sur des données locales, reflétant les spécificités de la population et des pathologies prévalentes au Maroc.

Enfin, une approche inclusive s’impose. Le déploiement de l’IA en santé doit s’accompagner d’investissements dans les infrastructures de base : connectivité Internet dans les zones rurales, équipements médicaux numériques, formation du personnel… L’objectif étant que la technologie serve à réduire les inégalités plutôt qu’à les creuser.

L’intelligence artificielle offre au Maroc une opportunité historique de moderniser son système de santé et d’améliorer l’accès aux soins de millions de citoyens. Mais cette transformation ne réussira que si elle s’accompagne d’une réflexion éthique approfondie, d’un cadre juridique adapté et d’une volonté politique de garantir l’équité.

La technologie n’est qu’un outil : c’est la manière dont nous choisissons de l’utiliser qui déterminera si elle servira réellement l’intérêt général.

The Conversation

Oumaima Omari Harake ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Comprendre les « modèles de fondation », ces nouvelles infrastructures numériques à la base de nombreuses applications d’IA

La polyvalence des modèles de fondation les transforme en une nouvelle « infrastructure » numérique, au même titre que le cloud ou Internet. Au lieu de reconstruire un modèle d’IA spécifique à chaque projet, on peut se brancher directement sur des briques généralistes existantes. C’est un des secrets qui permet de développer des applications si sophistiquées et qui restent accessibles aux non-spécialistes.


Les systèmes d’apprentissage automatique ne se limitent plus à des outils conçus pour une seule tâche, comme la traduction ou la recommandation de produits. Une transformation majeure tient à l’émergence des foundation models, ou modèles de fondation : de très grands modèles entraînés sur des volumes massifs de données pour acquérir des connaissances générales, réutilisables dans de nombreux contextes.

Dans les organisations, ils agissent comme un accélérateur potentiel de transformation, mais leurs effets sur le terrain obligent, pour l’instant, à nuancer les promesses spectaculaires. Comment fonctionnent-ils ? Comment sont-ils régulés et quels sont les obstacles à une adoption qui porte ses fruits ?

Comment fonctionnent les modèles de fondation ?

Les modèles de fondation reposent sur un principe simple : apprendre des structures générales à partir de très grandes quantités de données hétérogènes – textes, images, codes, sons, vidéos, bases de données ouvertes et contenus sous licence, ou une combinaison de ces types de données.

L’objectif de l’entraînement initial est de permettre au modèle d’identifier des régularités statistiques dans les données et de construire des représentations générales du langage, des images ou d’autres formes d’information. Sur le plan technique, ces systèmes utilisent le plus souvent des architectures de réseaux de neurones profonds. Durant la phase d’entraînement, le modèle apprend à prédire une partie manquante de l’information, par exemple le mot suivant dans une phrase ou une portion d’image, en ajustant progressivement des milliards de paramètres. Ce processus d’apprentissage, appelé pré-entraînement, nécessite des ressources de calcul considérables et constitue la base du caractère « généraliste » de ces modèles.


À lire aussi : Aux sources de l’IA : le prix Nobel de physique attribué aux pionniers des réseaux de neurones artificiels et de l’apprentissage machine


Une fois pré-entraîné, le modèle de fondation peut être adapté à des usages spécifiques, allant de l’analyse de sentiment ou la réponse à des questions jusqu’à des tâches plus techniques, comme l’assistance au diagnostic médical.

Cette adaptation peut se faire grâce à un ajustement supplémentaire appelé fine-tuning, par exemple en nourrissant un modèle généraliste d’imagerie médicale avec des radiographies spécifiques à une maladie permettant à l’outil d’apprendre à prédire l’évolution d’une pathologie précise.

Elle peut aussi passer par l’apprentissage avec retour humain (reinforcement learning with human feedback), qui consiste à faire évaluer plusieurs réponses par des humains pour inciter le modèle à privilégier des formulations claires et sécurisées plutôt que de simples suites de mots statistiques.

Enfin, cette adaptation peut s’opérer simplement par prompting, en guidant le modèle par des instructions textuelles du type : « Résume ce document en trois points. »

C’est cette capacité à être réutilisés dans de nombreux contextes qui explique pourquoi ces systèmes sont qualifiés de « modèles de fondation » : ils servent de base technologique à une large gamme d’applications. Par exemple, GPT-4 ou GPT-5 servent déjà de socle opérationnel à de nombreuses applications, à l’image de ChatGPT, tout en conservant un potentiel d’extension encore largement ouvert.

infographie décrivant l’entraînement puis la spécialisation de modèles issus de modèles de fondation
Les modèles de fondation servent de base technologique à une large gamme d’applications. Cette infographie décrit l’entraînement puis les applications spécifiques issues de modèles de fondation. Sabrine Mallek, Fourni par l'auteur

Comprendre l’écosystème : comment modèles de fondation, LLM et IA générative s’articulent-ils ?

Concrètement, les modèles de fondation ne sont pas une application en soi, mais une infrastructure de base. Ils marquent une évolution récente de l’intelligence artificielle (IA), rendue possible par la combinaison de trois facteurs : l’explosion des données, les progrès des capacités de calcul et l’apparition de nouvelles architectures d’apprentissage.

Un tournant majeur intervient en 2017 avec l’architecture des transformers. Cette innovation permet de mieux capter les relations dans les données (notamment le langage), et devient la base de modèles comme BERT ou GPT. Lorsqu’un modèle de fondation (une expression née officiellement en 2021) est spécialisé dans le traitement du langage, on parle alors de grand modèle de langage (LLM). Et c’est sur cette base que se développent aujourd’hui les usages les plus visibles : ceux de l’IA générative, capable de produire du texte, des images, des vidéos, du son ou du code – qui est devenue grand public et commercialement viable avec le lancement de ChatGPT, fin 2022, marquant le passage de l’infrastructure à l’usage de masse.

Le rapport entre ces modèles de fondation et l’IA générative peut être comparé à celui d’un « moteur » par rapport à sa « fonction ». Le modèle de fondation est ce moteur puissant, pré-entraîné sur des données colossales et conçu pour être adaptable à une multitude de tâches. L’IA générative, quant à elle, est la fonction d’application finale : c’est la capacité de ce moteur à produire un contenu inédit.

Concrètement, si l’on prend un modèle de fondation comme GPT-4 (le moteur), on peut l’utiliser pour analyser des milliers d’avis clients (une tâche purement analytique). Mais lorsqu’on lui demande de rédiger un e-mail, on active alors sa fonction d’IA générative. De la même manière, dans le domaine visuel, un modèle de fondation entraîné sur des millions d’images peut servir de moteur aussi bien pour détecter une anomalie sur une radiographie médicale (classification) que pour dessiner un paysage imaginaire à partir d’une simple phrase (IA générative).

Imbrication entre infrastructure technique, spécialisation linguistique (LLM) et fonction de génération. La génération est une fonction parmi d’autres (c’est une application pratique des modèles de fondation lorsqu’on leur demande de générer du contenu). Sabrine Mallek, Fourni par l'auteur

Promesses d’efficience et réalités de terrain

Cette polyvalence signifie que les modèles de fondation tendent à devenir une nouvelle « infrastructure » numérique, au même titre que le cloud ou Internet : au lieu de reconstruire un modèle d’IA spécifique propre à chaque projet, les acteurs économiques se branchent directement sur ces briques généralistes existantes.

Dans les organisations, ils agissent comme un accélérateur potentiel de transformation, mais leurs effets sur le terrain obligent à nuancer les promesses de gains de productivité spectaculaires. Beaucoup d’entreprises peinent encore à dégager un retour sur investissement évident pour l’automatisation administrative, constatant souvent que les modèles de fondation ne réduisent pas la charge de travail, mais l’intensifie : les employés doivent désormais consacrer davantage d’énergie à vérifier et à corriger les résultats.

Par ailleurs, l’assistance aux experts (aide au code, à la décision) se heurte à une « frontière technologique en dents de scie » : face à une tâche donnée, le modèle peut exceller, mais s’avérer contre-productif s’il est utilisé aveuglément en dehors de sa zone de compétence.

Néanmoins, ces modèles permettent de créer de nouveaux services comme la personnalisation de la relation client à grande échelle. Mais pour libérer ce potentiel, la simple mutualisation technologique ne suffit pas. Il faut impérativement repenser l’organisation du travail en formant les employés pour leur donner l’autonomie nécessaire face à la machine.

Les débats européens sur la régulation

En Europe, les enjeux se sont cristallisés dans les discussions autour de l’AI Act, qui introduit une catégorie spécifique pour les « systèmes d’IA à usage général », dont les modèles de fondation sont l’exemple emblématique. L’idée est de ne plus réguler uniquement les cas d’usage finaux, mais aussi ces briques génériques qui irriguent tout l’écosystème.

La Commission nationale de l’informatique et des libertés (Cnil) s’est également saisie de ces enjeux à travers un plan d’action consacré à l’intelligence artificielle, visant à accompagner l’innovation tout en garantissant la protection des droits fondamentaux. Elle met notamment l’accent sur la protection des données utilisées pour entraîner les modèles, la transparence des systèmes ainsi que le développement d’IA respectueuses de la vie privée.

Dans ce contexte, l’entraînement de ces modèles soulève aussi des défis importants au regard du règlement général sur la protection des données (RGPD), notamment concernant l’origine des données utilisées, la possibilité pour les individus d’exercer leurs droits sur leurs données et la capacité technique des systèmes à supprimer ou de ne plus exploiter certaines informations après leur intégration dans l’apprentissage. Pour les entreprises, cela signifie que ces technologies doivent être intégrées dans des démarches structurées de conformité, de documentation et de gestion des risques.

La question devient donc : dans quelles conditions utiliser les modèles de fondation ? Cela implique une gouvernance claire entre fournisseurs, intégrateurs et utilisateurs, des exigences de transparence et de documentation, l’anticipation des impacts sur l’emploi à travers la formation et la reconversion ainsi qu’une articulation avec les politiques de responsabilité sociétale des entreprises (RSE), afin d’évaluer leurs effets sociaux, organisationnels et environnementaux.

The Conversation

Sabrine Mallek ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Intelligence artificielle : quels sont les apports concrets de la régulation européenne ?

L’intelligence artificielle s’impose désormais au cœur de décisions qui engagent directement la vie, la santé et les droits des citoyens européens. Dans des entreprises, des administrations, des hôpitaux ou sur des plateformes numériques, des algorithmes trient, évaluent, recommandent et parfois décident. Face à cette automatisation croissante, une question centrale se pose : la réponse de l’Union européenne pour encadrer l’intelligence artificielle est-elle à la hauteur des risques qu’elle prétend prévenir ?


Imaginons qu’une entreprise décide d’utiliser une intelligence artificielle (IA) pour automatiser son processus de recrutement. L’algorithme, conçu pour analyser des milliers de CV, est entraîné sur les données RH de l’entreprise des dix dernières années. Or, les profils recrutés durant cette période sont majoritairement masculins. L’algorithme déduit alors de ces données que les candidats masculins sont préférables et exclut de fait les profils féminins.

Ce scénario n’est pas fictif : il s’inspire directement du cas d’Amazon, dont l’outil de recrutement par IA a dû être abandonné après la révélation de ces biais eu égard aux risques juridiques qu’ils engendraient. Cet exemple illustre précisément les risques que le législateur entend prévenir : erreurs algorithmiques, atteintes aux droits fondamentaux, captation et fuite de données, dépendance technologique.

En réponse, l’Union européenne a bâti depuis plusieurs années un arsenal juridique ambitieux, allant du Règlement général sur la protection des données (RGPD) au Règlement sur l’intelligence artificielle (RIA). Ces textes doivent relever un défi de taille : concilier innovation et protection, réguler les acteurs internationaux sans les éloigner du marché européen, et garantir les droits fondamentaux sans censure – le tout face à des technologies transversales, opaques et en constante évolution. Cet ensemble de règles constitue-t-il une réponse satisfaisante ?

Pas de régulation de l’IA, sans régulation des données

La régulation de l’intelligence artificielle ne saurait être envisagée indépendamment d’une politique structurée de la donnée. La donnée constitue en effet le carburant indispensable au développement et au perfectionnement des systèmes d’intelligence artificielle. En cela, la quantité de données compte tout autant que leur qualité.

C’est pourquoi, le législateur européen a d’abord cherché à réguler la donnée avant de réguler l’IA : d’une part avec le RGPD dont la finalité est de protéger les données à caractère personnel (les informations concernant une personne physique identifiée ou identifiable, comme un numéro de téléphone ou une adresse postale).

D’autre part avec une série de textes portant sur la régulation des données non personnelles (les informations ne se rapportant à aucune personne identifiable, comme une statistique ou un nombre d’accidents sur une autoroute visée). Ceux-ci comprennent le DSA, le DMA, le DGA, le Data Act et visent notamment à limiter la domination des géants du numérique et organiser le partage et l’accès de certaines données entre plateformes, entreprises, administrations publiques et utilisateurs, condition indispensable au développement de l’IA.

Ces textes relatifs aux données ont été le préalable à l’élaboration de la première réglementation générale au monde sur l’intelligence artificielle : le RIA.

Quelles sont les obligations imposées aux entreprises par le RIA ?

Contrairement aux États-Unis, qui privilégient une approche dérégulée, et à la Chine, qui encadre principalement certains usages ciblés, l’Union européenne a fait le choix d’un cadre juridique général et contraignant, s’appliquant à l’ensemble des secteurs et des systèmes d’intelligence artificielle, afin de poser les bases d’un véritable droit commun de l’IA au sein du marché européen depuis son entrée en vigueur le 1er août 2024.

Son objectif est d’encadrer

« le développement, la mise sur le marché et l’utilisation de systèmes d’intelligence artificielle, qui peuvent poser des risques pour la santé, la sécurité ou les droits fondamentaux ».

Pour atteindre cet objectif, le RIA commence par définir précisément le champ des technologies qu’il entend encadrer. Il distingue : les systèmes d’intelligence artificielle, qui correspondent aux applications concrètes utilisées par les utilisateurs (ex : un outil de tri de candidatures, ChatGPT) et les modèles d’intelligence artificielle à usage général, qui constituent le socle technologique sur lequel reposent ces applications, comme GPT-4 pour ChatGPT.

Pour assurer un équilibre entre protection des personnes et innovation, le RIA classe les systèmes d’intelligence artificielle en quatre niveaux de risque :

  • le risque inacceptable (ex : système de notation sociale des citoyens, présentant un risque d’une atteinte grave aux droits fondamentaux) impliquant l’interdiction du système d’IA.

  • le risque élevé (ex : une IA utilisée pour évaluer des salariés, présentant un risque d’atteinte au droit du travail et à la vie privée) imposant des obligations comme celle de réaliser des audits ou celle d’entraîner le système sur des données qualitatives et exemptes de biais.

  • le risque limité (ex : assistant conversationnel d’un service client, présentant le risque d’une collecte de données sans consentement éclairé) obligeant notamment les opérateurs à informer les utilisateurs de l’usage de l’IA.

  • le risque minimal (ex : IA intégrée dans un jeu vidéo) dont ne découle aucune obligation spécifique.

Pour chaque niveau de risque, des obligations spécifiques et proportionnées sont donc édictées en fonction de leurs effets potentiels sur les droits fondamentaux, la sécurité et la santé des personnes. Ces obligations s’imposent à différents opérateurs selon le moment où ils interviennent dans la chaîne de valeur de l’IA : fournisseur, mandataire, importateur, distributeur…

Par exemple, un système d’IA utilisé pour l’analyse d’images médicales, qualifié de système à risque élevé, est soumis à des obligations spécifiques qui varient selon l’opérateur concerné : le fournisseur doit concevoir le système en conformité avec les exigences de sécurité et de gestion des risques comme s’assurer qu’il ne peut pas y avoir de faux positif ou de faux négatif dans le diagnostic mais également que le système ne présente pas de biais du fait d’une sous-représentation de certains groupes ethniques ou de genre, l’importateur et le distributeur doivent vérifier que cette conformité a été respectée, et l’hôpital qui déploie le système doit s’assurer qu’il est utilisé correctement et sous supervision humaine.

Concernant les modèles d’IA à usage général (ex : GPT-4, algorithme sur lequel repose ChatGPT), le législateur européen a édicté différentes règles selon qu’ils présentent ou non un risque systémique.

L’article 3 § 65 du RIA définissant le risque systémique comme :

« un risque spécifique aux capacités à fort impact des modèles d’IA à usage général, ayant une incidence significative sur le marché de l’Union en raison de leur portée ou d’effets négatifs réels ou raisonnablement prévisibles sur la santé publique, la sûreté, la sécurité publique, les droits fondamentaux ou la société dans son ensemble, pouvant être propagé à grande échelle tout au long de la chaîne de valeur ».

Ce risque est évalué selon la puissance de calcul du modèle. Les modèles d’IA à usage général qui présentent un risque systémique doivent notamment signaler les incidents graves (des biais, des faux positifs, une cyberattaque), prendre d’importantes mesures de cybersécurité ou encore tester le modèle et atténuer les risques systémiques identifiés (grâce à des audits, des mesures de protection contre les piratages ou encore des mesures de détection de biais). Plusieurs autorités ont été désignées pour contrôler la bonne application du règlement, c’est le cas notamment du comité européen de l’intelligence artificielle au niveau européen, et de la CNIL au niveau national.

Les limites du RIA

Le RIA a suscité des critiques des experts du droit et du monde professionnel à propos de sa mise en œuvre. Ainsi, 46 dirigeants d’entreprise ont dénoncé, dans une lettre ouverte destinée à la présidente de la Commission européenne, « des règlementations européennes peu claires, qui se chevauchent et deviennent de plus en plus complexes ». La technicité du RIA conjuguée à la complexité des algorithmes compliquent l’application du texte, en particulier pour les obligations de transparence – incompatibles avec l’opacité des algorithmes – et pour l’identification des responsabilités, les entreprises peinant à déterminer quelles obligations leur incombent selon leur position dans la chaîne de valeur et le niveau de risque du système.

En découle alors une autre problématique, le risque de freiner les acteurs français et européens, comme Orasio, H Company ou DeepL, qui tentent de concurrencer les géants américains de l’intelligence artificielle qui ont davantage de moyens (juridiques, technologiques, financiers) pour mettre en œuvre les obligations du RIA.

À cet égard, il convient de relever que le législateur européen a finalement renoncé, le 11 février 2025, à adopter une législation spécifique relative à la responsabilité civile des acteurs de l’intelligence artificielle, dont la finalité était d’harmoniser les règles de responsabilité civile pour les dommages causés par l’IA, afin de protéger les victimes et d’unifier le cadre juridique au sein de l’UE. Cet abandon est intervenu suite à une opposition de certains États membres, notamment la France, mais aussi des critiques formulées par le lobbying de grandes entreprises technologiques qui dénonçaient un risque de surrégulation et une insécurité juridique susceptible de freiner l’innovation. En l’absence d’un tel cadre spécifique, ce sont donc les règles de droit positif de responsabilité civile qui demeurent applicables aux dommages causés par les systèmes d’intelligence artificielle.

Les enjeux de la régulation

En combinant protection des données, encadrement des usages et obligations pesant sur les acteurs les plus puissants, l’Union européenne a posé les bases d’un véritable droit commun de l’IA unique au monde.

Cependant, cette réponse n’est satisfaisante qu’à une condition : que son application ne transforme pas la régulation en barrière à l’entrée pour les acteurs européens tels que Mistral AI, NEURA Robotics ou Dust. En effet, le risque est de renforcer la domination des géants américains et chinois plutôt que de la combattre. D’autant que cette domination ne se limite pas au plan économique : elle s’exerce également sur le plan politique. Un rapport de Corporate Europe Observatory et LobbyControl, deux ONG spécialisées dans la surveillance du lobbying, montre ainsi que les Big Tech auraient une influence significative sur la rédaction des Codes de bonnes pratiques prévus par le RIA notamment en parvenant à affaiblir certaines obligations.

La véritable réussite de la régulation européenne ne se mesurera donc pas seulement à la protection des citoyens, mais à sa capacité à faire émerger une intelligence artificielle européenne, à la fois éthique, compétitive et souveraine.

The Conversation

Chloé Dornbierer ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Quel avenir pour les animaux sur les plateaux de cinéma ?

Dans *l’Odyssée de Pi*, Ang Lee a eu recours à un vrai tigre du Bengale, mais aussi aux images de synthèse. Allociné

Dès ses débuts, le cinéma a utilisé les animaux comme des acteurs à part entière. Mais leur présence sur les plateaux se fait moindre avec l’essor des images de synthèse, tandis que les associations de défense des animaux œuvrent pour en finir avec des pratiques parfois maltraitantes.


L’histoire des acteurs non humains est longue et riche en anecdotes, de Luke, le chien de la star du cinéma muet Roscoe (alias Fatty) Arbuckle, aux colleys qui ont incarné Lassie au cinéma et à la télévision. L’ours Bart a accumulé plus de 20 apparitions au cinéma et à la télévision dans les années 1980 et 1990, tandis que d’innombrables chevaux ont contribué aux séries historiques qui inondent aujourd’hui les plateformes de streaming.

Mais les affaires ne vont plus aussi bien qu’avant pour les dresseurs qui se spécialisent dans la location d’animaux de toutes sortes aux productions cinématographiques et télévisuelles.


À lire aussi : Décoloniser notre rapport aux animaux pour inventer un nouveau rapport au monde


Selon The Hollywood Reporter, la tendance est présente depuis au moins vingt-cinq ans, et elle est due à un mélange d’activisme en faveur des droits des animaux et de progrès technologiques, ce que j’ai observé moi-même dans mes recherches sur les animaux à l’écran.

Moins de rôles à se partager

L’adoption par Hollywood des images de synthèse a joué un rôle immense dans la « mise au chômage » de ces animaux « acteurs ». Depuis que Jurassic Park (1993) a osé mêler des dinosaures en computer-generated imagery (CGI) à des acteurs humains, de plus en plus d’animaux numériques sont apparus aux côtés des humains.

Mais d’autres facteurs ont accéléré cette tendance. La pandémie de Covid-19, les grèves des acteurs et scénaristes hollywoodiens de 2023 et une récente baisse du nombre de nouvelles séries télévisées ont entraîné une diminution du nombre de productions et de rôles disponibles, qu’ils soient destinés à des humains ou à des animaux.

Mais, même avant ces événements récents, des voix s’élevaient pour demander à Hollywood de réduire radicalement sa dépendance vis-à-vis des animaux de cinéma.

En 2012, The Hollywood Reporter – le même magazine spécialisé qui a récemment déploré une baisse des locations d’animaux – a publié un reportage répertoriant des incidents au cours desquels des animaux sont morts, ont été blessés ou ont été exposés à de graves dangers sur les plateaux. Ces productions ont néanmoins continué à arborer le célèbre crédit « No Animals Were Harmed » (« Aucun animal n’a été maltraité durant ce tournage ») décerné par l’American Humane Association, quand bien même les animaux avaient été maltraités. L’American Humane Association a affirmé que ces incidents étaient tragiques, mais sans conclure qu’ils résultaient d’une négligence.

En 2016, l’association Pour une éthique dans le traitement des animaux (PETA) a publié les résultats d’enquêtes menées sous couverture documentant des conditions de vie inférieures aux normes et des problèmes médicaux non traités chez Birds & Animals Unlimited, qui gère des centres de dressage d’animaux pour le cinéma et la télévision. En 2024, l’organisation a détaillé les cas de négligence envers les animaux confiés aux soins d’Atlanta Film Animals. Les deux sociétés ont nié ces allégations.

Il existe bien sûr de nombreuses façons de réduire au minimum, voire d’éviter complètement, l’utilisation d’animaux réels au cinéma et à la télévision.

La Planète des singes : Les Origines et ses suites ont utilisé la capture de mouvement, c’est-à-dire des humains reproduisant les mouvements de personnages qui ont ensuite été transformés par images de synthèse en chimpanzés, gorilles, bonobos et orangs-outans.

Pour la production d’Ang Lee de 2012, l’Odyssée de Pi, les artistes en effets visuels ont créé des milliers d’animaux virtuels (cependant, un tigre du Bengale en chair et en os a également été sollicité et a failli se noyer, ndlr), tandis que le réalisateur Darren Aronofsky a opté pour des animaux entièrement numériques, complétés par quelques accessoires réels, dans Noé, en 2014.

À contre-courant des tendances high-tech, le film d’horreur Primate (2025) a fait un retour aux sources sans recourir à de vrais animaux, en faisant appel à un artiste vêtu d’un costume et de prothèses pour incarner un chimpanzé enragé et meurtrier.

Le film d’horreur de 2025 Primate n’utilise ni images de synthèse ni animal, mais fait appel à un humain déguisé pour incarner le singe fou.

Les images de synthèse peuvent-elles désensibiliser les spectateurs à la violence envers les animaux ?

Il existe sans aucun doute des dresseurs qui se soucient profondément de leurs protégés et respectent les meilleures pratiques en matière d’élevage. Mais il va de soi que moins il y a d’animaux en captivité, mieux c’est, et les récentes avancées en matière d’IA ont rendu les effets visuels et les images de synthèse encore plus réalistes et plus faciles à modéliser.

Cependant, le fait de remplacer des animaux en chair et en os par des créatures faites de pixels semble avoir ouvert la voie à des abus sans limites. Prenons l’exemple de la violence brutale dans les remakes de la Planète des singes, qui incluent des combats au corps à corps, le marquage au fer rouge et une scène de crucifixion.

Autrefois, le fait que les animaux présents sur le plateau soient réels freinait parfois les pulsions les plus sauvages des cinéastes ; la violence était suggérée ou se déroulait hors champ dans des films familiaux comme Jody et le faon (1946) et Fidèle Vagabond (1957).

Parallèlement, des astuces de caméra et des accessoires ont été utilisés pour créer des scènes de cruauté envers les animaux dans de nombreux films, d’American Psycho (2000) à John Wick (2014).

Bien que les effets des médias violents sur les spectateurs soient notoirement difficiles à étudier, certaines données suggèrent que certains publics peuvent devenir insensibles aux conséquences réelles de contenus malsains et violents. On comprend aisément comment cette désensibilisation pourrait s’étendre au visionnage de scènes de cruauté envers les animaux à l’écran.

Les spectateurs peuvent encore flairer le virtuel

Une approche hybride de la représentation des animaux à l’écran semble s’être imposée, utilisant ce qu’un chercheur a appelé – en référence aux chiens à l’écran – des « performances canines composites ».

L’équipe à l’origine de la version 2025 de Superman, par exemple, a cherché à créer un chien réaliste, jusque dans les moindres poils ébouriffés. Mais il fallait qu’il défie la gravité et d’autres lois de la physique. Ils ont donc intégré juste assez d’animaux réels en préproduction pour animer une créature principalement en images de synthèse, le chien du réalisateur James Gunn servant de « modèle », ou de « référence » au super-chien Krypto.

Cette technique rappelle les méthodes des animateurs de Disney qui, face au défi de créer les personnages de Bambi (1942), se sont retrouvés dans une impasse. Ils ont donc étudié l’anatomie animale, photographié des cerfs dans la nature et dessiné des animaux amenés au studio afin de mieux capturer leurs mouvements sur le papier.

Mais lorsqu’il s’agit de films en prises de vues réelles ancrés dans la vie quotidienne, les animaux réels ont encore leur place sur le plateau. D’une part, il est généralement moins coûteux de faire appel à de vrais animaux. De plus, la plupart des animaux virtuels à l’écran ne sont tout simplement pas assez réalistes pour permettre la suspension totale de l’incrédulité qui fait la magie du cinéma.

C’est pourquoi, dans l’adaptation de 2025 des Mémoires d’Helen MacDonald, H Is for Hawk, les cinéastes auraient utilisé cinq vautours pour incarner Mabel, l’oiseau adopté par Helen (Claire Foy). C’est pourquoi le film Marty Supreme, nominé aux Oscars, mettait en scène toute une ménagerie d’animaux vivants, notamment un cheval, un chameau, un tatou, un chien, un lapin et même un lion de mer jouant au ping-pong. Oui, l’otarie de la scène était réelle, mais la balle ne l’était pas.

L’avenir des dresseurs et de leurs protégés semble dépendre de la qualité des effets visuels. Pour certains défenseurs des animaux – sans parler des animaux eux-mêmes, qui n’ont pas leur mot à dire sur leur travail –, ce jour n’arrivera jamais assez tôt.

Les cinéphiles et les défenseurs des animaux, quant à eux, pourraient espérer un juste milieu : un avenir dans lequel seuls les animaux traités de manière éthique continueraient à apparaître à l’écran.

The Conversation

Cynthia Chris ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Recourir à une IA quand on n’est pas médecin n’aide pas à poser un meilleur diagnostic

De plus en plus de gens consultent les agents conversationnels dopés à l’intelligence artificielle pour répondre aux questions du quotidien. Ces nouveaux outils sont également sollicités pour fournir des informations en lien avec la santé. Pourtant, ils sont encore très loin de pouvoir remplacer les médecins, comme le révèle une nouvelle étude.


Désormais, pour obtenir des conseils sur des sujets aussi variés que la cuisine ou la façon de remplir leur déclaration d’impôts, des millions de personnes se tournent vers des agents conversationnels (chatbots, en anglais) basés sur l’intelligence artificielle (IA). Un nombre croissant d’individus leur pose également des questions concernant leur santé. Or, comme le rappelait récemment le médecin-chef du Royaume-Uni, lorsqu’il s’agit de prendre des décisions médicales, une telle démarche peut s’avérer risquée.

Dans une étude récente, mes collègues et moi-même avons évalué dans quelle mesure les chatbots reposant sur des grands modèles de langage (LLM) sont réellement capables d’aider le grand public à faire face à certains problèmes de santé courants. Nos résultats, frappants, démontrent que les chatbots que nous avons testés ne sont pas encore en mesure d’endosser le rôle de médecin.

Utiliser un chatbot ne permet pas de prendre de meilleures décisions en matière de santé

Avant tout, soulignons qu’une objection fréquente face à des recherches telles que celles que nous avons menées est d’affirmer que l’IA évolue plus vite que le cycle de publication académique : au moment où un article paraît, les modèles étudiés ont souvent déjà été mis à jour, rendant ses conclusions obsolètes. Pourtant, des études menées dans le contexte du triage médical (processus visant à déterminer à la phase initiale de la prise en charge d’un patient, la filière adaptée à son état en matière de délai et de type de soins, ndlr) et portant sur des versions plus récentes de ces systèmes suggèrent que les mêmes problèmes persistent.

Nos travaux ont consisté à soumettre à des participants de brèves descriptions de situations médicales courantes. Les volontaires ont été répartis de manière aléatoire en deux groupes. Les membres du premier groupe devaient interagir avec l’un des trois chatbots que nous avions sélectionnés (des chatbots courants, facilement accessibles pour le grand public), tandis que ceux de l’autre groupe pouvaient recourir aux sources qu’ils avaient l’habitude de consulter ordinairement, chez eux. À l’issue de l’interaction, nous leur posions deux questions : quelle affection était la plus compatible avec les symptômes décrits ? Et, en conséquence, vers quelle structure de soins valait-il mieux se tourner ?

Les utilisateurs de chatbots se sont révélés moins aptes à identifier la bonne affection que ceux qui n’en avaient pas utilisé. Ils ne se montraient pas non plus meilleurs que le groupe témoin pour déterminer la bonne modalité de recours aux soins. En d’autres termes, interagir avec un chatbot n’a pas permis aux participants de prendre de meilleures décisions en matière de santé.

Des connaissances solides, mais des résultats décevants

Ces résultats ne signifient pas que les connaissances médicales des modèles de chatbots testés sont lacunaires : les LLM sont, en effet, capables de passer facilement des examens de certification médicale. D’ailleurs, une fois que nous avons mis de côté l’élément humain, en soumettant directement les mêmes scénarios aux chatbots, leurs performances se sont sensiblement améliorées.

Sans intermédiaire humain, les modèles ont identifié les affections pertinentes dans la grande majorité des cas et suggéré le plus souvent des modalités de recours aux soins appropriées.

Pourquoi, alors, les résultats se dégradent-ils dès lors que des utilisateurs réels entrent en jeu ? L’analyse des échanges a mis en lumière plusieurs écueils. Il arrivait fréquemment que les chatbots mentionnent la bonne hypothèse diagnostique au fil de la conversation, sans que les participants ne la retiennent ou ne la restituent dans leur réponse finale.

Dans d’autres cas, les utilisateurs transmettaient des informations parcellaires, ou bien le chatbot interprétait mal des détails essentiels. L’échec ne relevait donc pas d’un simple manque de connaissances médicales. Il tenait à un problème de communication entre l’être humain et la machine.

Ne pas confondre la théorie et la pratique

Cette étude démontre qu’avant de déployer de nouvelles technologies dans des environnements où les enjeux sont importants, les décideurs politiques doivent impérativement avoir des données collectées « en condition réelles » pour estimer les véritables performances des outils concernés. C’est évidemment le cas dans le secteur de la santé.

Nos résultats mettent en évidence que bon nombre des évaluations actuellement menées pour déterminer l’intérêt de l’IA en médecine présentent d’importantes lacunes. En effet, les modèles de langage obtiennent souvent d’excellents résultats lorsqu’il s’agit de répondre à des questions d’examen structurées, ou durant des interactions simulées entre différents modèles.

Mais l’usage réel de ces outils est bien plus complexe que cela. Dans la réalité, les patients décrivent leurs symptômes de façon vague ou incomplète. Ils peuvent aussi mal comprendre les explications qui leur sont données, ou poser leurs questions selon un ordre imprévisible. Un système dont les résultats lors des tests d’évaluations s’avèrent impressionnants peut se comporter très différemment une fois confronté à de véritables utilisateurs.

Cette étude souligne également un point fondamental sur la nature même de la pratique clinique. En tant que médecin généraliste, mon travail ne se limite pas à mobiliser des faits mémorisés antérieurement. La médecine est souvent décrite comme un art autant qu’une science. Une consultation n’a pas pour seul objet d’établir le bon diagnostic : elle consiste à interpréter le récit du patient, à sonder l’incertitude et à prendre des décisions qui sont le résultat d’une négociation.

Cette complexité du colloque singulier entre le médecin et son patient est depuis longtemps reconnu par les enseignants en médecine. Pendant des décennies, les futurs médecins ont été formés selon le modèle de Calgary-Cambridge. Celui-ci implique d’instaurer une relation de confiance avec le patient, de recueillir les informations en le questionnant et en l’écoutant avec la plus grande attention, de comprendre ses préoccupations et ses attentes, de lui expliquer clairement les conclusions et de s’accorder avec lui sur un plan de prise en charge.

Ces processus reposent sur l’établissement d’une connexion humaine, rendue possible grâce à une communication sur mesure, faite d’exploration précautionneuse, afin d’aboutir à l’établissement d’un jugement façonné par le contexte et la confiance. Toutes ces qualités ne peuvent pas être facilement appréhendées par des techniques de reconnaissance de formes (techniques à la base des modèles d’IA, qui permettent à l’ordinateur de détecter, à partir de données brutes ou prétraitées, la présence de formes ou de régularités, ndlr)

Les chatbots IA, des assistants plus que des médecins

Nos travaux ne démontrent pas que l’IA n’a pas sa place dans le secteur de la santé – loin de là. La leçon à retenir est qu’il est crucial de comprendre ce que ces systèmes savent faire à l’heure actuelle, et où se situent leurs limites.

Les chatbots actuels doivent être davantage considérés comme des assistants que comme des médecins. Ils excellent dans l’organisation de l’information, la synthèse de textes et la structuration de documents complexes. Des tâches qui sont précisément celles pour lesquelles les modèles de langage s’avèrent déjà utiles au sein des systèmes de santé, qu’il s’agisse de rédiger des comptes rendus cliniques, de synthétiser des dossiers médicaux ou de générer des lettres d’adressage, par exemple.

Les promesses de l’IA en médecine demeurent réelles, mais à court terme, son rôle sera vraisemblablement plus un rôle de soutien qu’une véritable révolution. On ne peut pas attendre des chatbots qu’ils soient la porte d’entrée dans le système de soins. Ils ne sont pas encore en mesure de poser des diagnostics ni d’orienter les patients vers les prises en charge pertinentes.

Certes, l’IA est déjà capable de réussir des examens de médecine. Mais de même que réussir un examen du Code de la route ne fait pas de vous un conducteur compétent, exercer la médecine ne se limite pas à répondre correctement à des questions.

Retrouver son chemin au cœur de la complexité qui se dissimule derrière chaque rencontre clinique requiert de savoir faire preuve d’empathie et de discernement. Cela reste encore l’apanage des humains. Pour l’heure, du moins.

The Conversation

Rebecca Payne travaille sur le projet REMEDY, financé par Health and Care Research Wales, et bénéficie également d'une bourse Clarendon-Reuben de l'université d'Oxford. Elle est membre du Royal College of General Practitioners et membre senior de la Faculty of Medical Leadership and Management.

Sam Altman ? Elon Musk ? Les marchés financiers ? Qui doit gouverner ChatGPT et l'IA

Les bureaux d’OpenAI à San Francisco (Californie) lors de la création de la société en 2015. HaeB/Wikimedia, CC BY-SA

L’entreprise OpenAI, créatrice de ChatGPT, pourrait bientôt entrer en Bourse. Derrière cette opération financière se joue bien plus qu’une levée de fonds : le basculement d’un projet conçu pour l’intérêt général vers une logique de marché. À l’heure où l’intelligence artificielle devient une infrastructure critique, une question s’impose : peut-on en confier son développement aux seuls marchés financiers ?


OpenAI est née en 2015 dans un contexte d’inquiétude croissante autour de l’intelligence artificielle (IA). Fondée notamment par Sam Altman et Elon Musk, elle a adopté une structure à but non lucratif. Son objectif explicite était de développer une IA « bénéfique envers l’humanité » et d’éviter qu’elle ne soit capturée par quelques acteurs dominants. Cette ambition la distinguait des grandes entreprises technologiques, comme Google, Microsoft, Meta ou Amazon, construites sur des modèles propriétaires et des effets de rente.

Par contraste, OpenAI entendait défendre l’intérêt général en mettant l’accent sur la recherche ouverte et la diffusion des connaissances. Or, cette orientation, symbolisée par son nom, OpenAI (« IA ouverte »), s’est rapidement heurtée à une contrainte structurelle, le coût astronomique de l’intelligence artificielle générative.

Des coûts massifs

Contrairement aux logiciels traditionnels, dont le coût marginal tend vers zéro (la millionième copie de Windows ne coûte rien à Microsoft, par exemple), l’IA générative requiert des infrastructures massives. Chaque interaction mobilise des ressources de calcul, de l’énergie et des équipements spécialisés. Une requête standard sur ChatGPT, comprenant une question et une réponse, coûte ainsi de l’ordre de 0,1 à 1 centime de dollar. De même, la génération d’une image en haute définition peut coûter entre 10 et 20 centimes. Pris isolément, ces montants semblent négligeables, mais, à l’échelle de plusieurs milliards de requêtes quotidiennes en 2026, ils deviennent considérables.

Cela s’explique par l’infrastructure sous-jacente, en particulier les processeurs graphiques (GPU), fournis par des acteurs comme Nvidia. Ces puces peuvent coûter plusieurs dizaines de milliers de dollars à l’achat et plusieurs dollars de l’heure en accès cloud. OpenAI, comme ses concurrents, dépend de dizaines de milliers de ces GPU fonctionnant en continu dans de gigantesques centres de données. Selon certaines estimations, les investissements nécessaires se chiffrent en centaines de milliards d’ici à la fin de cette décennie.


À lire aussi : Pourquoi la hausse du prix des mémoires vives informatiques est une menace pour l’économie européenne


Dès la fin des années 2010, il était devenu évident qu’un modèle purement non lucratif ne pouvait répondre à une telle intensité capitalistique. C’est pourquoi OpenAI a adopté, en 2019, un statut hybride lui permettant de lever des fonds tout en maintenant un contrôle par une fondation. Il s’agissait d’une première incursion dans l’économie de marché, mais tempérée par l’ambition de résister aux exigences des investisseurs.

Accélération brutale avec ChatGPT

Cependant, fin 2022, l’agent conversationnel ChatGPT a transformé radicalement la donne en attirant 100 millions d’utilisateurs en seulement deux mois, avant de dépasser les 900 millions d’utilisateurs hebdomadaires, début 2026. Le chiffre d’affaires d’OpenAI est passé ainsi d’environ 200 millions de dollars (173,15 millions d’euros) en 2022 à plus de 10 milliards (8,65 milliards d’euros) en 2025, soit une multiplication par soixante en trois ans !

Cette croissance exponentielle s’est accompagnée de la mise en place d’un modèle économique incluant plusieurs sources de revenus. Pour les particuliers, OpenAI propose des abonnements payants (allant de 20 à 200 dollars, soit de 17 euros environ à 173 euros, par mois). L’essentiel du chiffre d’affaires provient cependant des entreprises, via des abonnements proposés entre 25 et 60 dollars (de 21,6 à 52 euros) par utilisateur et par mois. Une entreprise de 10 000 salariés représente ainsi un revenu annuel de plusieurs millions de dollars.

L’argent des entreprises

De plus, OpenAI facture l’usage de ses modèles à des entreprises qui les intègrent directement dans leurs propres solutions. Chaque utilisation est alors facturée, souvent à très grande échelle. Une application traitant un million de requêtes par jour peut ainsi générer plusieurs dizaines de milliers de dollars de facturation mensuelle.

Enfin, une part croissante des revenus provient d’accords stratégiques, notamment avec Microsoft, qui intègre les technologies d’OpenAI dans ses produits sous la dénomination Copilot.

C’est l’ensemble de ces flux (abonnements, licences, usage par des entreprises tierces et partenariats) qui a permis à OpenAI d’atteindre environ un milliard de dollars (plus ou moins 865,85 millions d’euros) de revenus mensuels en 2025. Pourtant, cette montée en puissance commerciale masque une fragilité économique intrinsèque.

Une gigantesque machine à brûler du cash

Or, malgré des revenus en forte progression, OpenAI reste structurellement déficitaire. Sur le premier semestre 2025, l’entreprise aurait réalisé un chiffre d’affaires d’environ 4,3 milliards de dollars, tout en enregistrant des pertes comprises entre 7 et 13 milliards, soit plus de 2 milliards de pertes chaque mois. Au total, ses pertes cumulées pourraient dépasser les 140 milliards de dollars (121,19 milliards d’euros) entre 2024 et 2029.

Cette dérive s’explique par la nature même du modèle économique d’OpenAI, où chaque interaction génère un coût, avec des investissements nécessaires gargantuesques. Outre l’infrastructure, la recherche et développement (R&D) constitue un poste majeur. Afin de rester dans la course technologique face à un environnement de plus en plus concurrentiel, OpenAI aurait ainsi investi près de 16 milliards de dollars (plus de 13,8 milliards d’euros) en recherche et développement rien qu’en 2025.

À cela s’ajoute le coût des ressources humaines, parfois hors norme. Si les salaires de base des experts en intelligence artificielle les plus demandés se situent déjà entre 250 000 et 700 000 dollars (entre 216 000 et 605 000 euros) par an, leur rémunération – incluant actions et bonus – dépasse fréquemment le million de dollars. Dans certains cas, la rémunération annuelle excède même les 10 millions de dollars (8,65 millions d’euros). Là encore, la surenchère des concurrents, comme Meta, oblige OpenAI à s’aligner, par crainte de voir ses compétences clés disparaître.

Un dépôt de bilan proche ?

Au total, l’activité d’OpenAI ne suffit pas à couvrir ses coûts, au point que certains analystes évoquent que, à ce rythme, elle pourrait être contrainte de déposer le bilan dès 2027. Un recours aux financements extérieurs est donc indispensable pour couvrir ces pertes.

Afin de soutenir sa croissance, OpenAI a déjà levé environ 58 milliards de dollars (plus de 50 milliards d’euros) depuis sa création, dont plus de 13 milliards de dollars auprès de Microsoft. En 2025, un tour de table exceptionnel aurait permis de lever jusqu’à 40 milliards de dollars supplémentaires, portant ainsi sa valorisation à plusieurs centaines de milliards de dollars. Fin mars 2026, une nouvelle levée de fonds de 122 milliards de dollars (plus de 105,6 milliards d’euros), notamment auprès d'Amazon (50 milliards de dollars), Nvidia et SoftBank (30 milliards de dollars chacun), a permis d'atteindre une valorisation à 852 milliards de dollars (soit 737,6 milliards d’euros). Pourtant, ces montants restent insuffisants au regard des besoins.

Dépendance industrielle

La dépendance à l’égard des partenaires industriels apparaît comme particulièrement problématique. Microsoft fournit à OpenAI son infrastructure cloud via Azure, tandis que Nvidia joue un rôle clé en amont en fournissant les GPU. Tout comme à l’époque de la ruée vers l’or, ce sont les vendeurs de pelles qui se sont enrichis aux dépens des prospecteurs, dans la filière de l’intelligence artificielle, ce sont les fournisseurs d’infrastructure qui font fortune, pas les concepteurs de modèles.

En pratique, chaque requête d’intelligence artificielle génère des revenus pour les fournisseurs d’infrastructure, ce qui revient à une forme de « taxe invisible » captée en amont. En 2025, Nvidia a ainsi dégagé près de 73 milliards de dollars de bénéfices nets pour un chiffre d’affaires d’environ 130 milliards (soit 112,5 milliards d’euros), et sa valorisation en Bourse est 1,5 fois supérieure à celle de l’ensemble du CAC 40 !

Errements dans le gouvernement

Les tensions économiques d’OpenAI se sont répercutées sur son gouvernement d’entreprise. L’hybridation entre une mission d’intérêt général et des mécanismes de financement privés s’est traduite par une structure complexe. Une fondation à but non lucratif contrôle ainsi une entreprise commerciale de type public benefit corporation (une version américaine et moins contraignante de la société à mission française), financée par des investisseurs et chargée de lever des capitaux et de développer les activités, tout en restant théoriquement subordonnée à la mission d’intérêt général de la fondation. Cette construction, pensée pour éviter une logique purement financière, a rapidement attisé des tensions entre différentes parties prenantes.

Le départ d’Elon Musk en 2018 a constitué un premier signal de désaccord stratégique. En 2020, plusieurs chercheurs ont quitté OpenAI pour fonder Anthropic, en mettant en avant des divergences sur la sécurité et la gouvernance. Cependant, c’est surtout la crise de novembre 2023 qui a pleinement révélé les fragilités du système, lorsque le conseil d’administration a annoncé de manière soudaine le renvoi de Sam Altman, invoquant un manque de transparence dans ses communications.

En quelques heures, la situation s’est transformée en crise ouverte. La quasi-totalité des salariés a menacé de quitter l’entreprise si Altman n’était pas réintégré. Microsoft, principal partenaire et investisseur, a publiquement apporté son soutien à Altman et a même évoqué la possibilité de le recruter avec ses équipes. Face à cette pression, le conseil d’administration a été contraint de revenir sur sa décision en quelques jours. Sam Altman a été réintégré, et la composition du conseil a été profondément remaniée.

Cet épisode a mis en lumière les tensions internes, et notamment la difficulté à faire coexister des logiques divergentes au sein d’une même organisation, entre posture éthique, impératifs industriels et exigences des investisseurs.

Une concurrence qui s’intensifie

À ces contraintes internes s’ajoute une intensité concurrentielle particulièrement vive. Google, l’inventeur de l’IA générative, réalise des progrès rapides avec Gemini. Anthropic, avec Claude, s’est imposé sur certains segments, notamment la programmation, tout en mettant l’accent sur la sécurité. Le Chinois DeepSeek a affirmé utiliser des processeurs moins coûteux. Le Français Mistral AI défend une approche frugale et la souveraineté numérique de l’Europe. Signe de ce retournement, Apple, initialement partenaire d’OpenAI pour inclure ChatGPT pour certaines fonctionnalités liées à Siri, a choisi de le remplacer par Gemini.

Dans ce contexte de recomposition de l’écosystème, la position d’OpenAI, bien que toujours centrale, est contestée. L’intensification de la concurrence renforce la nécessité de disposer de ressources financières toujours plus conséquentes.

La Bourse, sauvetage ou mirage ?

L’introduction en Bourse d’OpenAI est présentée comme une réponse à ces contraintes : financer des investissements massifs et consolider une position concurrentielle fragilisée. La Bourse pourrait permettre de lever entre 50 et 100 milliards de dollars, en cédant entre 10 et 20 % du capital. Une telle opération constituerait l’une des plus importantes de l’histoire des marchés financiers.

Les Échos, 2026.

Cependant, cette transformation implique des arbitrages délicats. Une entreprise cotée est soumise à des exigences de rentabilité et de transparence qui peuvent entrer en tension avec la nature expérimentale de l’intelligence artificielle. À cela s’ajoute la dépendance persistante à Microsoft et à Nvidia, qui limite l’autonomie stratégique de l’entreprise.

Surtout, rien n’indique que l’introduction en Bourse suffirait à résoudre les problèmes structurels d’OpenAI. Au mieux, sans évolution significative du modèle économique, elle permettrait de reculer sa faillite de quelques années. Le modèle économique de l’intelligence artificielle générative reste aujourd’hui fondamentalement non stabilisé.

Une question qui dépasse OpenAI

Au-delà du cas d’OpenAI, on peut légitimement s’interroger sur le fonctionnement actuel de l’économie dominée par les géants de la technologie. L’intelligence artificielle s’impose comme une infrastructure essentielle, dont les effets dépassent largement le cadre économique. Pour certains analystes, le contrôle de l’IA revêt désormais la même importance géostratégique que la possession de l’arme nucléaire.

Dès lors, une question civilisationnelle se pose : peut-on confier le développement et l’orientation d’une telle technologie aux seuls marchés financiers ? Imagine-t-on qu’Elon Musk ou Mark Zuckerberg puisse posséder personnellement l’équivalent d’une ou plusieurs bombes atomiques ? L’introduction en Bourse d’OpenAI ne fournira pas à elle seule la réponse. Cependant, elle en constituera l’un des premiers tests à grande échelle.

The Conversation

Frédéric Fréry ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

L’immortalité artificielle à nos portes : panacée ou danger ?

Grâce aux récents développements en intelligence artificielle (IA), il est désormais possible de préserver des représentations de personnes décédées et d’interagir avec elles. La « réapparition » des personnes se fait parfois de manière volontaire et programmée, mais parfois sans le consentement des familles ni des proches endeuillés. L’humain a toujours eu le fantasme de vivre éternellement. Mais que penser de cette nouvelle façon de prolonger l’existence « artificiellement » ? Est-elle souhaitable ? Quels sont les principaux enjeux éthiques que soulève l’apparition des « griefbots » ou « deadbots » ?


Professeure associée à l’École de santé publique (ESPUM) de l’Université de Montréal, je suis éthicienne et chercheuse spécialisée en gouvernance, éthique, droit, IA et conduite responsable en recherche. Je dirige notamment un projet de recherche, intitulé Immortalité artificielle : perspectives éthiques, juridiques et artistiques. Dans le cadre de ce projet, j’ai publié avec deux étudiantes un article portant sur les considérations éthiques liées à l’immortalité artificielle.

Des frontières fragiles

Les avatars numériques posthumes sont créés à partir des traces numériques laissées de leur vivant par des personnes décédées. Les écrits sur les réseaux sociaux, les photos, les enregistrements audios et visuels sont autant de traces qui nourrissent ces avatars. Construits grâce à la fusion de l’IA, de l’apprentissage automatique et de l’analyse avancée des données, ces avatars peuvent recréer la ressemblance tant physique que psychologique, la personnalité et même les souvenirs des personnes décédées.

Le résultat est tel qu’il peut laisser un doute chez l’utilisatrice ou l’utilisateur : s’agit-il de la « vraie » personne ? Il faut dire que cette technologie prend racine dans un monde où la vie virtuelle est bien établie. Ainsi, l’échange avec l’avatar numérique, posthume ou non, devient presque banal. Or, l’avènement des avatars posthumes soulève des enjeux éthiques de taille.


À lire aussi : Près de 80 % des travailleurs canadiens utilisent l’IA sans cadre institutionnel


L’autonomie, la protection des données et la vie privée

Au nombre de ces enjeux, soulignons le respect de l’autonomie et la protection des données, l’altération des rapports interpersonnels et sociaux, ainsi que le bouleversement de la finitude humaine, engendrant une nouvelle conscience de la vulnérabilité et de moyens de la transcender. La création d’avatars numériques posthumes a un impact sur le respect de l’autonomie de trois catégories de personnes :

  • Celles qui laissent des traces numériques laissées dans le domaine public, notamment sur les réseaux sociaux : il s’agit de personnes qui anticipent leur décès ou qui sont décédées, et dont les traces sont volontairement ou involontairement mises à la disposition de tierces parties (proches, entreprises, etc.).

  • Celles qui reçoivent les traces numériques d’autrui lors du décès : il s’agit de membres de la famille, de proches ou d’entreprises. L’une des questions qui se posent quant à leur autonomie est celle du contrôle sur l’avatar de l’être cher. Par exemple, les personnes qui reçoivent les traces numériques d’autrui peuvent-elles refuser de créer un avatar numérique posthume ou un site virtuel de commémoration ?

  • Celles qui interagissent avec les services d’« avatarisation » : il s’agit des personnes qui utilisent ou consomment les services et produits mis de l’avant dans l’industrie de l’au-delà virtuel. Elles interagissent avec des avatars numériques posthumes pour des motifs variés, allant de la curiosité à la gestion d’un deuil particulièrement souffrant. L’on se demande si ces dernières pourraient développer des dépendances malsaines envers ces services et produits, alors même que l’industrie est instable et qu’elle pose le risque de modifier ou interrompre brusquement des offres de services.

Toutes ces personnes sont à risque de perdre le contrôle de l’identité perpétuée de la personne décédée, compte tenu de la multitude des représentations virtualisées.

Deuil public et pathologique

Par ailleurs, lorsque l’avatar est accessible à un grand nombre de personnes, le deuil devient public, c’est-à-dire qu’il est possible de l’éprouver à la fois de façon intime et collective. Ce nouveau phénomène altère le rapport à la mort et au deuil, redéfinissant la place des personnes décédées dans nos vies.

L’histoire de la jeune Jang Nayeon, décédée en 2016, a fait l’objet du documentaire Meeting You et exprime le malaise qu’engendre le deuil public. Dévastée par le décès prématuré de sa fille, sa mère a approuvé la création d’un avatar numérique posthume, afin de pouvoir la revoir et interagir avec elle en réalité virtuelle. Les retrouvailles ont été diffusées sur plusieurs plates-formes web en temps réel et ont généré des inconforts chez l’auditoire. Il s’agit d’un exemple d’autant plus expressif de l’hypervisibilité d’un deuil.


Déjà des milliers d’abonnés à l’infolettre de La Conversation. Et vous ? Abonnez-vous gratuitement à notre infolettre pour mieux comprendre les grands enjeux contemporains.


Dans un versant positif, les avatars numériques posthumes peuvent être utilisés sous la supervision d’une ou d’un thérapeute, dans le cadre d’un accompagnement clinique. Mais il est à noter, cependant, que seule une minorité des usages se fait actuellement sous la supervision de spécialistes.


À lire aussi : « Je suis sorti et j'ai pleuré » : ce que le personnel des établissements pour personnes âgées dit de son chagrin lorsque des résidents décèdent


Par conséquent, plusieurs personnes utilisent cette technologie à titre individuel et sont plus vulnérables à la dépendance, ou cherchent à fuir la réalité du deuil. Elles sont à risque de tomber dans un deuil dit « pathologique », soit un deuil compliqué ou prolongé, marqué par sa durée et son intensité (incapacité, après plus d’un an, à gérer la souffrance émotionnelle, à réintégrer les activités quotidiennes ou à trouver du sens à la vie).

Surexposition et voyeurisme silencieux

Les espaces virtuels où sont conservées les traces des personnes décédées, par exemple Facebook, sont parfois fréquentés par des personnes passives, des observatrices ou observateurs qui ne cherchent pas forcément à interagir, mais qui participent à un phénomène de voyeurisme silencieux.

Cette passivité, bien que non nécessairement malveillante, s’inscrit dans une dynamique de surveillance et d’observation continues qui peut mener à une surexposition et à du voyeurisme. L’enjeu éthique concerne le fait que l’intimité des unes et des uns peut désormais devenir l’objet de consommation des autres, qu’il s’agisse de curiosité, de fascination, ou encore d’une planification d’un détournement ultérieur des données.

L’exploitation des données peut se traduire par une visibilité perpétuelle des données générées par la personne défunte sur le web, notamment à travers des avatars numériques posthumes qui interagissent avec les familles et les proches. Elles permettent de maintenir l’illusion d’une présence après la mort.

Cette illusion vient modifier notre rapport à la mort puisque l’être cher peut artificiellement rester dans nos vies. Plus fondamentalement, cela pose la question de notre finitude humaine, à savoir qu’au-delà de la vie biologique, il y a désormais la promesse d’une vie artificiellement éternelle. Est-ce souhaitable ?

Pour ne pas conclure

Connaître et comprendre les principaux risques et enjeux éthiques soulevés par l’immortalité artificielle constitue une étape cruciale afin de réfléchir au déploiement de ces avatars. Il demeure incontournable de nourrir les réflexions quant au bien-fondé de l’essor de ces avatars, afin de préserver la dignité humaine, posthume ou non, et éviter ses dérives dans un monde en profonde transformation.


Je tiens à remercier Josianne Barrette-Moran, candidate au doctorat en bioéthique à l’École de santé publique de l’Université de Montréal, pour l’assistance technique apportée lors de la rédaction du présent article.

La Conversation Canada

Je dirige un projet de recherche financé par l’Observatoire international sur les impacts sociétaux de l’IA et du numérique (Obvia), intitulé Immortalité artificielle : perspectives éthiques, juridiques et artistiques (https://www.obvia.ca/recherche/projets/limmortalite-artificielle-perspectives-ethiques-juridiques-et-artistiques)

Ce que les frappes iraniennes sur des centres de données Amazon changent – ou non – à la conduite de la guerre

Un panache de fumée s’élève à Abu&nbsp;Dhabi, le 1<sup>er</sup>&nbsp;mars 2026, à la suite de frappes de drones iraniens sur la ville, notamment contre les centres de données. Ryan Lim/AFP via Getty Images

L’intelligence artificielle est devenue un outil central des opérations militaires, notamment pour l’armée des États-Unis. Les centres de données qui la font fonctionner, principalement basés dans la région du Golfe, constituent donc des infrastructures cruciales. Et comme tout dispositif critique, ils deviennent des cibles potentielles en temps de guerre.


Le 1er mars 2026, peu avant l’aube, des drones iraniens ont visé deux centres de données Amazon situés aux Émirats arabes unis. Un troisième centre, au Bahreïn, a également été touché, bien qu’il ne soit pas établi qu’il avait été visé de façon délibérée. L’Iran a en tout cas indiqué qu’il considérait les centres de données commerciaux comme des cibles.

Il s’agit de la première fois qu’un État cible délibérément des centres de données dans le cadre d’un conflit armé. Par le passé, ces infrastructures avaient fait l’objet d’opérations d’espionnage et de cyberattaques, notamment en 2024, lorsque des hackers ukrainiens ont détruit des données stockées dans des centres militaires russes, mais l’attaque iranienne se distingue par sa nature : ses drones ont cette fois endommagé des infrastructures matérielles.

Les progrès de l’intelligence artificielle accroissent l’importance stratégique des centres de données. L’armée états-unienne, en particulier, a largement investi dans des outils d’IA destinés aux systèmes d’aide à la décision (SAD) dans le cadre de ses opérations en Iran et au Venezuela. C’est pourquoi les forces iraniennes pourraient chercher à neutraliser les infrastructures qui, selon leurs dirigeants, sont employées dans le cadre de ces opérations militaires.


À lire aussi : La guerre à l’heure de l’IA


Il n’est cependant pas établi que ces centres spécifiques aient été utilisés par l’armée états-unienne. Les attaques pourraient avoir eu pour seul objectif de punir les Émirats arabes unis en raison de leurs liens avec les États-Unis.

Doctorant à Georgia Tech spécialisé dans l’impact des technologies sur la sécurité internationale, je ne considère pas que ces attaques transforment fondamentalement la nature de la guerre. Elles contraignent néanmoins les nations à reconnaître que les centres de données constituent désormais des cibles potentielles dans les conflits armés – même lorsqu’ils ne soutiennent pas directement des opérations militaires.

Les centres de données et le « cloud »

L’armée américaine intègre de plus en plus l’intelligence artificielle dans ses systèmes d’aide à la décision. Lors de l’opération « Absolute Resolve », qui a permis à Washington d’enlever le président vénézuélien Nicolas Maduro comme actuellement avec les frappes militaires contre l’Iran, les États-Unis ont recours à l’IA, notamment Claude (d’Anthropic), à des fins d’analyse du renseignement et d’appui opérationnel.

Si l’IA permet d’accélérer la conduite des opérations militaires, les outils qu’elle mobilise ne sont pas embarqués à bord d’avions ou de navires. Lorsqu’un militaire utilise Claude, l’infrastructure informatique qui alimente le modèle et ses analyses est généralement hébergée sur une plateforme cloud sécurisée d’Amazon Web Services (AWS), qui stocke des données gouvernementales confidentielles ainsi que divers outils logiciels.

Les principes fondamentaux des centres de données expliqués.

Les centres de données commerciaux constituent le socle physique du cloud. Par exemple, chaque fois qu’un utilisateur ouvre Netflix pour regarder une série, le contenu est probablement diffusé depuis un centre de ce type, qui appartient d’ailleurs peut-être lui aussi à AWS. Lorsque ces centres tombent en panne, les interruptions affectent une multitude de services de divertissement, d’information, et de fonctions gouvernementales.

L’IA étant un moteur de croissance économique, les centres de données représentent une infrastructure critique. Ils assurent le bon fonctionnement de l’IA ainsi que d’une grande partie d’Internet dont dépendent les gouvernements et le secteur privé. Lorsque l’Iran a attaqué les centres de données des Émirats arabes unis, cela a provoqué des perturbations massives au sein du système bancaire local.

Les centres de données commerciaux font fonctionner la plupart des technologies sur lesquelles repose le monde moderne, y compris les systèmes d’IA. Les perturber revient à paralyser à la fois l’armée et la société d’un pays. Étant donné qu’AWS exploite un grand nombre de ces centres à l’échelle mondiale, il est probable que ses infrastructures continueront d’être prises pour cible dans les conflits à venir.

S’en prendre aux alliés des États-Unis

Des chercheurs de Just Security ont relevé, le 12 mars 2026, que les États-Unis exigent désormais des fournisseurs de services de cloud computing qu’ils stockent les données gouvernementales et militaires sur le territoire américain ou dans des bases du département de la Défense :

« Transférer ces données vers des centres de données Amazon dans la région du Golfe nécessiterait une autorisation spéciale ; nous ignorons si celle-ci a été accordée. »

Le Corps des gardiens de la révolution islamique a néanmoins affirmé que ces frappes visaient des centres de données soutenant les activités militaires et de renseignement de « l’ennemi ». Dix jours après l’attaque initiale, une agence de presse iranienne a déclaré que les centres de données des grandes entreprises technologiques et d’autres infrastructures physiques de la région étaient désormais considérés comme des « infrastructures technologiques ennemies ».

Plutôt que pour des motifs militaires, l’Iran visait peut-être les Émirats dans le but de déstabiliser l’économie mondiale et attirer l’attention internationale. Le Golfe étant l’un des principaux bénéficiaires des investissements technologiques américains, l’attaque pourrait avoir été symbolique en ciblant le cœur de la coopération américano-arabe. Les infrastructures d’IA, notamment les centres de données commerciaux, constituent une part croissante du leadership américain dans la région. Ce conflit pourrait donc compromettre l’avenir des infrastructures IA dans le Golfe.

Cette maquette représente un immense centre de données, qui fait partie du projet Stargate auquel participent des entreprises technologiques américaines, actuellement en construction aux Émirats arabes unis. Giuseppe Cacace/AFP

Une importance croissante, des cibles vulnérables

Et puisque les centres de données sont de plus en plus importants pour la sécurité nationale, l’économie et la société en général, il peut être tentant de considérer ces attaques comme un bouleversement fondamental dans la nature de la guerre. Toutefois, n’oublions pas que l’Iran a lancé des milliers de missiles et de drones contre des cibles aux Émirats. Bien que la grande majorité ait été interceptée, les deux ayant frappé les centres de données ne représentent qu’une petite part des frappes ayant touché des infrastructures civiles, notamment les aéroports et les hôtels.

La vulnérabilité des centres de données commerciaux – de grande taille, relativement fragiles et dépourvus de défenses aériennes propres – laisse penser que ceux situés aux Émirats ont pu être choisis comme cibles pour des raisons d’opportunité ou de facilité. Autrement dit, ils ont été frappés parce qu’ils pouvaient l’être.

Il semble toutefois probable que, à mesure que l’utilisation de l’IA et les services cloud prendront de l’ampleur à l’échelle mondiale, les centres de données commerciaux deviendront des cibles récurrentes dans les conflits futurs.

The Conversation

Dennis Murphy est affilié à Georgia Tech, au Georgia Tech Research Institute, à la RAND Corporation, au Notre Dame International Security Center et à l’Astra Fellowship. Il a auparavant été affilié au Lawrence Livermore National Laboratory, à la Marine Corps University et au programme ERA Fellowship de l’université de Cambridge.

Les étudiants laissent-ils vraiment l’IA écrire à leur place ? Une étude observe ce qui se passe pendant la rédaction

Plusieurs étudiants participant à l’étude ont eu recours à l’IA lorsqu’ils se sont sentis bloqués dans leur processus d’écriture. Rut Miit/Unsplash, CC BY

L’IA transforme-t-elle l’écriture universitaire ? En observant directement le processus de rédaction d’étudiants, une étude pilote suggère que les outils génératifs servent surtout à débloquer les idées et à retravailler les textes, sans remplacer entièrement l’auteur.


Les débats sur l’IA générative dans l’enseignement supérieur se sont appuyés sur des études portant sur des travaux d’étudiants déjà terminés, ou sur des données d’enquête déclaratives. Ces recherches montrent que les outils d’intelligence artificielle peuvent soutenir l’apprentissage, mais elles ont aussi soulevé des inquiétudes, notamment concernant la dépendance excessive des étudiants, la triche et la possible dégradation de l’esprit critique et de l’engagement.

Si ces types d’études offrent des instantanés intéressants des pratiques déclarées, leurs méthodologies peuvent toutefois passer à côté d’un aspect essentiel : la manière dont l’écriture se déroule réellement lorsque les étudiants rédigent avec l’aide de l’IA.

L'étude pilote que j’ai menée auprès d’étudiants de premier cycle à Kennesaw State University adopte une approche différente. En utilisant des protocoles de pensée à voix haute (think aloud protocols) – une méthode dans laquelle les participants verbalisent leurs pensées pendant qu’ils réalisent une tâche – notre recherche observe comment les étudiants interagissent avec les outils d’IA générative pendant le processus même d’écriture. Cette méthode permet de comprendre les processus de décision au moment où ils se produisent.

Nos premiers résultats suggèrent une réalité plus complexe que le récit souvent avancé selon lequel les étudiants se contenteraient de laisser l’IA rédiger leurs devoirs. Au contraire, beaucoup semblent négocier quand et comment l’IA a sa place dans leur travail d’écriture.

Regarder à l’intérieur du processus d’écriture

Dans notre étude, 20 étudiants de premier cycle ont réalisé une session d’écriture de vingt minutes en réponse à la consigne suivante :

Les gens passent beaucoup de temps à essayer d’atteindre la perfection dans leur vie personnelle ou professionnelle. Ils exigent souvent la perfection des autres, créant des attentes difficiles à satisfaire. À l’inverse, certaines personnes pensent que la perfection n’est ni atteignable ni souhaitable.

La tâche consistait à rédiger une thèse ainsi que des paragraphes argumentés fondés sur des éléments de preuve pour défendre leur position sur la valeur de la quête de perfection. Les étudiants savaient qu’ils n’étaient pas censés terminer leur texte, mais plutôt avancer dans leur processus d’écriture en direction d’un texte achevé. On leur a également précisé qu’il n’existait pas de bonne ou de mauvaise manière d’utiliser l’IA, et qu’ils devaient utiliser l’IA générative exactement comme ils le feraient habituellement lorsqu’ils écrivent.

Plutôt que d’observer directement les étudiants, l’étude s’est appuyée sur des captures d’écran réalisées après la session et sur l’analyse des descriptions que les étudiants ont faites de leur propre processus d'écriture. La collecte de ces données – leurs actions sur l’ordinateur et les transcriptions des enregistrements vocaux – a permis aux chercheurs d’analyser le processus sans l’interrompre.

Afin de réduire le risque que les étudiants modifient leur comportement s’ils se sentaient observés, les chercheurs ont lancé un minuteur puis quitté la salle pendant la session d’écriture. L’objectif était ainsi de limiter l’effet Hawthorne, un phénomène par lequel les individus modifient leur comportement parce qu’ils savent qu’ils sont observés.

Ce que nous avons observé

À travers les transcriptions, quelques tendances qualitatives sont apparues de manière récurrente dans la façon dont les étudiants collaboraient avec l’IA pendant l’écriture. D’abord, de nombreux participants se sont tournés vers ces outils au début du processus d’écriture afin de générer des idées ou d’esquisser une thèse.

On voit alors ces étudiants utiliser les propositions produites par l’IA pour stimuler et structurer leurs propres idées. Un étudiant décrit cette stratégie ainsi : « Après [avoir généré quelques idées], j’utilise généralement simplement ce [résultat] comme point de départ. »

Dans ces moments-là, l’IA fonctionnait moins comme une réponse définitive que comme un outil de remue-méninges aidant les étudiants à dépasser l’angoisse de la page blanche.

D'ailleurs, les étudiants poursuivaient souvent la rédaction de manière autonome après avoir généré ces premières idées. De nombreuses transcriptions contiennent des phrases comme « Je pense que ma thèse devrait être… » ou « Laisse-moi écrire cette partie », ce qui suggère que certains étudiants conservaient la maîtrise de leur argumentation.

Corriger le bot

Un autre motif fort qui ressort des transcriptions est que les étudiants acceptent rarement les textes produits par l’IA sans les modifier. Au contraire, ils révisent activement le langage généré. Comme l’a décrit un étudiant, l’IA « réécrit » ses premières consignes, puis l’étudiant réécrit à son tour la réponse de l’IA. Cela lui permet de revendiquer « la paternité et la maîtrise » de la version finale.

Un autre participant a également redirigé la réponse de l’outil lorsqu’elle ne correspondait pas à la consigne : « L’IA ne suit pas la consigne… réessaie. »

Ces moments montrent que les étudiants évaluent de manière critique les réponses de l’IA et la traitent presque comme un partenaire de débat, plutôt que de simplement les copier.

Nous avons également constaté que certains étudiants rejetaient totalement les suggestions de l’IA. Dans plusieurs sessions d’écriture, les participants ont explicitement décidé de ne pas utiliser les réponses générées par l’IA. Un étudiant a commenté ce choix pendant qu’il écrivait : « Je n’utilise pas vraiment l’IA pour mes recherches. »

D’autres transcriptions montrent des étudiants revenant à leur propre rédaction lorsque les réponses de l’IA leur semblaient trop génériques ou déconnectées de leur argumentation. Ces moments indiquent qu'ils ne se contentent pas de collaborer avec l’IA : ils tracent aussi des limites quant à la place qu’elle peut occuper dans leur processus d’écriture.

Enfin, plusieurs transcriptions montrent que les étudiants se tournaient vers l’IA dans des moments d’incertitude ou lorsqu’ils se sentaient bloqués. Comme l’a expliqué un participant : « J’ai beaucoup utilisé l’IA parce que j’avais du mal. » Même dans ces cas-là, toutefois, les étudiants l'utilisaient souvent comme un soutien pendant la rédaction de leur essai, plutôt que de copier-coller directement ses réponses.

Ce que cela dit de l’IA et de l’écriture

Notre analyse suggère que l’IA générative s’intègre dans l’écriture étudiante non pas comme un remplacement complet de l’auteur humain, mais comme une forme de collaboration négociée. Les résultats indiquent qu'elle intervient le plus souvent au moment de la génération d’idées, de la révision et lorsque un sentiment de blocage apparaît, tandis que les étudiants conservent le contrôle sur le choix des arguments, la façon d'écrire et la formulation finale.

Comprendre comment les décisions d’utiliser l’IA se déploient pendant le processus d’écriture – et pas seulement ce qui apparaît dans l’essai final – peut aider les enseignants à concevoir des devoirs et des règles qui maintiennent clairement l’humain aux commandes.

Comme ces premiers résultats proviennent d’un groupe pilote de 20 étudiants de premier cycle, ils doivent être interprétés avec prudence. Pour vérifier si ces tendances se confirment à plus grande échelle, l’équipe de recherche étend actuellement l’étude à 100 participants. Cette phase élargie examinera également la manière dont des étudiants neurodivergents interagissent avec l’IA générative pendant le processus d’écriture, un domaine encore largement inexploré par la recherche.


Des étudiants chercheurs de premier cycle à Kennesaw State ont contribué à l’analyse préliminaire présentée dans cet article : Kylee Johnson, Vara Nath, Ruth Sikhamani et Kaylee Ward.

The Conversation

Jeanne Beatrix Law est membre fondatrice, à titre bénévole, du corps professoral de l’OpenAI Educator’s Council. Elle est également membre bénévole, de la communauté consultative d’enseignants de BoodleBox AI.

Consommation énergétique des data centers : la France à la croisée des chemins

La France a la volonté d’être une terre d’accueil pour les data centers dans les prochaines décennies. L’Agence de la transition écologique, l’Ademe, a réalisé un travail de prospective à l’horizon 2060 pour évaluer plusieurs scénarios de montée en puissance sur le territoire national de ces infrastructures très gourmandes en énergie et les choix de société qu’ils impliquent. Entretien avec Bruno Lafitte, expert data centers à l’Ademe, qui a coordonné cette étude.


The Conversation : Commençons par l’état des lieux : que sait-on aujourd’hui de la présence des data centers en France, des usages qui en sont faits et de leur consommation électrique totale ?

Bruno Lafitte : Aujourd’hui, l’Ademe recense 352 data centers en activité sur le territoire national. Leur consommation électrique totale représente 10 térawattheurs (TWh) par an, ce qui correspond à l’électricité consommée par environ 10 agglomérations de plus de 100 000 habitants pendant un an.

Cela équivaut à 2,2 % de la consommation annuelle électrique totale du pays. En effet, l’usage du numérique a une matérialité que l’on ne soupçonne pas toujours : des infrastructures énergivores en électricité, en eau pour le refroidissement, sans compter la chaîne de production des serveurs en amont qui charrie également son lot d’impacts environnementaux.


À lire aussi : Les métaux de nos objets connectés, face cachée de l’impact environnemental du numérique


Pourquoi la France souhaite-t-elle être une terre d’accueil pour ces infrastructures ?

B. L. : Il y a aujourd’hui une vraie volonté politique de la France de se placer en leader européen en matière d’accueil de data centers. Cela se traduit déjà par des investissements massifs dans le pays, qui sont facilités par une souplesse administrative. Ce choix repose sur deux grands constats.

L’un tient à l’enjeu crucial de souveraineté numérique : la moitié des usages numériques des Français est actuellement traitée par des data centers situés à l’étranger, et tous les scénarios montrent que cette dépendance augmentera à mesure que les usages s’intensifieront. Au regard des enjeux géopolitiques actuels, relocaliser nos données apparaît crucial.

L’autre est lié à l’avantage majeur dont dispose la France en la matière. Du fait de son mix électrique décarboné et de son électricité largement disponible, mais également de ses normes environnementales, les data centers seront en France mieux encadrés. De ce fait, ils auront des impacts climatiques moindres qu’ailleurs, et en particulier qu’aux États-Unis, où se concentrent aujourd’hui la majorité des data centers dont nous dépendons. (À titre d’exemple, l’intensité carbone de l’électricité française s’élevait, en 2024, à environ 30 gCO₂/kWh, tandis qu’aux États-Unis, celle-ci était en moyenne de 391 gCO₂/kWh en 2019, ndlr.)

Car, en 2050, près de 80 % des usages numériques français feront appel à des data centers basés à l’étranger. Ces usages délocalisés totaliseront 97 % des émissions de gaz à effet de serre liées à l'ensemble des usages français des data centers.

Que sait-on des perspectives de développement des data centers à horizon 2050 et de leur consommation énergétique ?

B. L. : Avec l’accélération de l’intelligence artificielle générative et, à moyen terme, de la blockchain, les besoins en data centers sont appelés à exploser. Leur typologie va évoluer vers de très grands centres dits « hyperscale », abritant des supercalculateurs très énergivores.

Pour donner un ordre d’idée, les très gros data centers aujourd’hui présents en France représentent 10 mégawatts (MW) de puissance électrique installée. Demain, ils avoisineront plutôt le gigawatt (GW) pour les plus importants – soit 100 fois plus.

Pour évaluer les perspectives en France, nous avons conçu un modèle prospectif, fondé sur le modèle international le plus fiable à ce jour, que nous avons actualisé, le modèle Masanet, qui tient compte du volume des serveurs et de l’évolution à venir de leur efficacité énergétique selon leur modèle type. Ce modèle ouvert sera mis à disposition du grand public.

Dans le scénario tendanciel, qui poursuivrait la trajectoire actuelle, la consommation d’électricité induite par les usages numériques français pourrait progresser d’un facteur de 3,7 d’ici à 2035 pour les data centers installés en France – et même de 4,4, en tenant compte de la consommation des data centers situés à l’étranger.

Dans cette configuration, les usages numériques français entraîneront, à l’horizon 2050, une consommation de 55 TWh par les data centers français – soit l’émission de 1,8 million de tonnes équivalent CO₂ –, et presque 200 TWh par des data centers situés à l’étranger – ce qui correspond à l’émission de plus de 48 millions de tonnes équivalent CO₂. (À titre de comparaison, la consommation d’électricité totale en France atteignait près de 450 TWh en 2024, ndlr.)


À lire aussi : Un data center près de chez soi, bonne ou mauvaise nouvelle ?


Quels défis et risques cela représente-t-il pour nos infrastructures électriques ?

B. L. : Cette évolution pose de nombreux défis territoriaux, environnementaux et socioéconomiques. Aujourd’hui, la France a accès à de l’électricité décarbonée en grande quantité (94 % de sa production, en 2024, ndlr). De ce fait, elle est relativement épargnée par les tensions engendrées par l’implantation de data centers au regard de certains de ses voisins européens.

Toutefois, elle s’est fixée, dans tous les domaines, des ambitions d’électrification (notamment pour la décarbonation de l’économie, ndlr) qui feront augmenter significativement les besoins et la pression sur le réseau électrique. S’y ajoute désormais le développement de data centers, pour répondre à la fois à l’explosion des usages et à la volonté de relocalisation exprimée par la France.

Nous avons pris en compte, dans notre étude, les progrès à venir en matière d’efficacité énergétique, mais ils ne suffiront pas à compenser l’augmentation du volume de données hébergées.

L’éventualité d’une révolution technologique, par exemple liée à l’informatique quantique, n’est certes pas à exclure, mais elle ne garantit pas des économies d’énergie. On sait, par ailleurs, que les innovations technologiques ont toujours amené l’éclosion de nouveaux services conduisant à l’augmentation des usages plutôt qu’à une baisse des consommations.


À lire aussi : Ordinateur quantique : comment progresse ce chantier titanesque en pratique


Quelles options s’offrent à la France pour répondre à sa volonté de souveraineté numérique en accueillant des data centers, tout en se tenant à son objectif de neutralité carbone à l’horizon 2050 ?

B. L. : Dans ce contexte, il s’agit pour la France de faire des choix de société. L’une des options est celle de la sobriété, avec une priorisation des usages numériques et une prise de distance, plus ou moins forte, avec le tout-numérique. Dans le scénario le plus frugal que nous avons envisagé, la puissance installée pour les data centers sur le territoire peut être limitée à seulement 5,7 TWh en 2050, soit 190 000 tonnes équivalent CO₂.

L’autre chemin consiste à miser sur l’innovation pour réduire les émissions de gaz à effet de serre des autres secteurs d’activité et à optimiser la consommation d’énergie du numérique. Notre modèle estime que la puissance installée pour les data centers en France avoisinerait alors les 64 TWh, soit 11 fois plus qu’en optant pour la sobriété. Cela correspondrait à l’émission de 2,15 millions de tonnes équivalent CO₂, soit 11 fois plus qu'en optant pour des choix de sobriété.

La question centrale ici, qui relève d’un choix citoyen, est celle du rôle que l’on souhaite donner demain au numérique dans notre société sans renoncer à notre objectif de neutralité carbone.

Propos recueillis par Nolwenn Jaumouillé.

The Conversation

Bruno Lafitte ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Quand l’IA trahit les identités professionnelles

Le recours à l’IA n’est pas neutre quant à la définition de l’identité professionnelle des individus (visuel créé par IA).

Utilisée dans un cadre professionnel, l’IA est souvent perçue comme un simple outil. Son usage peut pourtant avoir un impact sur la façon dont les individus construisent leur identité au travail. Les jeunes professionnels sont particulièrement exposés et pourraient rencontrer à terme des difficultés à reconnaître qui ils sont vraiment.


Votre CV est rédigé par ChatGPT. Votre profil LinkedIn, peaufiné par un algorithme. Vos mails professionnels sont corrigés en temps réel. Les conséquences de l’usage de l’intelligence artificielle (IA) dans un cadre professionnel ne se limitent pas à un gain de temps et d’efficacité. C’est votre identité professionnelle qui est en train de se redéfinir. Silencieusement. Profondément.

Il vaudrait mieux que ce ne soit pas à votre insu.

Être ou ne pas être authentique

Imaginez deux candidats à un même poste. L’un a rédigé sa lettre de motivation à la main, laborieusement, avec ses propres mots. L’autre a utilisé un assistant d’IA générative pour structurer, affiner et polir son discours en quelques minutes. Lequel est le plus compétent ? Lequel est le plus authentique ? Et surtout, lequel est le plus vraiment lui-même ?

Ces questions émergent aujourd’hui au cœur du marché du travail. De plus en plus, elles seront au centre du monde professionnel.


À lire aussi : Salariés, chefs d'entreprises : l'IA va tout changer, profitez-en !


« L’intelligence artificielle générative (IA générative) est une catégorie d’IA qui se concentre sur la création de données, de contenus ou de choses artistiques, de façon indépendante. Elle diffère de l’IA classique, qui se concentre, quant à elle, sur des tâches spécifiques telles que la classification, la prédiction ou la résolution de problèmes. L’IA générative vise à produire de nouvelles données qui ressemblent à celles créées par des êtres humains, que ce soit sous forme de textes, d’images ou encore de musique, par exemple»,

indique un article publié par Big média.

L’essor fulgurant des outils d’IA générative (Lechat, ChatGPT, Copilot, Claude…) transforme non seulement la manière dont nous travaillons, mais aussi la manière dont nous nous présentons, dont nous évaluons nos compétences, et dont nous construisons notre identité professionnelle.

C’est ce que révèle une étude qualitative menée auprès d’étudiants en alternance et de professionnels en activité dans des secteurs variés. À travers vingt-cinq entretiens approfondis, une double tension est apparue avec une fréquence remarquable : l’IA comme levier de professionnalisation… et l’IA comme source d’interrogation sur soi.

Qui parle ?

L’identité professionnelle n’est pas un fait donné. Elle se construit dans les interactions, les reconnaissances, les réussites accumulées. Depuis les travaux fondateurs du sociologue Claude Dubar, on sait que l’identité au travail résulte d’une transaction permanente entre ce que l’on pense être et ce que les autres reconnaissent en vous.

Or, l’IA vient perturber cette transaction. Quand une machine formule à votre place un argument que vous n’auriez pas trouvé seul, que reste-t-il de votre contribution réelle ? Que dit de vous le fait que vous ayez su bien poser la question ?

Quand un algorithme optimise votre profil LinkedIn de façon à en maximiser la visibilité, est-ce encore vous qui parlez ?

Plusieurs professionnels interrogés dans le cadre de notre étude expriment ce malaise avec une acuité saisissante. La frontière entre assistance et substitution devient floue, et avec elle, la frontière entre compétence réelle et compétence simulée.

« Quand j’utilise l’IA, j’ai l’impression que mon travail n’est pas honnête, que c’est pas vraiment moi qui l’ai fait. Le fait de tout donner à un outil remet en question mes propres capacités et la valeur que j’attribue à mon investissement. »
Étudiant en alternance dans le secteur financier.

Une forte tension identitaire

Ce témoignage n’est pas isolé. Il révèle une tension identitaire profonde entre l’identité « pour soi » – fondée sur l’effort, l’expertise, l’investissement personnel – et l’identité « pour autrui », c’est-à-dire l’image projetée vers les recruteurs, les collègues, les clients. L’IA peut soigner la seconde tout en fragilisant la première.

Cette fragilisation est d’autant plus insidieuse qu’elle opère à bas bruit. Ce n’est pas une perte de compétence objectivable, mais un ébranlement de la confiance en sa propre valeur. Ce que les psychologues nomment le « sentiment d’efficacité personnelle », théorisé par Albert Bandura, est mis à rude épreuve.

Ce phénomène a désormais un nom dans la littérature en sciences de gestion : la « menace de l’identité professionnelle » (Professional Identity Threat)

Une étude internationale publiée en 2025 dans la revue AI & Society confirme que plus un professionnel perçoit l’IA comme une menace pour son identité, moins il est enclin à l’adopter. Or, l’article montre également que les professionnels qui ont le plus besoin de maîtriser l’IA pour protéger leur position sont précisément ceux qui résistent le plus à l’adopter. Ceci crée un paradoxe productif et identitaire à la fois.

L’efficacité personnelle, une croyance ancrée dans l’expérience

Le sentiment d’efficacité personnelle désigne la conviction qu’a un individu de sa capacité à accomplir des tâches données. Ce n’est pas l’estime de soi en général mais une croyance spécifique, ancrée dans l’expérience : « Je suis capable de faire ce travail, même lorsque c’est difficile. »

Or, l’usage répété de l’IA peut progressivement éroder cette conviction. Plusieurs participants à notre étude décrivent un phénomène de dépendance progressive, presque invisible. On commence par vérifier un mail avec l’IA. Puis on ne sait plus envoyer un mail sans elle.

« Même si je suis sûre de moi, j’ai quand même ce réflexe automatique d’aller vérifier. Et ça crée une perte de confiance. Je me demande comment est-ce qu’avant je faisais sans l’IA ? »
Étudiante en alternance dans un cabinet de recrutement spécialisé dans la santé.

Plus ou moins de compétences

Ce témoignage illustre un paradoxe majeur. Conçue pour augmenter les capacités humaines, l’IA peut in fine les fragiliser psychologiquement. Non parce que l’individu perd réellement ses compétences, mais parce qu’il cesse de croire en elles indépendamment de l’outil.

Ce glissement est particulièrement préoccupant pour les jeunes professionnels en phase de construction identitaire. Ils n’ont pas encore accumulé suffisamment d’expériences fondatrices pour asseoir leur confiance sur un socle solide. L’IA risque alors de court-circuiter ce processus d’apprentissage par l’erreur et le dépassement de soi, pourtant essentiel au développement de l’identité professionnelle.

L’article de Nir Eisikovits et de Jacob Burley publié dans The Conversation, évoquait déjà les questions éthiques soulevées par l’utilisation de l’IA en contexte d’apprentissage d’étudiants du supérieur. Leur réflexion met en évidence le phénomène de « décharge cognitive » au cœur de la déstructuration du processus d’acquisition des connaissances.

En revanche, chez les professionnels expérimentés, l’équation semble différente. Forts d’un sentiment d’efficacité consolidé par des années de pratique, ils utilisent l’IA comme un amplificateur, non comme une béquille. Elle « professionnalise », « structure », « met des mots plus justes » – sans remettre en cause leur conviction d’être l’auteur véritable du travail produit.

Se vendre ou se trahir ?

Le personal branding ou marque personnelle, désigne la stratégie par laquelle un individu construit et diffuse une image professionnelle cohérente pour se différencier sur le marché du travail. LinkedIn en est l’arène principale, mais il s’étend à tout ce qui construit la réputation du salarié, aussi bien ses publications que ses interventions et autres recommandations.

L’IA transforme profondément les règles de ce jeu. Elle permet de produire des contenus « polishés », des profils optimisés, des CV sans fautes, quel que soit le niveau réel de l’individu. Elle démocratise la qualité de surface tout en risquant de niveler par le haut une concurrence déjà féroce.

Fnege Médias, 2025.

Un révélateur de fragilité

L’un des enseignements les plus marquants de cette recherche est peut-être le suivant : loin d’inventer les fragilités identitaires, l’IA agit comme un révélateur. Quand un étudiant ressent que son travail « n’est pas vraiment lui » lorsqu’il utilise l’IA, c’est souvent le signe que son identité professionnelle n’est pas encore suffisamment ancrée pour résister à l’intermédiation technologique.

En revanche, ceux qui disposent d’une identité professionnelle solide, construite sur des expériences vécues, des réussites reconnues, une trajectoire cohérente, intègrent l’IA sans s’y perdre. Ils la décrivent comme « une version améliorée d’eux-mêmes », non comme un substitut.

Ce constat a des implications importantes pour les établissements d’enseignement supérieur. Former des étudiants à l’IA ne peut pas se réduire à leur apprendre des outils. Il faut les aider à construire, avant tout, une identité professionnelle assez robuste pour que l’IA reste un levier et ne devienne pas une prothèse.

Apprendre à construire une identité

Développer cette identité suppose de travailler la réflexivité : la capacité à observer ses propres actions, à reconnaître ce qui vient réellement de soi et ce que l’on projette sur une machine. Cela implique aussi de mettre en valeur les expériences fondatrices : les échecs, les négociations compliquées, les projets menés jusqu’au bout sans soutien extérieur.

Aux amateurs de science-fiction et aux autres, la question n’est pas tant de savoir si l’IA va « prendre » les emplois. Elle est autrement plus subtile et plus urgente : l’IA va-t-elle vampiriser les identités professionnelles des individus ?


Cet article est fondé sur une étude qualitative, menée entre décembre 2025 et janvier 2026, s’appuyant sur 25 entretiens semi-directifs approfondis auprès d’étudiants en alternance et de professionnels en activité (assurance, finance, commerce, droit, management, technologie). Les auteurs remercient Yaël Salomon, étudiante de l’Inseec Grande École, pour sa contribution à la collecte et à la retranscription des données empiriques qui fondent cette étude.

The Conversation

Claudia-Roxana RUSU est membre de laboratoire de recherche IRGO de l'Université de Bordeaux.

Demba Ousmane DIOUF et Youssef Souak ne travaillent pas, ne conseillent pas, ne possèdent pas de parts, ne reçoivent pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'ont déclaré aucune autre affiliation que leur poste universitaire.

Robots, IA, numérique : et si les syndicats accéléraient la transformation technologique ?

Robots, intelligence artificielle, numérique : à mesure que les technologies transforment le travail, les syndicats sont souvent présentés comme un obstacle à l’innovation. Sur quelles preuves repose cette opinion ? Et si, loin de freiner la transformation technologique, le dialogue social pouvait aussi l’accélérer… Au-delà des discours à l’emporte-pièce, les syndicats de salariés constituent-ils vraiment un frein à l’innovation technologique ? Ou sont-ils, dans certains contextes, un atout ?


Profondément ancrée, la représentation des syndicats comme étant par nature hostiles aux innovations et au changement technologique repose davantage sur des idées reçues que sur des résultats empiriques robustes. Les statistiques internationales disponibles ne suggèrent pas de relation mécanique négative entre syndicalisation et adoption de nouvelles technologies (Figure 1).

En effet, les pays nordiques, caractérisés par une forte syndicalisation, figurent parmi ceux où l’usage de l’IA est le plus répandu, tandis que plusieurs pays faiblement syndiqués affichent de façon égale des niveaux d’adoption modestes. Cette dispersion suggère que la présence syndicale, en elle-même, n’explique pas les écarts d’adoption technologique. Ces écarts invitent plutôt à s’intéresser aux cadres institutionnels et aux modalités du dialogue social.

Figure 1 – Syndicalisation et adoption de l’IA dans les entreprises européennes en 2024

Un débat ancien et loin d’être tranché

En fait, la relation entre syndicats et investissement productif est l’un des grands classiques de l’économie du travail.

Avec mon collègue Chris Doucouliagos, nous avions d’ailleurs proposé, il y a quelques années, une méta-analyse de la littérature sur cette question. Cette étude montrait que les effets des syndicats sur l’investissement et l’innovation étaient loin d’être univoques et dépendaient fortement des contextes institutionnels.

Elle mettait en évidence une opposition récurrente entre deux visions théoriques :

  • d’un côté, les syndicats comme freins à l’investissement ;
  • de l’autre, les syndicats comme acteurs du dialogue social susceptibles de favoriser des stratégies de long terme.

C’est précisément dans le prolongement de ce débat que s’inscrit, aujourd’hui, la question de l’adoption des technologies numériques avancées.


À lire aussi : La responsabilité sociale des entreprises, un outil pour court-circuiter les syndicats ?


Débats théoriques

La théorie économique n’offre pas une prédiction unique quant au rôle des syndicats. Dans une représentation néoclassique standard, la présence syndicale est associée à la hausse du coût du travail. À technologie donnée, cette augmentation du salaire relatif incite les entreprises à substituer du capital au travail, ce qui peut se traduire par davantage d’investissement productif ou technologique.

À l’inverse, la théorie dite du hold-up, proposée initialement par les économistes américains Benjamin Klein, Robert Crawford et Armen Alchian, souligne un mécanisme de désincitation à investir. En anticipant qu’une partie des gains liés à l’investissement pourra être captée plus tard par les salariés (à travers la négociation salariale, par exemple), l’entreprise peut renoncer à certaines technologies pourtant techniquement accessibles, conduisant à un sous-investissement.

Enfin, une troisième approche met l’accent sur le rôle des syndicats comme mécanismes de voix collective. En facilitant la coordination, la formation et l’acceptation du changement, le dialogue social peut rendre l’investissement plus efficace et plus durable.

L’influence du cadre institutionnel de négociation

L’importance relative de ces mécanismes dépend étroitement du cadre institutionnel dans lequel s’exerce la représentation syndicale, comme l’ont souligné les économistes Justus Haucap et Christian Wey. En particulier, l’effet des syndicats sur l’adoption des technologies numériques dépend étroitement du niveau auquel s’organise la négociation collective et du rôle concret que jouent les représentants du personnel dans l’entreprise.

Avec sa négociation salariale largement centralisée et son dialogue social de proximité, l’Italie est un terrain d’observation particulièrement éclairant. En Italie, la négociation salariale est largement centralisée au niveau des branches tandis que la représentation syndicale en entreprise porte davantage sur l’organisation du travail, la formation et les conditions d’emploi. Cette configuration limite les comportements de captation de rente au niveau de l’entreprise et renforce le rôle des syndicats comme acteurs du dialogue social local.

C’est dans ce contexte qu’une étude récente des économistes Fabio Berton, Stefano Dughera et Andrea Ricci, menée sur plusieurs milliers d’entreprises italiennes, analyse l’adoption des technologies numériques avancées, en mobilisant une méthodologie rigoureuse visant à corriger les biais de causalité.

Des résultats clairs… et contre-intuitifs

Pour dépasser ce problème classique de causalité, les auteurs ont eu recours à une méthode dite des variables instrumentales. Ils exploitent notamment un indicateur original : le niveau de dons de sang par habitant observé au niveau provincial dans les années 1990. Le don du sang reflète des dispositions altruistes et un sens du collectif, qui favorisent la présence syndicale, sans lien direct avec les choix technologiques des entreprises plusieurs décennies plus tard. Combiné à des informations sur la diffusion passée des syndicats par secteur et par région, cet outil permet d’isoler un effet propre de la représentation du personnel sur la transformation numérique des entreprises.

Le constat est sans ambiguïté : les entreprises dotées d’une représentation syndicale ont une probabilité significativement plus élevée d’adopter des technologies numériques avancées. En moyenne, cette probabilité est supérieure d’environ 15 points de pourcentage par an par rapport aux entreprises non syndiquées. Ces entreprises n’adoptent pas seulement plus souvent une technologie, mais en adoptent également un plus grand nombre, signe d’une transformation numérique plus profonde.

Des syndicats pour mieux identifier les résistances internes

Plusieurs mécanismes permettent de comprendre ce résultat. D’abord, la présence syndicale peut réduire les résistances internes face au changement. En donnant aux salariés une possibilité de s’exprimer, elle permet d’anticiper les conflits et de négocier les modalités de la transition technologique.

Ensuite, les entreprises « syndiquées » investissent davantage dans la formation et connaissent une plus grande stabilité de l’emploi. Or, les technologies numériques avancées nécessitent souvent des compétences spécifiques et une accumulation de savoirs internes, qui s’accommodent mal d’un fort turnover.

CFDT Cadres, 2019.

Enfin, le dialogue social contribue à instaurer un climat de confiance propice à l’investissement de long terme. La transformation numérique n’est pas seulement une affaire de machines, mais aussi d’organisation et de coopération.

Les élus du personnel, des agents favorables à la transformation ?

Ces résultats ne signifient pas que la présence syndicale favorise partout et toujours l’innovation. Ils soulignent surtout l’importance du cadre institutionnel. Dans des systèmes où la négociation est très décentralisée et où les syndicats disposent d’un fort pouvoir de fixation des salaires au niveau de l’entreprise, les effets peuvent être différents. Ils mettent également en lumière une limite importante de l’étude italienne : les auteurs ne distinguent pas la nature des organisations syndicales présentes dans l’entreprise.

Or, cette dimension est loin d’être anodine. Dans des contextes marqués par un fort pluralisme syndical, comme l’Italie – ou la France –, les syndicats peuvent poursuivre des stratégies différenciées et entretenir des relations variées avec les employeurs, susceptibles d’influencer les dynamiques d’innovation. Au fond, ce n’est donc pas tant la présence de syndicats qui importe que leurs modes d’action : selon les configurations, ils peuvent tout autant freiner l’innovation que la rendre possible.

À l’heure où l’intelligence artificielle et l’automatisation suscitent de fortes inquiétudes sociales, ces résultats invitent à dépasser une opposition simpliste entre innovation et protection des salariés. La transformation technologique est aussi un processus social, qui gagne à être négocié plutôt qu’imposé. Dès lors, plutôt que d’affaiblir le dialogue social au nom de la compétitivité, il pourrait être plus efficace de le renforcer pour accompagner la transition numérique des entreprises.

The Conversation

Patrice Laroche dirige le programme WAVE (Workplace Arrangements and Voice Effects) financé par l'Agence nationale de la recherche (ANR) au sein du CEREFIGE (Université de Lorraine)

IA et métacognition : savoir quand on peut faire confiance, ou non, à la machine n’est pas toujours évident

Cet article est publié en collaboration avec Binaire, le blog pour comprendre les enjeux du numérique.


Un système d’IA doit toujours être supervisé par un humain, mais encore faut-il que cette personne soit en mesure de distinguer quand elle comprend ce que propose la machine et quand elle peut être influencée.


Les cadres contemporains de gouvernance de l’intelligence artificielle (IA) reposent sur un présupposé rarement rendu explicite : lorsqu’un opérateur humain reçoit l’output d’un système d’IA, il doit être en mesure de l’évaluer de manière significative. Les dispositions de l’AI Act européen relatives aux systèmes à haut risque exigent transparence, explicabilité et supervision humaine.

Sont explicitement visés les systèmes utilisés dans le recrutement et l’évaluation des travailleurs, l’accès aux prestations sociales, les décisions d’octroi de crédit, le contrôle aux frontières, l’administration de la justice, et les soins de santé critiques.

Le plan d’action des États-Unis sur l’IA appelle au maintien d’un contrôle humain significatif sur les décisions IA à conséquences importantes. Les principes de l’OCDE sur l’IA inscrivent le centrage sur l’humain au cœur de ses engagements.

Ces engagements sont nécessaires mais insuffisants. Ils portent sur ce que les systèmes d’IA doivent fournir aux opérateurs humains et laissent entièrement sans réponse la question de ce que ces derniers doivent être capables de faire pour agir sur ce qu’ils reçoivent. Cette lacune n’est pas accidentelle. C’est un angle mort structurel dans l’architecture actuelle de la gouvernance de l’IA.

Le modèle implicite du superviseur humain dans la plupart des textes réglementaires est celui d’un professionnel compétent et attentif qui, face à des outputs précis et lisibles, formule des jugements éclairés. C’est une hypothèse plausible dans des environnements stables, à faibles enjeux et bien maîtrisés, mais une hypothèse fragile dans des contextes à forts enjeux, soumis à la pression temporelle, et techniquement opaques – précisément les contextes dans lesquels les systèmes d’IA sont de plus en plus déployés.

Par exemple, l’infirmier aux urgences en charge du triage aux urgences qui reçoit un score de triage produit par un système IA ne dispose pas systématiquement des explications qui l’ont généré. Le conseiller bancaire qui doit décider en quelques minutes de bloquer un compte sur la base d’une alerte de fraude automatisée travaille potentiellement avec un modèle propriétaire qu’il ne peut pas interroger. L’agent administratif qui valide l’attribution d’un logement social ou d’une prestation algorithmiquement priorisée ne peut généralement pas expliquer pourquoi un dossier a été classé avant un autre. L’enseignant qui contresigne une notation automatisée d’examen n’a pas accès aux critères qui ont produit le score. Dans chacun de ces cas, la supervision humaine est formellement présente – et substantiellement impossible.

Des opérateurs métacognitivements avertis

La métacognition – la capacité à monitorer et réguler ses propres processus cognitifs – est le substrat psychologique d’une supervision efficace. Un opérateur métacognitivement averti sait quand il comprend quelque chose, quand il conjecture, et quand son jugement est façonné par des facteurs qu’il n’a pas consciemment enregistrés. Cette capacité ne peut pas être présumée ; elle varie significativement selon les individus, les formations et les pressions situationnelles.

La recherche en interaction humain-automatisme a documenté un ensemble de modes de défaillance qui émergent spécifiquement lorsque des humains supervisent des systèmes automatisés ou alimentés par l’IA. Le biais d’automatisation – la tendance à surpondérer les recommandations générées par la machine par rapport à son propre jugement – est l’un des résultats les plus robustes du domaine. Dans une étude fréquemment citée, les chercheurs Parasuraman et Riley ont montré en 1997 que les humains mésusent (c’est-à-dire font un mauvais usage ou utilisent de manière inadéquate ou inappropriée) systématiquement de l’automatisation en l’appliquant là où elle est peu fiable, et la délaissent là où elle serait bénéfique – deux types d’erreurs qui reflètent un défaut d’étalonnage métacognitif plutôt qu’un défaut de provision d’information. Par exemple, dans des expériences en simulateur de vol citées par ces auteurs, des pilotes équipés d’un système d’alerte automatique ont éteint un moteur en réponse à une fausse alerte – une décision qu’ils avaient eux-mêmes déclaré, avant l’expérience, ne jamais prendre sur la seule foi d’une alerte automatisée.

Le défi est aggravé par les caractéristiques propres aux systèmes d’IA contemporains. Les travaux de Kahneman sur une cognition à double processus – connu aussi sous le nom de Système 1/Système 2, les deux vitesses de pensées – éclairent ce mécanisme. Face à un système IA qui produit un output avec fluidité et assurance, l’esprit humain tend à activer un traitement rapide et intuitif (celui qu’on mobilise pour des tâches familières et peu risquées), plutôt que de réaliser une analyse profonde de la situation, plus longue, plus réfléchi, plus logique, et donc plus gourmande cognitivement.

Plus concrètement, une explication qui paraît plausible déclenche des réponses cognitives différentes d’une explication qui l’est vraiment. Lorsque les explications des systèmes d’IA sont synthétiquement fluides, numériquement précises et visuellement formatées comme des outputs faisant autorité, elles suppriment précisément le scepticisme que nécessite une supervision significative.

Peut-être de manière contre-intuitive, fournir davantage d’explications n’améliore pas de manière fiable le jugement humain des résultats d’IA. Une équipe de recherche, dans une étude expérimentale rigoureuse, a constaté que les explications produites par l’IA n’amélioraient pas systématiquement les performances de l’équipe humain-IA, et les dégradaient dans plusieurs conditions – notamment lorsque les explications étaient techniquement exactes mais cognitivement incompatibles avec la manière dont les opérateurs formaient leurs propres jugements.

Plus concrètement, sur la tâche d’analyse de sentiment, l’IA expliquait son jugement en surlignant les mots qu’elle avait identifiés comme positifs ou négatifs. Or les participants humains évaluaient le ton d’un texte de manière globale, en tenant compte du contexte et de la cohérence d’ensemble – un processus que la mise en évidence de mots individuels ne peut pas restituer. Ici, l’IA et l’humain n’arrivent pas à leur jugement par le même chemin : L’IA identifie des élements locaux (un mot, une phrase), là ou l’humain construit un jugement holiste (l’ensemble du texte, le contexte, la cohérence interne). Quand l’explication fournie reflète la logique de la machine plutôt que celle du raisonnement humain, elle ne donne pas à l’opérateur les outils pour évaluer si la recommandation est fiable – elle le convainc simplement de la suivre.

L’explicabilité est ainsi une condition nécessaire mais insuffisante d’une supervision efficace. Ce qui réduit l’écart entre les deux, c’est la maturité métacognitive.

Trois implications pour la gouvernance de l’IA

Si la maturité métacognitive est une propriété réelle et variable des opérateurs humains, alors les cadres de gouvernance qui imposent l’explicabilité sans s’intéresser à la métacognition des opérateurs sont tout simplement incomplets. Selon les travaux de la littérature scientifique – parmi lesquels ceux de l’IA explicable, de l’interaction humain-automatisme, des sciences cognitives, de la psychologie, des sciences humaines et sociales –, trois implications peuvent être énoncées :

  • La transparence centrée sur la documentation est insuffisante. Ce n’est pas une intuition : c’est ce que la recherche montre depuis trente ans. Ainsi, documenter et expliquer le comportement d’un système ne suffit pas à garantir de bonnes décisions humaines sans impliquer les individus dans les processus de conception de ces explications et de cette documentation et prendre en compte le contexte du besoin métier à l’instant t. Des études contrôlées ont même montré que « trop d’explications » peuvent dégrader la performance de l’équipe humain-IA en noyant l’information pertinente dans le bruit.

  • La qualification métacognitive des opérateurs devrait être considérée comme une composante de la gouvernance IA. Il s’agit ici d’un gap que la recherche a commencé à nommer, sans qu’aucun référentiel n’ait encore été formalisé.

Plus concrètement, les textes réglementaires comme l’AI Act exigent que les superviseurs humains soient « compétents », mais sans jamais définir ce que cela signifie – et en particulier, aucun référentiel n’évalue ce que les chercheurs appellent la compétence métacognitive, soit la capacité à détecter les défaillances de son propre raisonnement face à un système opaque, compétence qui relève de la formation et du contexte, pas de l’intelligence brute. Une précision importante s’impose ici. Parler de la qualification métacognitive des opérateurs ne revient pas à questionner la valeur ou l’intelligence des personnes qui supervisent des systèmes d’IA. Il ne s’agit pas non plus de classer les humains selon leur capacité à « bien penser ». La métacognition n’est ni un trait de personnalité ni un indicateur de valeur. C’est une compétence situationnelle, sensible au contexte, à la formation, à la charge cognitive et aux conditions de travail. Par exemple, un chirurgien expérimenté peut présenter un excellent étalonnage métacognitif dans son domaine et être tout aussi vulnérable au biais d’automatisation qu’un débutant face à un système d’IA opaque dans un contexte pour lequel il n’a reçu aucune formation spécifique.

  • Les compétences métacognitives – savoir ce qu’on comprend, détecter ses propres erreurs de raisonnement, réguler ses stratégies cognitives – varie selon les individus et n’est pas uniformément répartie au sein de la population, ce qui crée un risque structurel pour la sécurité. Il s’agit d’une hypothèse, formulée à partir de travaux menés en psychologie de l’éducation, qui n’a pas encore été étudiée dans le contexte de la gouvernance de l’IA. C’est peut-être le prochain axe de recherche que les gouvernements devraient activement encourager. En effet, si les organisations les mieux dotées en moyens matériels et en ressources humaines peuvent satisfaire aux exigences de supervision réelle, celles qui n’en n’ont pas – non pas parce que leurs personnels seraient moins capables, mais parce que les conditions permettant le développement de cette compétence situationnelle n’ont pas été réunies – produiront une conformité de façade, insuffisante, générant une fausse sécurité particulièrement dangereuse dans les domaines critiques.
The Conversation

Ikram Chraibi Kaadoud ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Qu’est-ce que l’« IA agentique » ? Comprendre son histoire pour dépasser l’effet de mode

Réserver un voyage en comparant des centaines d’offres, rédiger un rapport à partir de plusieurs documents, analyser des données médicales ou corriger automatiquement un programme informatique : ces tâches exigent de la réflexion, de la méthode et des compétences variées. L’« IA agentique » promet désormais de les accomplir de manière autonome, en orchestrant les opérations nécessaires, en utilisant des outils et en corrigeant ses propres erreurs… Toutefois, l’IA agentique actuelle ne recouvre pas encore toute la richesse du concept d’« agent autonome » tel qu’il a été élaboré dans les décennies précédentes.


Le cabinet Gartner a présenté 2026 comme l’année des « agents IA ». Ces systèmes dépassent la simple amélioration des assistants conversationnels. Les agents IA d’OpenClaw sont d’ores et déjà capables de dialoguer entre eux et d’exécuter des tâches complexes avec une supervision humaine limitée. Pour les entreprises, que ce soit dans l’industrie, l’administration ou la santé, la promesse est celle d’une automatisation plus souple qu’avec les logiciels traditionnels, capable de s’adapter à des situations variées plutôt que d’appliquer des règles prédéfinies.

Pourtant, derrière l’apparente nouveauté se cache une histoire plus ancienne. L’IA agentique s’inscrit dans la continuité de plusieurs décennies de recherche sur les agents autonomes et les systèmes multi-agents. Ce qui change aujourd’hui, ce sont les outils, notamment les grands modèles de langage et leur capacité à interagir plus naturellement avec les humains.

De la génération de texte à l’action

Les modèles conversationnels, comme ChatGPT, Gemini ou Claude, impressionnent par leur aptitude à résumer ou à rédiger des textes complexes. Pris isolément, ils restent toutefois essentiellement réactifs : ils produisent une réponse en fonction d’une requête. Un agent autonome va plus loin. Il peut analyser une demande, planifier une séquence d’opérations, utiliser des outils externes (moteur de recherche, base de données, logiciel), évaluer le résultat obtenu et ajuster sa stratégie si nécessaire.

Là où un modèle de langue se limite à écrire un programme informatique, un agent peut l’exécuter dans un environnement sécurisé, observer les erreurs éventuelles, corriger le code, puis le tester à nouveau. En somme, les agents IA ne font pas que parler, ils agissent.

Le passage de la génération de texte à l’action transforme la nature même du logiciel. Alors qu’un programme suit des instructions précisément définies à l’avance, un agent autonome peut, lui, adapter dynamiquement ses décisions en fonction du contexte, des résultats obtenus et des objectifs fixés. Il ne remplace pas nécessairement l’humain, mais modifie la répartition des tâches entre supervision et exécution.

Promesses et risques

Cette évolution ouvre des perspectives considérables. Dans les organisations, des agents peuvent automatiser des processus métiers laborieux. Dans l’industrie, ils peuvent coordonner des systèmes logiciels complexes. Dans le domaine médical, ils peuvent analyser des dossiers, rechercher des publications pertinentes et proposer des synthèses pour assister les médecins. Mais ces promesses s’accompagnent de risques.

En effet, les modèles actuels peuvent produire des informations inexactes, les fameuses hallucinations, et sont susceptibles de reproduire des biais présents dans leurs données d’entraînement. Si les agents sont cantonnés à un rôle d’assistant, ces limites sont déjà problématiques ; elles deviennent critiques lorsqu’elles concernent des systèmes capables d’agir sur des infrastructures techniques, notamment en exécutant des commandes système, en manipulant des fichiers ou en envoyant des requêtes réseau.

La question des agents d’IA n’est donc pas seulement technique : elle est aussi juridique, économique et sociétale. Elle touche à la transformation du travail qualifié et à la gouvernance des systèmes informatiques.

Une filiation historique

L’idée d’un agent autonome n’est pas née avec les modèles de langue. Elle remonte aux origines mêmes de l’intelligence artificielle. En 1956, lors de la conférence fondatrice de Dartmouth (au nord-est des États-Unis), l’un de ses organisateurs, Marvin Minsky, définissait déjà l’IA comme la conception de programmes capables d’accomplir des tâches mobilisant des capacités dites intelligentes telles que comprendre, apprendre, raisonner ou décider.

À partir des années 1980, la notion d’« agent intelligent » devient centrale. Un « agent » est alors défini comme un programme capable de percevoir son environnement, de prendre des décisions et d’agir pour atteindre des objectifs. Très tôt, les chercheurs développent le champ des systèmes multi-agents : des ensembles organisés de programmes autonomes qui interagissent dans un même environnement numérique. L’objectif est de comprendre comment ces entités peuvent se coordonner, coopérer ou entrer en compétition afin de résoudre des problèmes complexes.

Plusieurs travaux emblématiques illustrent concrètement cette approche. Le système HEARSAY-II repose sur un modèle de « tableau noir ». Plusieurs modules spécialisés pour la reconnaissance, l’analyse et l’interprétation du langage contribuent à la compréhension de la parole en partageant leurs hypothèses dans un espace commun structuré. Le Contract Net Protocol propose un mécanisme inspiré des appels d’offres : pour réaliser une tâche, un agent émet un appel à proposition, d’autres agents proposent leurs services, et les plus compétents se voient attribuer le contrat. Autrement dit la coordination entre agents est au cœur de l’IA depuis plusieurs décennies.

Un réservoir d’idées encore sous-exploité

Mais si l’idée d’agent n’est pas nouvelle, l’« IA agentique » s’impose aujourd’hui auprès des non-spécialistes en raison du rôle central joué par les grands modèles de langue. Bien que dénués de compréhension causale et de compréhension du monde physique, ceux-ci fournissent aux agents une capacité linguistique et une forme de « sens commun » statistique qui facilitent l’interaction avec les humains et l’interprétation d’instructions complexes en langage naturel.

Toutefois, l’IA agentique actuelle ne recouvre pas encore toute la richesse du concept d’agent autonome tel qu’il a été élaboré dans les décennies précédentes. Dans la pratique, elle repose encore le plus souvent sur une séquence d’actions où chaque étape est prévue et ordonnée à l’avance. Les travaux menés depuis les années 1990 sur les systèmes multi-agents qui portent sur la coopération, la négociation, l’allocation de tâches et l’adaptation collective offrent un réservoir d’idées encore largement sous-exploitées.

L’intégration de ces mécanismes avec les capacités des grands modèles ouvre pour demain des perspectives nouvelles : des agents capables non seulement d’exécuter un plan mais de s’organiser collectivement, de se spécialiser et de s’adapter à des environnements complexes.

L’IA agentique constitue ainsi une nouvelle étape plutôt qu’une rupture. Elle associe l’héritage théorique des systèmes multi-agents à la puissance récente des modèles génératifs. Comprendre cette filiation historique permet de dépasser l’effet de mode. L’IA agentique représente une tentative de transformer des modèles prédictifs en systèmes capables d’agir, de planifier et, peut-être demain, de s’organiser collectivement dans des environnements complexes.

The Conversation

Maxime MORGE a reçu des financements de Lyon 1 Université et CNRS, .

IA : pourquoi former une « tête bien faite » n’a jamais été aussi crucial

Alors que l’intelligence artificielle générative produit des textes, des images et des raisonnements toujours plus convaincants, une question éducative essentielle émerge : que signifie encore comprendre ? À l’ère de la surcharge informationnelle, former une « tête bien faite » ne consiste plus à accumuler des savoirs, mais à apprendre à juger de leur profondeur, de leur validité et de leur inscription dans le réel.


Des étudiants peuvent rendre aujourd’hui des travaux irréprochables sur la forme : structurés, argumentés, parfois brillants. Pourtant, lorsqu’on les interroge, un malaise affleure. Ils peinent à expliquer ce qu’ils ont réellement compris, à justifier leurs choix, à relier ce qu’ils ont produit à une expérience vécue ou à une situation concrète. L’intelligence artificielle (IA) générative n’est pas toujours la cause directe de cette situation, mais elle en est un révélateur puissant. Car si produire de l’information n’a jamais été aussi simple, comprendre ce que l’on fait n’a jamais été aussi exigeant.

Connaître, savoir, comprendre : une distinction devenue centrale

À l’ère de l’IA, la question éducative ne peut plus être pensée en termes d’accumulation de connaissances. Elle impose de clarifier ce que l’on entend par connaître, savoir et comprendre, et d’interroger la manière dont ces dimensions s’articulent dans les processus d’apprentissage.

Deux grandes traditions épistémologiques permettent d’éclairer cette distinction. Le scientifique Michael Polanyi a montré que toute connaissance humaine comporte une part irréductiblement tacite : elle est enracinée dans l’expérience, l’action et l’engagement du sujet. « Nous savons plus que ce que nous pouvons dire », écrit-il, soulignant que la compréhension précède souvent sa formulation explicite. Cette connaissance en acte, souvent implicite, se construit dans le faire, l’essai, l’erreur et la confrontation au réel.

À l’inverse, le philosophe Gaston Bachelard a établi que le savoir scientifique ne procède pas d’un simple prolongement de l’expérience. Il exige une rupture avec les évidences premières et avec l’opinion, au prix d’un travail de construction rationnelle, critique et abstraite. « La science ne procède pas de l’opinion », rappelait-il, insistant sur la nécessité de former l’esprit à poser des problèmes plutôt qu’à accumuler des réponses.

Former une « tête bien faite », ce n’est donc ni accumuler des savoirs abstraits, ni se contenter d’une expérience brute. C’est apprendre à tenir ensemble ces deux dimensions : l’expérience vécue et la construction conceptuelle, l’action et la réflexivité.

Ce que l’IA sait faire – et ce qu’elle ne peut pas faire

Les systèmes d’intelligence artificielle excellent précisément là où le savoir est formalisable : calcul, synthèse, reproduction, mise en forme. Ils prennent en charge une part croissante du savoir explicite, stabilisé, calculable. Mais ils opèrent dans un régime spécifique : celui de la corrélation statistique et de la production d’énoncés plausibles.

L’IA ne connaît pas le monde, elle ne le comprend pas. Elle n’a ni expérience, ni rapport incarné au réel, ni accès aux conditions de pluralisme des phénomènes qu’elle décrit. L’information qu’elle génère est par nature probabiliste – elle repose sur des calculs de vraisemblance issus de corrélations statistiques plutôt que sur une compréhension des causes, contingente – elle dépend des données, des contextes d’énonciation et des paramètres techniques, et révisables – en ce sens qu’elle peut être corrigée, contredite ou reformulée à tout moment sans que cela n’implique une progression interne de la compréhension.

Cette distinction est aujourd’hui au cœur des travaux contemporains sur les usages éducatifs de l’IA, qui montrent que l’automatisation de certaines tâches cognitives peut, si elle est mal encadrée, appauvrir l’exercice du jugement critique.

Plus les productions de l’IA deviennent convaincantes, plus le risque est grand de confondre cohérence formelle et compréhension réelle, à savoir paraître véridique en lieu et place d’un énoncé prudent et ouvrant le dialogue.

Mesurer la complexité : une compétence qui s’apprend

Face à cette situation, un enjeu éducatif majeur émerge : la capacité à mesurer la complexité des choses. Distinguer ce qui relève de la surface informationnelle de ce qui engage une compréhension structurée. Apprécier les niveaux de profondeur d’un problème, d’un système ou d’une situation.

Or cette capacité ne se décrète pas. Elle se construit progressivement par l’expérience du réel. Elle suppose un travail actif de confrontation entre ce que l’on anticipe théoriquement et ce que révèle l’épreuve de la réalisation concrète. C’est dans l’écart, toujours instructif, entre le modèle et l’expérience que s’affinent les critères de jugement et que se développe une intelligence véritablement située, au sens où elle articule savoir formalisé et connaissance vécue.

Le savoir ne devient opérant qu’à condition d’être éprouvé, mis en tension avec le réel, réajusté à la lumière de ses résistances et de ses surprises. Inversement, l’expérience brute, si elle n’est pas reprise dans un cadre réflexif et conceptuel, demeure muette et difficilement transmissible. La formation doit donc organiser les conditions de cette circulation exigeante entre théorie et pratique, abstraction et incarnation.

Une révolution pédagogique autant que technologique

L’intelligence artificielle ne transforme pas seulement nos outils. Elle intervient au cœur même des fonctions cognitives supérieures : mémoire externalisée, accès instantané à l’information, génération de raisonnements apparents. Là où les technologies précédentes amplifiaient des capacités humaines déjà constituées, l’IA en reconfigure désormais l’équilibre.

L’enjeu éducatif se déplace en conséquence. Il ne s’agit plus principalement d’apprendre à produire ou à restituer de l’information mais d’apprendre à en évaluer la profondeur, la cohérence, les conditions de validité et les effets dans le réel. Cette mutation rejoint les analyses du sociologue Edgar Morin sur la pensée complexe, qui soulignent la nécessité de former des esprits capables de relier, de contextualiser et d’affronter l’incertitude plutôt que de réduire le réel à des réponses simplifiées.

Des travaux récents en sciences cognitives et en sciences de l’éducation montrent d’ailleurs que l’usage substitutif de l’IA peut conduire à une forme de délégation cognitive excessive, réduisant l’engagement intellectuel et la mémorisation à long terme, là où un usage réflexif et critique peut au contraire renforcer l’apprentissage.

Former des ingénieurs – et des citoyens – capables de juger

Former une tête bien faite à l’ère de l’IA implique ainsi de ne pas confondre délégation cognitive et renoncement intellectuel. Il s’agit de former des sujets capables de faire usage de systèmes puissants sans s’y soumettre, capables de maintenir une exigence de sens là où la machine ne produit que de la forme.

Chez IONIS, le développement des IONIS Institute of Technology (I2T) sur nos campus procède d’une conviction forte : si nos étudiants ingénieurs doivent maîtriser les technologies de l’intelligence artificielle, ils doivent tout autant apprendre à en éprouver les limites par la confrontation au réel. Le laboratoire, l’atelier et l’expérimentation deviennent alors des lieux centraux de formation du jugement.

Former de bons ingénieurs – et plus largement des citoyens éclairés – consiste à cultiver un esprit critique, mesuré et évolutif, nourri par l’expérience concrète, le faire et le défaire. À l’ère de l’IA, la question essentielle n’est donc pas seulement ce que nous attendons de la machine mais bien ce que nous attendons de l’humain : sa capacité à comprendre, à créer et à décider avec discernement dans des environnements incertains et technologiquement augmentés.

The Conversation

Clément Duhart ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

Numérisation de la justice : les leçons du cas belge

En Belgique, l’échec du projet numérique « I-police » ainsi que les controverses récentes autour de l’intelligence artificielle ont ravivé les débats sur la place du numérique dans les institutions publiques. Longtemps présentée comme un levier de modernisation, la numérisation transforme le travail des tribunaux et met en lumière les fragilités de l’indépendance judiciaire. Derrière les promesses de rapidité et d’efficacité se dessinent de nouveaux enjeux pour la justice.


En Belgique, comme ailleurs, la numérisation de la justice est devenue un enjeu politique et budgétaire majeur. Les événements récents invitent pourtant à réexaminer la portée de ce chantier. L’arrêt du projet « I-police », après des investissements publics considérables, a rappelé la fragilité des grands projets numériques dans le secteur public. Le programme a été abandonné en raison de graves lacunes dans l’exécution du marché public et de résultats jugés très en deçà des attentes initiales.

Dans le même temps, l’arrivée en février 2025 à la tête du ministère de la justice d’Annelies Verlinden, auparavant ministre de l’intérieur, marque un déplacement des priorités. Après plusieurs années de modernisation numérique continue, ses premières mesures mettent plutôt l’accent sur les problèmes structurels du système judiciaire, tels que les conditions de travail, les infrastructures et la surpopulation carcérale. Le numérique n’est plus présenté comme la solution centrale, mais comme un élément parmi d’autres d’une réforme institutionnelle.

Parallèlement, l’intelligence artificielle suscite des controverses. La condamnation d’un avocat pour avoir remis des conclusions rédigées par une IA et les mises en garde contre une automatisation excessive de la décision judiciaire soulignent que les enjeux ne sont pas seulement techniques, mais aussi normatifs.

Ces signaux convergents montrent que la numérisation de la justice ne relève pas d’une évidence consensuelle. Elle engage des choix de gouvernance, de financement et de conception de la démocratie.

Une solution technique à des problèmes structurels ?

En Belgique, la numérisation des tribunaux s’inscrit dans une longue trajectoire de réformes. La fin des années 1990 est marquée par l’affaire Dutroux et la crise institutionnelle subséquente. Les gouvernements successifs ont alors cherché à restaurer la confiance des citoyens en essayant de rendre l’institution plus efficace, plus transparente et plus performante.

Progressivement, le numérique est devenu l’instrument privilégié de cette modernisation. Bases de données, plateformes de gestion, systèmes de traitement des dossiers : ces outils promettaient de fluidifier les procédures, de centraliser l’information et de réduire les délais.

Mais ces technologies ne sont pas neutres. Comme tout instrument de gestion, elles organisent, hiérarchisent et encadrent l’activité. Elles s’inscrivent dans un discours d’urgence et de modernisation présenté comme inévitable. Le numérique s’est ainsi imposé non seulement comme un outil, mais aussi comme la meilleure réponse aux difficultés structurelles de la justice – la lenteur, la complexité, le manque de transparence et les coûts élevés.

Pourtant, la numérisation ne supprime pas les tensions : elle les déplace, les reformule et en fait émerger de nouvelles. Derrière les plateformes et les bases de données, ce sont des équilibres fondamentaux qui se redessinent.

Les enjeux derrière la « solution numérique »

Pour comprendre ce que la numérisation produit concrètement, il faut déplacer le regard. Trois points d’attention permettent d’en mesurer les effets.

Un travail judiciaire redéfini

La manière de penser évolue : les outils pré-classent les dossiers, automatisent certaines étapes et signalent des priorités. Il ne s’agit plus seulement d’interpréter et de trancher, mais de composer avec ce que le système permet, impose ou rend visible.

Les tableaux de bord, les indicateurs de performance et les champs standardisés valorisent la rapidité, la traçabilité et la conformité. Là où dominaient auparavant la délibération et la profondeur d’analyse, ces nouveaux critères s’imposent et redéfinissent, en pratique, les hiérarchies de valeur – par exemple en plaçant l’efficacité au-dessus de la réflexion – ainsi que ce qui est considéré comme un « bon » travail juridique.

Enfin, la manière dont les décisions sont prises, et par qui, évolue. Le fonctionnement des juridictions dépend désormais d’entreprises privées et de mises à jour logicielles dont les logiques ne sont pas toujours explicites ni alignées avec les normes judiciaires. L’autorité des juges demeure formellement intacte, mais leur capacité à agir dépend de plus en plus de ces infrastructures et des acteurs qui les font fonctionner.

Ces évolutions, souvent discrètes, recomposent progressivement les équilibres professionnels et la manière dont la justice est exercée.

L’indépendance judiciaire en question

Au-delà du travail judiciaire lui-même, la numérisation influence aussi l’indépendance de la justice. Celle-ci concerne les conditions matérielles et organisationnelles dans lesquelles les décisions sont prises.

Traditionnellement, les dossiers étaient gérés au sein des juridictions. Avec les plateformes numériques, la gestion des fichiers, des bases de données et des systèmes informatiques implique désormais d’autres acteurs : prestataires privés, ordres professionnels, services publics fédéraux. Certaines juridictions ont tenté de conserver la maîtrise de leurs outils, en développant leurs bases de données en interne. Mais ailleurs, les dépendances sont plus fortes, qu’elles lient l’institution à un prestataire privé pour la maintenance d’un système pénal, ou à l’Ordre des avocats pour une plate-forme de gestion des faillites.

La question devient plus sensible encore lorsque l’exécutif intervient dans la gouvernance des infrastructures. En novembre 2025, la Cour constitutionnelle a annulé une disposition relative au dossier pénal numérique. Le registre central, censé constituer la source authentique des dossiers de procédure, était géré par un comité institué auprès du Service public fédéral de justice, au sein duquel les représentants de l’ordre judiciaire ne disposaient ni d’une majorité ni d’une voix prépondérante. La Cour a estimé qu’une telle structure ne garantissait pas suffisamment l’indépendance judiciaire.

Une soutenabilité institutionnelle fragilisée

Sur le terrain, un paradoxe s’impose aux acteurs et aux observateurs : le numérique semble à la fois en retard – outils défaillants, connexions incertaines – et en accélération permanente, avec des projets qui se succèdent avant même que les précédents ne soient stabilisés. Dans ce contexte, les décalages et les imprévus ne sont pas toujours anticipés par les réformes. Ils sont absorbés au quotidien par les professionnels eux-mêmes : prendre en main un nouveau logiciel, contourner une étape bloquée, maintenir une cohérence alors que les catégories évoluent plus vite que les règles qu’elles sont censées servir.

À long terme, cette succession d’adaptations produit une forme d’usure institutionnelle. Les outils se suivent, les systèmes changent et les équipes doivent constamment apprendre, désapprendre, réapprendre et compenser des défauts de conception par du bricolage. Innovation et usure coexistent dans un même geste : maintenir la justice opérationnelle à travers des infrastructures fragiles.

Cette fatigue ne tient pas seulement aux outils eux-mêmes, mais au rythme auquel ils sont conçus et déployés. Les projets numériques sont souvent financés dans les cycles courts des législatures, des plans stratégiques, d’éventuels fonds européens du plan de relance. Ces financements privilégient le lancement et les échéances visibles. Mais la justice fonctionne dans la durée. Elle exige stabilité, continuité et réparabilité.

De plus, un système numérique ne vit pas seulement au moment de son déploiement. Il exige des mises à jour, des corrections et un support constant. Ces coûts de maintenance sont souvent sous-estimés, fragmentés ou financés de manière provisoire. Les juridictions se retrouvent alors à faire fonctionner des systèmes instables ou partiellement aboutis.

Ce décalage entre le temps politique de l’innovation et le temps institutionnel de la justice fragilise la capacité des juridictions à faire fonctionner durablement les dispositifs numériques sur lesquels elles reposent. La Cour des comptes belge a récemment alerté sur la viabilité à long terme des initiatives de justice numérique dans leur gouvernance actuelle.

Au service de quelle justice ?

La numérisation de la justice ne peut être réduite à un simple chantier technique. Elle engage des choix de gouvernance, de financement, et de conception du service public. Présentée comme une réponse à la lenteur ou à la complexité de la justice, elle redessine en réalité les équilibres institutionnels et les conditions d’exercice du travail judiciaire.

L’enjeu n’est donc pas seulement celui de l’efficacité des outils. Il réside dans la manière dont ils sont conçus, gérés, financés, et maintenus dans le temps, et dans la vision de la justice qu’ils contribuent à instituer. Car derrière les plateformes et les registres numériques se jouent des questions plus fondamentales : quelles pratiques professionnelles, quelles formes d’indépendance et quelles temporalités institutionnelles ces dispositifs rendent-ils possibles – ou fragilisent-ils ? Et à quel prix ?

The Conversation

Lisa Pelssers a reçu des financements du Fond national de la recherche scientifique (FRS-FNRS).

L'intelligence numérique peut aider à réduire les GES… et les aggraver. Voici comment jongler avec ce paradoxe

La réduction des émissions de gaz à effet de serre nécessite une transition rapide vers des systèmes énergétiques bas carbone. On peut penser à l’énergie solaire, l’énergie éolienne ou encore la géothermie.


On peut aussi penser à l’intelligence numérique (IA, algorithmes, grande data, objets connectés). Elle offre des leviers puissants pour accélérer la transition vers des systèmes énergétiques bas carbone. Mais elle n’est pas neutre : sa production et son fonctionnement génèrent eux-mêmes des émissions et des impacts matériels.

La question de la responsabilité des innovations technologiques visant à accompagner la transition écologique est au coeur de mes recherches. Les technologies numériques peuvent-elles, paradoxalement, faire partie de la solution ? L’intelligence numérique ne risque-t-elle pas, au contraire, d’aggraver le problème lorsqu’elle a recours aux énergies fossiles ?

Lasagne d’intelligence numérique

L’intelligence numérique regroupe la science des données et l’intelligence artificielle, dans une approche dite « de la donnée à la décision ». Elle peut à cet égard fournir des données à partir desquelles de meilleures décisions seront prises, que ce soit en affaires, ou concernant la transition énergétique.

Prenons l’exemple d’Hydro-Québec qui, pour garantir la résilience et la fiabilité de son réseau électrique, doit s’adapter à plusieurs défis.

Une augmentation de la fréquence et de l’intensité des événements météo extrêmes – tempêtes, vents violents, verglas, feux de forêt, fortes précipitations – met à rude épreuve les infrastructures de production, transport et distribution.

En effet, les infrastructures sont de plus en plus vulnérables aux aléas climatiques, comme le verglas qui alourdit et fragilise les lignes électriques, ou les feux de forêt dans le nord qui menacent directement les installations.

L’adaptation du réseau énergétique aux changements climatiques repose sur une approche intégrée combinant des infrastructures plus efficaces, la diversification des sources d’énergie, l’optimisation de la consommation – et sa réduction – ainsi que l’amélioration de la flexibilité du réseau.


À lire aussi : L’étude des forêts anciennes de l’est du Canada indique que le changement climatique a commencé il y a près de 100 ans


L’importance de la modélisation

C’est dans ce contexte que la modélisation devient un ingrédient indispensable de l’intelligence numérique. Les outils de modélisation du système énergétique jouent un rôle clé en permettant d’évaluer les différentes trajectoires vers la carboneutralité.

Par exemple, pour évaluer l’impact du transport routier à Montréal, on peut analyser les déplacements et les comportements des automobilistes sur une période donnée et extrapoler ces données sur l’année grâce à un logiciel de modélisation utilisant l’intelligence numérique.

Les modèles à choix discrets (Discrete Choice Models) sont des modèles statistiques qui décrivent et prédisent les décisions d’individus parmi un ensemble fini d’options, en fonction des caractéristiques des alternatives et des préférences des individus. Ainsi, l’intégration de ces données précises aux modèles permet non seulement d’évaluer le potentiel des nouvelles infrastructures, mais aussi de considérer des alternatives plus viables telles que les transports en commun, la marche, le vélo, ou encore le covoiturage.


À lire aussi : À Montréal, même en doublant les pistes cyclables, les voitures conserveraient 90 % de la chaussée


Si la modélisation ne date pas d’hier, le recours à l’intelligence artificielle permet de réduire le temps de modélisation.

Expérimenter sans construire

Un autre exemple prometteur de l’usage de l’intelligence numérique dans la prise de décision est la modélisation par jumeau numérique.

Elle repose sur l’interaction entre le BIM (Building Information Modeling) et l’intelligence artificielle (IA). Elle consiste à créer une réplique virtuelle d’un bâtiment ou de toute autre infrastructure afin de simuler son comportement dans différentes conditions.


Déjà des milliers d’abonnés à l’infolettre de La Conversation. Et vous ? Abonnez-vous gratuitement à notre infolettre pour mieux comprendre les grands enjeux contemporains.


Cette approche permet d’optimiser la conception et les performances du bâtiment sans avoir recours à des matériaux physiques, réduisant ainsi la consommation de ressources. Connecté à des capteurs, le modèle reçoit des données en temps réel (par exemple : la température ou l’occupation d’un bâtiment).

L’IA analyse ces données pour simuler des scénarios, prédire des défaillances, ou optimiser la performance énergétique. Ce système permet ainsi de concevoir, gérer et améliorer un bâtiment sans intervention physique, réduisant les coûts et la consommation de ressources.


À lire aussi : Climat : comment l’industrie pétrolière veut nous faire porter le chapeau


Les limites de l’intelligence numérique

Si les modèles mathématiques aident à identifier des scénarios viables pour la transition énergétique des secteurs du transport et des bâtiments, ils comportent leurs limites.

Les modèles utilisés dans ces analyses sont principalement de nature technico-économique. Autrement dit, ils évaluent ce qui est théoriquement réalisable en fonction des infrastructures et des coûts, mais ils ne tiennent pas toujours compte des obstacles sociaux, environnementaux ou politiques qui peuvent freiner leur mise en œuvre.

Par exemple, une solution identifiée comme optimale pour réduire les émissions de GES pourrait se heurter à des limites telles que le manque de volonté politique, la présence d’autres sources d’émissions non prises en compte, ou encore des impacts collatéraux sur la biodiversité et l’économie locale.

Une transition démocratique

La transition énergétique n’est pas seulement une question technologique, mais aussi politique et sociale. Par exemple, l’adoption de nouvelles normes sociales, comme la réduction de l’usage de l’automobile, doit être soutenue par des infrastructures facilitantes. Les pouvoirs publics ont la responsabilité d’accompagner ces changements.

Le numérique est un outil puissant, mais ce n’est pas une panacée pour affronter ce qui constitue sans doute l’un des plus grands défis de notre siècle. Pour que la recette fonctionne, l’intelligence numérique doit s’assurer de réunir tous les bons ingrédients.

La Conversation Canada

Diane Gorcy a reçu des financements du CIRODD.

Annie Levasseur a reçu des financements de nombreux organismes subventionnaires de la recherche (Chaires de recherche du Canada, CRSNG, FRQ, Mitacs, etc.).

Hanane Dagdougui a reçu des financements de nombreux organismes subventionnaires de la recherche ( CRSNG, Mitacs, FQRNT, etc.).

Olivier Bahn a reçu des financements de plusieurs organismes subventionnaires de la recherche, notamment le CNRC, le CRSNG, le FRQ et Mitacs.

Charles Ponzi nous permet-il de comprendre la bulle de l’IA ?

L’escroc Charles Ponzi (né Carlo Pietro Giovanni Guglielmo Tebaldo Ponzi en 1882 en Italie et mort au Brésil en 1949) se fait connaître dès 1920 pour ses manœuvres financières frauduleuses. Wikimedia Commons

Les bulles technologiques ont souvent dissimulé de grandes fraudes. Du boom ferroviaire britannique au XIXᵉ siècle à l’affaire Madoff, y a-t-il des signes avant-coureurs qui peuvent nous permettre de comprendre la frénésie actuelle autour de l’IA et sa potentielle bulle ?


De nombreux investisseurs se demandent si nous vivons dans une bulle IA ; d’autres vont plus loin et se posent la question de savoir jusqu’à quand. Pourtant, la bulle continue de gonfler, alimentée par ce sentiment dangereux de « peur de passer à côté » (FOMO pour Fear Of Missing Out). L’histoire et l’expérience récente nous montrent que les bulles financières naissent souvent de l’enthousiasme excessif des investisseurs pour les nouvelles technologies « révolutionnaires » qui, lorsqu’elles éclatent, révèlent des systèmes frauduleux surréalistes qui se sont développés sous couvert de la bulle.

Concrètement, un système de Ponzi consiste à rémunérer les investisseurs existants avec l’argent apporté par de nouveaux investisseurs plutôt qu’avec de vrais profits, ce qui nécessite un recrutement continu jusqu’à son effondrement inévitable. L’une des caractéristiques de ces systèmes est qu’ils sont difficiles à détecter avant l’éclatement de la bulle, mais étonnamment simples à comprendre avec le recul.

Dans cet article, nous abordons la question suivante : quelles traces les systèmes de Ponzi laissent-ils dans les bulles financières alimentées par la technologie ? Comment pourraient-elles nous aider à anticiper la prochaine bulle qui émergera dans le tumulte de l’IA ?

Pour ce faire, nous comparerons le Ponzi du « roi du chemin de fer » George Hudson, dans les années 1840, à celui de Bernie Madoff, rendu possible par les technologies de l’information et de la communication (TIC) et les dotcoms des années 1990-2000, puis soutenu par la bulle immobilière qui a suivi aux États-Unis.

« Railway Mania » de George Hudson

La « Railway Mania » débute au Royaume-Uni en 1829. Elle émerge sous l’effet à la fois des attentes des investisseurs quant à la croissance de cette nouvelle technologie et du manque d’alternatives d’investissement provoqué par l’arrêt de l’émission d’obligations par le gouvernement. La promesse de la technologie ferroviaire entraîne un afflux de compagnies ferroviaires avec l’enregistrement de plus de 50 entreprises au cours des quatre premiers mois de 1845 seulement.

George Hudson (1800–1871), caricaturé ironiquement « hors des sentiers battus » dans la revue Punch. Wikimédia

À cette époque, les estimations des coûts de développement ferroviaire sont sous-évaluées de plus de 50 %, et les prévisions de recettes sont estimées entre 2 000 et 3 000 livres sterling par mile, alors que les recettes réelles se situent plutôt entre 1 000 et 1 500 livres par mile. (Cent livres sterling en 1845 équivalent à 15 782,99 livres sterling en 2026, soit 18 216,73 euros, ndlt) Les normes comptables rudimentaires permettent une certaine liberté dans la présentation des comptes, comme le report de la comptabilisation des dépenses. La responsabilité des directeurs incombe aux actionnaires et non à des auditeurs externes ou à des représentants de l’État.

George Hudson, qui est également membre du Parlement, encourage la déréglementation du secteur ferroviaire.

Ponzi de Bernard Madoff

La réputation de Bernard Madoff s’est construite sur son succès dans les années 1970 grâce à l’informatisation et à l’innovation technologique dans le domaine du trading. La bulle Internet est alimentée par l’expansion rapide des entreprises technologiques, avec plus de 1 900 sociétés TIC cotées sur les bourses américaines entre 1996 et 2000, ce qui permet à son fonds BLMIS de détenir 300 millions de dollars d’actifs en 2000 (alors plus de 300 millions d’euros, ndlr).


À lire aussi : En finir avec la finance Ponzi, vraiment ? Le cas « Martin Shkreli »


Bernard Madoff (1938-2021), président fondateur de Bernard L Madoff Investment Securities LLC, l’une des principales sociétés d’investissement de Wall Street. En 2008, il est arrêté par le FBI pour escroquerie de type « système de Ponzi ». Wikimédia

Le système de Madoff se développe dans un contexte de croissance rapide des produits dérivés, tels que les credit default swaps (CDS) et les collateralized debt obligations (CDO), qui augmentent de 452 % entre 2001 et 2007. La forte volatilité des marchés engendre une normalisation des rendements exceptionnellement élevés, masquant le caractère irréalisable des performances promises par Bernard Madoff. Ces rendements sont considérés comme modérés par les investisseurs, qui ne perçoivent pas l’invraisemblance d’une telle constance sur le long terme, ce qui permet au système de durer sans être détecté.

Les activités de Bernard Madoff sont facilitées par le fait qu’avant la loi Dodd-Frank de 2010 sur la supervision des banques, l’enregistrement des hedge funds (fonds spéculatifs) auprès de la Securities and Exchange Commission (SEC, l’organisme de régulation des marchés financiers) est volontaire. De plus, après les attentats du 11 septembre 2001, les ressources gouvernementales sont réorientées vers la sécurité nationale, entraînant une baisse de plus de 25 % des enquêtes ouvertes pour crimes financiers entre 2000 et 2003.

L’invraisemblance des rendements de Bernard Madoff est négligée par la SEC, malgré les signalements de lanceurs d’alerte qui ont déclenché une enquête – ce qui reflète son manque de connaissances et celui d’autres organismes de réglementation en matière de trading des hedge funds. Cela a également pu être le résultat de l’influence des relations étroites de Madoff avec les autorités de régulation, compte tenu de ses fonctions passées de président du Nasdaq et de conseiller en structure de marché auprès de la SEC.

Au moment de l’éclatement de la bulle ferroviaire, les taux d’intérêt de la Banque d’Angleterre sont à leur plus bas niveau depuis près d’un siècle. De même, la baisse des taux d’intérêt par la Réserve fédérale états-unienne (Fed) dans les années 2000 réduit le coût des crédits immobiliers, stimulant la demande et contribuant à l’inflation des prix de l’immobilier. Dans les deux cas, les marchés sont inondés d’argent bon marché et lorsque tout le monde gagne de l’argent (ou pense en gagner), les questions qui dérangent ne sont pas posées.

De l’ascension à la chute des fraudeurs

George Hudson de même que Bernard Madoff communiquent très peu sur leurs opérations auprès de leurs collègues directeurs et actionnaires. Le premier lève notamment 2,5 millions de livres sans fournir de plan d’investissement détaillé. Madoff, quant à lui, emploie et surpaye des collaborateurs peu qualifiés afin de décourager les questions sur le fonctionnement interne, et évite les réunions de présentation aux investisseurs pour ne pas avoir à répondre aux interrogations de professionnels avertis. Il recrute plutôt ses investisseurs par le biais de relations philanthropiques et de réseaux personnels. Des éléments suggèrent que certains actionnaires sont en partie conscients des pratiques commerciales douteuses de Hudson, mais ils ne s’y opposent pas initialement.

Lorsque leurs bulles respectives éclatent, ces pratiques commerciales douteuses sont révélées, et il apparaît clairement qu’ils utilisent, selon le système classique de Ponzi, des capitaux frais – et non les bénéfices des investissements – pour verser des dividendes aux investisseurs. Il a également été révélé qu’ils utilisent les fonds des investisseurs pour financer leurs trains de vie luxueux. Hudson aurait détourné environ 750 000 livres (soit environ 74 millions de livres actuelles, soit 85,4 millions d’euros, ndlt), tandis que la fraude de Bernard Madoff a atteint 65 milliards de dollars de pertes déclarées, avec des pertes réelles pour les investisseurs estimées à environ 18 milliards.

Tous deux ont terminé dans la disgrâce : Hudson s’est enfui en France et Madoff est mort en prison.

Sur la piste du renard

Méfiez-vous lorsque vous voyez des entreprises d’IA dont la valeur marchande ne cesse d’augmenter, dirigées par des leaders charismatiques et influents – il est préoccupant que les dirigeants des géants de l’IA entretiennent des relations aussi étroites avec la Maison-Blanche.

Dans ces cas, il est impératif d’analyser la qualité des communications avec les actionnaires et les investisseurs potentiels, notamment en termes d’allocation du capital et de transparence sur les flux de trésorerie détaillés. Il ne suffit pas de se fier aux états financiers audités ; il faut aller beaucoup plus loin dans l’examen de la stratégie d’investissement – ce qui exigera évidemment des auditeurs qu’ils redoublent d’efforts.

Lorsque les investisseurs sont pris dans la frénésie, au coin de la rue attend un Ponzi.


Geneva Walman-Randall a contribué à cet article en tant qu’assistante de recherche sur les conditions entourant les systèmes de Ponzi de Bernie Madoff et de George Hudson. Elle a mené cette recherche en tant qu’étudiante invitée au St. Catherine’s College d’Oxford.

The Conversation

Paul David Richard Griffiths ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

❌