Derrière la fascination pour ChatGPT, Gemini ou Midjourney se cache une mécanique moins reluisante. Dans son rapport « Violations in the Shell », Amnesty International démonte les fondations de ces outils et formule une demande inédite : leur interdiction. Et si le problème n’était pas un défaut, mais le projet lui-même ?
Le vernis et la machine
Tout, dans l’IA générative, semble fluide, intelligent, prodigieux. Mais Amnesty International invite à regarder sous le capot. Son analyse, publiée en 2026, suit la « chaîne d’approvisionnement » de ces technologies — des puces aux centres de données, des annotateur·rice·s aux résultats affichés à l’écran — pour s’arrêter sur le maillon décisif : les données qui les nourrissent.
Le verdict est sans appel. Les grands systèmes génératifs « autonomes » comme ChatGPT, Dall-E, Gemini, Midjourney, LLaMa, Stable Diffusion ou DeepSeek reposent sur l’aspiration massive et non consentie de données publiques. Cette captation, qualifiée de mass invasions of privacy by design — des atteintes massives à la vie privée par conception —, n’est pas un dérapage accidentel : elle est inscrite dans l’architecture même de ces outils. Et c’est précisément là que tout bascule. Car ce que beaucoup présentent comme une prouesse d’ingénierie repose, à la source, sur une illégalité au regard du droit international des droits humains.
Un pillage érigé en méthode
Aspirer le web, c’est aspirer nos vies : photos, textes, créations d’artistes, traces comportementales, le tout sans demander l’avis de quiconque. Amnesty rappelle que Meta aurait absorbé 82 téraoctets de livres piratés pour entraîner LLaMa. Le droit à la vie privée n’est pas effleuré, il est nié à la racine.
Et les conséquences se propagent. Les biais contenus dans ces données colossales ressortent amplifiés : stéréotypes racistes et sexistes, écrasante domination de l’anglais qui marginalise les langues et cultures du Sud global, images truquées de femmes, et — fait glaçant — des contenus pédocriminels générés artificiellement représentant très majoritairement des fillettes.
Les biais ne sont pas des bugs
L’addition continue de s’alourdir. Plus les modèles grossissent, plus ils réclament de données, de puces et d’électricité : les centres de données engloutissent énergie et eau, souvent au détriment de communautés du Sud global qui n’en tireront aucun bénéfice. Sur les réseaux sociaux, ces mêmes modèles, mobilisés pour modérer les contenus, censurent à l’aveugle des publications dans les langues jugées les moins « rentables », faute de traduction fiable. Enfin, à force de présenter leurs réponses avec aplomb, ils émoussent notre esprit critique : la science cognitive montre que l’exposition répétée à une information fabriquée ancre durablement la croyance en celle-ci. La taille d’un modèle nourrit l’illusion de son exactitude.
Comment confier notre mémoire collective à des machines bâties sur le vol ? Comment parler d’innovation lorsque la facture écologique et humaine est expédiée aux plus vulnérables ? Et qui rendra des comptes lorsque la frontière entre le vrai et le fabriqué se sera effacée ?
Une autre IA est possible
Le plus important tient peut-être en une phrase : rien de tout cela n’est inévitable. Amnesty insiste, ces dommages relèvent de choix industriels, pas d’une fatalité technique. Il existe d’autres voies — les petits modèles de langage (SLM), spécialisés, sobres en ressources, entraînés sur des données licites et souvent plus fiables.
L’organisation réclame donc l’interdiction des systèmes génératifs bâtis sur ce pillage, et celle des modèles aux discriminations avérées. La demande est forte, assumée, et elle tranche avec le fatalisme ambiant qui voudrait que l’on s’adapte à ces outils plutôt que de les sommer de respecter le droit. Amnesty exige des États une obligation de transparence et de diligence raisonnable en matière de droits humains, des études d’impact environnemental pour les centres de données, une consultation réelle des communautés concernées et un droit effectif à réparation. Aux entreprises, elle ordonne de cesser l’aspiration non consentie, de publier l’empreinte réelle de leurs systèmes et de retirer du marché les modèles qui discriminent.
Ces garde-fous existent déjà en germe dans le RGPD, le règlement européen sur l’IA ou le DSA. Reste à leur donner des dents. Car une technologie « intelligente » ne devrait pas avoir besoin de piétiner nos droits pour fonctionner.
Au boulot.
#IAgénérative #DroitsHumains #ViePrivée #Amnesty #IAéthique
Attention: « entraîné sur des données licites »
Cet argument est de plus en plus mis en avant, notamment par les éditeurs européens de modèles, les projets se présentant comme « éthiques » et les fournisseurs visant les secteurs régulés (santé, juridique, public). Deux précautions s’imposent. D’une part, licite et fiable ne sont pas synonymes : un corpus du domaine public peut être parfaitement légal sans être à jour ni de qualité. D’autre part, l’affirmation est presque toujours invérifiable de l’extérieur. La plupart des modèles dits « ouverts » (Llama, Gemma, Mistral) ne publient que leurs poids, jamais le détail de leur corpus d’entraînement — impossible donc de l’auditer. Avant de retenir un tel argument, exigez la documentation du modèle (model card) décrivant sources et licences ; son absence est en soi un signal. En somme : une revendication à vérifier sur pièces, et rarement étayée. La charge de la preuve incombe au fournisseur, jamais à vous.