Une startup IA a résolu quatre conjectures mathématiques en décennies via AxiomProver, un système générant des preuves formelles vérifiées en Lean. Étape majeure en démonstration formelle et collaboration IA-mathématique.
Une collaboration historique : Chen rencontre Ono
Dawei Chen, mathématicien, travaille depuis cinq ans sur un problème de géométrie algébrique avec Quentin Gendron. Leur recherche bute sur un obstacle : une formule de théorie des nombres qu’ils ne parviennent pas à justifier. Ils rédigent un article présentant l’impasse comme une conjecture.
Lors d’une conférence mathématique à Washington, Chen expose le problème à Ken Ono, mathématicien spécialiste de théorie des nombres. Le lendemain matin, Ono lui présente une solution — générée par AxiomProver, le système d’IA développé par Axiom, sa nouvelle entreprise.
Cette rencontre résume bien l’approche : l’IA ne résout pas seule des questions mystérieuses, elle assiste des chercheurs en formalisant et validant des intuitions mathématiques qui restaient bloquées.
Les quatre conjectures résolues (février 2026)
Axiom a annoncé ses résultats le 3 février 2026 via arXiv. Chaque preuve a été entièrement formalisée en Lean, un langage de programmation mathématique où chaque étape logique peut être vérifiée par machine.
1. La conjecture Chen-Gendron
Porte sur les k-différentielles, des objets mathématiques complexes sur les surfaces de Riemann. La preuve repose sur une reformulation en termes de symboles de Jacobi, ramenant le problème à une identité combinatoire et à des résultats classiques du XIXe siècle. Elle a été entièrement formalisée en Lean.
2. La conjecture de Fel
Concerne les syzygies — des relations algébriques complexes entre polynômes. Cette conjecture s’appuie sur des formules découvertes par Srinivasa Ramanujan il y a plus de cent ans, notées dans ses carnets et restées sans connexion évidente jusqu’à présent.
AxiomProver n’a pas simplement comblé un maillon manquant : il a construit la démonstration de zéro, à partir du seul énoncé en langage naturel de la conjecture. Scott Kominers, professeur à Harvard Business School et connaisseur du problème, qualifie le résultat d’« astounding ». « C’est remarquable non seulement que AxiomProver ait pu résoudre ce problème automatisé et instantanément vérifié, mais aussi pour l’élégance mathématique produite. »
3 et 4. Deux conjectures en théorie des nombres
Les détails techniques n’ont pas encore été précisés publiquement, mais suivent le même protocole : génération automatique, formalisation Lean, publication sur arXiv pour examen par les pairs.
Comment fonctionne AxiomProver
AxiomProver combine deux éléments clés : un grand modèle de langage capable de raisonner sur des énoncés mathématiques, et un système de vérification formelle en Lean qui garantit que chaque étape de preuve est logiquement correcte.
Le système opère selon deux modes : collaboratif, où l’IA affine les intuitions d’un chercheur humain, et autonome, où il reçoit un énoncé en langage naturel et construit une démonstration complète sans intervention externe. « C’est un nouveau paradigme pour la démonstration de théorèmes », déclare Ken Ono.
Axiom : une startup à forte densité d'expertise
Fondatrice et leadership
Carina Hong, 24 ans, a cofondé Axiom en mars 2025 en quittant son doctorat à Stanford. Rhodes Scholar, elle s’est entourée de chercheurs issus des plus grands laboratoires IA.
Équipe
Shubho Sengupta (CTO)
François Charton, Aram Markosyan, Hugh Leather (anciennement Meta Fundamental AI Research)
Ken Ono, professeur titulaire à l’Université de Virginie
Autres recrutements issus de Google Brain et DeepMind
À seulement 17 employés, Axiom concentre une densité exceptionnelle d’expertise en IA théorique et démonstration formelle.
Financement
64 millions de dollars levés en septembre 2025
Menés par B Capital, avec participation de Greycroft, Madrona Venture Group et Menlo Ventures
Valorisation : environ 300 millions de dollars
Contexte : après AlphaProof de Google DeepMind
En 2024, Google DeepMind avait démontré une approche similaire avec AlphaProof, un système entraîné par apprentissage par renforcement sur des millions de problèmes formalisés. AlphaProof avait atteint le niveau de médaille d’argent aux Olympiades mathématiques internationales (IMO 2024), résolvant trois des six problèmes de compétition.
Les deux systèmes différent sur plusieurs points. AlphaProof cible les problèmes d’olympiade à temps limité ; AxiomProver vise des conjectures de recherche ouverte sans contrainte temporelle. AlphaProof repose sur l’apprentissage par renforcement, tandis qu’AxiomProver combine un LLM et la vérification Lean. Axiom affirme intégrer des avancées techniques significatives, notamment une meilleure capacité à explorer l’espace des preuves et à utiliser Lean efficacement, mais aucune comparaison directe formelle n’a été réalisée entre les deux systèmes.
La perspective des mathématiciens : cautèle et opportunité
Dawei Chen ne voit pas l’IA comme une menace, mais comme un outil complémentaire. « Les mathématiciens n’ont pas oublié les tables de multiplication après l’invention de la calculatrice », rappelle-t-il. Sa vision : « Je crois que l’IA servira d’outil intelligent novateur — ou peut-être est-il plus juste de dire un ‘partenaire intelligent’ — ouvrant des horizons plus riches pour la recherche mathématique. »
Cette posture prudente reflète la réalité : les preuves formalisées en Lean sont vérifiables automatiquement, mais leur acceptation académique définitive dépend de l’examen par les pairs.
Validité académique et applications envisagées
Statut actuel
Les quatre preuves figurent sur arXiv et sont actuellement examinées par les pairs en vue d’une publication dans des revues académiques.
Carina Hong envisage des débouchés au-delà des mathématiques pures : cryptographie, vérification de hardware, finance quantitative. Dans tous ces domaines, les preuves de correction et de sécurité sont critiques. Cependant, aucune mise en production ni client pilote n’a encore été annoncé. L’acceptation définitive par la communauté mathématique reste l’étape décisive pour transformer ces résultats en contributions établies et ouvrir des perspectives commerciales.
FAQ
Qu'est-ce qu'AxiomProver et comment fonctionne-t-il ?
AxiomProver combine un grand modèle de langage avec un système de vérification formelle en Lean, permettant la génération et la validation automatique de preuves mathématiques.
Quelles sont les quatre conjectures résolues par Axiom ?
La conjecture Chen-Gendron (géométrie algébrique), la conjecture de Fel (syzygies polynomiales), et deux problèmes additionnels en théorie des nombres, tous formalisés en Lean et publiés sur arXiv.
Quelle est la différence entre AxiomProver et AlphaProof de Google DeepMind ?
AlphaProof cible les problèmes d’olympiade à temps limité ; AxiomProver vise des conjectures de recherche ouverte sans contrainte temporelle, avec des capacités distinctes d’exploration et d’utilisation de Lean.
Ces preuves sont-elles reconnues par la communauté mathématique ?
Les quatre preuves sont en cours d’examen par les pairs sur arXiv en vue d’une publication académique ; l’acceptation définitive par la communauté reste l’étape décisive.
En 2025, 54 000 licenciements ont été attribués à l’intelligence artificielle aux États-Unis. Un chiffre percutant qui a dominé la couverture médiatique. Pourtant, il ne représente que 4,5 % des 1,2 million de suppressions annoncées cette année. Experts et analystes pointent un phénomène documenté : l’« AI washing », où les responsables justifient des réductions de coûts classiques par une rhétorique technologique commode.
Le Chiffre Qui Masque la Réalité
Selon Challenger, Gray & Christmas, le cabinet de conseils en outplacement américain, exactement 54 694 suppressions d’emploi ont été attribuées à l’IA en 2025. Ce chiffre a circulé largement, créant l’impression que l’automatisation par IA serait déjà massive.
En perspective, il raconte une histoire différente.
Les entreprises américaines ont annoncé 1,2 million de licenciements au total en 2025, une augmentation de 62 % par rapport à 2024. La répartition par motif déclaré révèle la disproportion :
Motif
Nombre
Pourcentage
IA
54 694
4,5 %
Réductions économiques générales
245 000
20,4 %
Tarifs douaniers
8 000
0,7 %
Autres / Non spécifiés
892 306
74,4 %
L’IA dominait donc le débat public et la rhétorique, sans être le facteur quantitatif dominant. Ce décalage entre visibilité narrative et poids statistique mérite explication.
Quand la Promesse Dépasse la Réalité
Forrester Research offre un diagnostic clé. Son rapport de janvier 2026 prévoit que 6,1 % des emplois américains seront automatisés d’ici 2030, soit environ 10,4 millions de rôles.
Or le constat de Forrester est sans ambiguïté : beaucoup de sociétés annonçant des licenciements pour raison d’IA n’ont pas d’applications d’IA matures et validées prêtes à remplir ces rôles.
JP Gownder, vice-président chez Forrester, décrit le problème sans détour :
Si vous n’avez pas une application d’IA mature, déployée et opérationnelle pour faire le travail, il pourrait vous falloir 18 à 24 mois pour remplacer cette personne par l’IA. Si cela fonctionne, bien sûr.
Ce laps de temps critique éclaire l’essentiel : les licenciements sont annoncés aujourd’hui, sous couvert d’IA future. Forrester appelle cela de l’« AI washing » : attribuer des réductions financièrement motivées à la mise en œuvre future d’IA.
Les Aveux des PDG : Quand la Rhétorique Cède
Les rétropédalisations des dirigeants corroborent ce diagnostic.
Amazon
En octobre 2025, Amazon annonçait 14 000 suppressions d’emploi, justifiées par un cadre d’IA et de transformation. Une vice-présidente affirma que l’IA était « la technologie la plus transformatrice depuis Internet ».
Trois mois plus tard, le PDG Andy Jassy nuançait considérablement. Questionné, il reconnaissait :
Ce n’est pas vraiment financièrement motivé, ce n’est pas vraiment porté par l’IA en ce moment. C’est vraiment une question de culture.
Duolingo
En avril 2025, le PDG Luis von Ahn annonçait que l’entreprise « cesserait progressivement d’employer des prestataires pour accomplir des tâches que l’IA peut gérer ».
Quatre mois plus tard, interrogé par le New York Times, il clarifiait :
Depuis le départ, nous employons des prestataires pour des tâches temporaires, et notre force de travail de prestataires augmente ou diminue selon les besoins. L’entreprise n’a jamais licencié d’employés à temps plein.
Le framing initial suggérait une modernisation technologique ; la réalité était simplement des fluctuations contractuelles normales.
Pourquoi Blâmer l'IA Plutôt que les Tarifs ou la Rentabilité
Martha Gimbel, du Yale Budget Lab, propose une explication crédible. Elle note que les tarifs douaniers, annoncés sous l’administration Trump, ont été cités dans moins de 8 000 cas de licenciements, un chiffre étrangement bas.
La plupart des économistes vous diraient que c’est implausible. ChatGPT a été lancé il y a seulement trois ans.
Elle pousse l’analyse plus loin :
Vous voyez une véritable hésitation chez certains secteurs de l’Amérique d’entreprise à dire quoi que ce soit de négatif sur les impacts économiques de l’administration Trump, car ils craignent qu’il y ait des conséquences. En affirmant que les licenciements sont dus aux nouvelles efficacités créées par l’IA, vous évitez cette réaction potentiellement hostile.
Le Yale Budget Lab a analysé les données d’emploi national. Résultat : aucune corrélation statistique entre l’adoption d’IA et les pertes d’emploi. Les patterns d’emploi sont restés inchangés malgré le déploiement croissant d’IA.
Les Trois Vrais Motifs
Si l’IA n’est pas la cause principale, qu’est-ce qui pousse à ces licenciements ?
Surembauche pandémique. Pendant la crise COVID-19, à taux d’intérêt nuls, les entreprises ont recruté massivement. Cette correction était structurelle et inévitable : un ajustement normal après une anomalie.
Objectifs de rentabilité. Le secteur technologique fait face à une pression croissante d’investisseurs pour montrer une croissance des bénéfices. Les licenciements réduisent les coûts fixes et gonflent les marges à court terme.
Tarifs et incertitude commerciale. Bien que rarement cités ouvertement, les tarifs douaniers et l’incertitude macroéconomique jouent un rôle significatif.
L’IA offre à ces rationalités une couverture attrayante : elle semble objective (technologie, pas décision management), future-proof (un problème de demain, pas aujourd’hui), et vertueuse (modernisation, compétitivité).
Quand l'IA Paraît Réellement Crédible
L’« AI washing » n’est pourtant pas universel. Il existe des cas où l’automatisation par IA semble plausible.
Fabian Stephany, chercheur au Internet Institute d’Oxford, établit une distinction :
Le travail décrit — en particulier le support en ligne et client — est, en termes de tâches et compétences requises, relativement proche de ce que les systèmes d’IA actuels peuvent accomplir.
Salesforce
Marc Benioff, PDG de Salesforce, a annoncé réduire son personnel de support client de 9 000 à 5 000 grâce à des agents d’IA. Stephany juge ce cas plausible : le support client est un domaine où l’IA apporte une automatisation réelle, à la différence de fonctions comme la recherche, le management ou les tâches d’expertise, où les modèles de langage peinent.
La Voix des Licenciés
Une ancienne directrice de programme chez Amazon, licenciée en octobre 2025, décrivait son profil ainsi :
J’avais développé certains outils spécifiquement pour mon équipe et quelques équipes clients, ce qui aidait peut-être à permettre à une personne plus junior de faire une partie du travail.
Mais le départ était un calcul de coûts, non une automatisation :
C’est qu’ils allaient prendre quelqu’un payé beaucoup moins pour faire ce travail. J’ai été licenciée pour réduire les coûts de main-d’œuvre.
Le rôle n’a pas disparu. Il a été rempli par un employé moins cher. C’est de l’optimisation salariale, non de l’automation.
L'Inflexion Attendue
Forrester anticipe un tournant dans son rapport « Predictions 2026 ». Prévision clé : la moitié des licenciements attribués à l’IA pourraient être annulés, certains postes retrouvés (offshore ou à salaires réduits) quand les entreprises réaliseront que l’IA n’a pas livré ses promesses de productivité.
C’est une projection, non un constat établi. Mais elle reflète une conviction croissante chez les analystes : la majorité des suppressions annoncées pour raison d’IA ont été prématurées.
Naviguer l'Hype : Trois Enseignements
L’IA a bel et bien un impact sur l’emploi et l’aura davantage. Mais cet impact est plus lent, plus sélectif et moins spectaculaire que ne le suggère la rhétorique dominante.
Où l’IA progresse réellement : Support client, écriture technique, traitement de données structurées.
Où l’IA peine : Management, recherche complexe, créativité requérant un jugement humain, tâches d’expertise transversales.
La question structurelle demeure : les dirigeants sont-ils incités à inventer une nouvelle justification pour des décisions qui relèvent de logiques classiques ? Les données suggèrent un mécanisme ancien — réduction de coûts, correction de surembauche, pression des actionnaires — habillé d’un langage nouveau.
Pour le lecteur, trois réflexes : écouter les annonces des CEOs sur l’IA avec scepticisme constructif, demander des preuves d’automatisation réelle plutôt que des annonces, attendre 18 à 24 mois de recul avant de croire à la transformation affirmée.
Le futur technologique du travail s’écrit en vrai, pas en communiqué de presse.
FAQ
Combien de licenciements ont réellement été causés par l'IA en 2025 ?
Les 54 000 licenciements imputés à l’IA représentent moins de 5 % des 1,2 million de suppressions annoncées en 2025. Selon Forrester, beaucoup d’entreprises n’ont pas d’applications d’IA réellement déployées.
Qu'est-ce que l'« AI washing » ?
C’est l’attribution de réductions d’effectifs motivées par des raisons financières à une automatisation par IA future, sans applications matures existantes.
Pourquoi les CEO justifient-ils les licenciements par l'IA plutôt que par les tarifs ou la rentabilité ?
L’IA semble objective, future-proof et vertueuse. Elle offre une couverture plus acceptable politiquement et médiatiquement que l’aveu d’optimisation salariale ou de pression des investisseurs.
Quels secteurs connaissent réellement une automatisation par l'IA ?
Le support client et l’écriture technique, où les systèmes d’IA actuels peuvent accomplir les tâches de manière crédible. Ailleurs, l’IA peine à égaler la productivité annoncée.
Combien de temps faut-il vraiment pour automatiser un rôle par l'IA ?
Entre 18 et 24 mois pour avoir une application d’IA mature et opérationnelle. Or, les licenciements sont annoncés immédiatement.
La culture 996 (9h–21h, six jours par semaine), née en Chine, ressurgit en Occident porté par la compétition sur le marché de l’IA. Des startup comme Rilla et Browser-Use affichent ouvertement leurs exigences de 70 heures hebdomadaires. Or, la science invalide massivement cette pratique : au-delà de 50 heures, la productivité stagne, tandis que les risques de maladies cardiovasculaires et d’AVC grimpent de 35 %.
Le modèle 996 : une importation involontaire d'une controverse chinoise
La culture 996 n’est pas nouvelle. À partir des années 2010, Jack Ma d’Alibaba la présentait comme une « bénédiction énorme » et Richard Liu de JD.com la défendait comme le marqueur de l’ambition authentique. Pour les fondateurs chinois, ces horaires extrêmes symbolisaient non pas l’exploitation, mais l’engagement envers l’excellence.
Cette rhétorique s’est heurtée à un tournant critique. Entre 2019 et 2021, des millions de salariés chinois ont protesté publiquement. Des plateformes numériques se sont remplies de récits sur les décès liés à l’épuisement professionnel (karōshi, terme japonais consacré). En réaction, les autorités chinoises ont resserré la régulation. La justification publique du 996 est devenue taboue — au point que Qu Jing, directrice de la communication de Baidu, s’est attiré des ennuis en 2024 en postant des vidéos défendant le travail intensif. Elle a perdu son emploi.
Mais tandis que la Chine institutionnalisait le rejet de 996, un nouvel acteur ravivait le modèle : l’écosystème de la technologie occidentale, sous la pression de l’IA.
Comment la compétition IA relance les semaines de 70 heures en Occident
Deux exemples emblématiques incarnent cette tendance.
Rilla, startup new-yorkaise d’environ 120 salariés, affiche candidement dans ses offres d’emploi : « Ne postulez pas si vous n’êtes pas enthousiaste à l’idée de travailler environ 70 heures par semaine ». Will Gao, responsable de la croissance, décrit les profils recherchés en termes olympiens : « Nous cherchons des gens comme des athlètes olympiques, avec des caractéristiques d’obsession et d’ambition infinie ». Les annonces promettent repas gratuits et accès à une salle de sport — des avantages destinés à justifier les longues heures sur site.
Browser-Use, basée à Hambourg avec sept salariés, pousse le ton plus loin. Magnus Müller, co-fondateur, recherche des candidats « complètement accros », pour qui le travail « ne ressemble pas vraiment à du travail, c’est un jeu ». Ceux qui veulent une semaine de 40 heures, affirme-t-il, « ne rentreront probablement pas dans le profil ».
Pourquoi maintenant ? L'urgence perçue du marché de l'IA
Adrian Kinnersley, recruteur spécialisé dans le secteur technologique, l’explique clairement : « C’est principalement les entreprises d’IA qui sont dans une course pour développer leurs produits et les mettre sur le marché avant que quelqu’un d’autre ne les devance ». Cette course s’articule autour d’un levier puissant : le capital-risque illimité et la pression du marché.
Deedy Das, investisseur au fonds Menlo Ventures, reconnaît d’emblée que « pour les fondateurs eux-mêmes, ayant pris de gros risques et espérant devenir très riches si l’entreprise réussit, différentes règles s’appliquent ». Les heures extrêmes pour un propriétaire fondateur ne surprennent personne.
Une confusion logique que reconnaissent les investisseurs
Das soulève néanmoins une contradiction au cœur du modèle : « Je pense que là où les jeunes fondateurs se trompent, c’est qu’ils considèrent les heures travaillées en soi comme une condition nécessaire et suffisante de productivité. C’est là que réside l’erreur. »
Cette erreur s’étend à l’ensemble de la chaîne. Si les fondateurs travaillent 70 à 80 heures, la pression culturelle irradie. Les investisseurs valorisent la « traction rapide » (growth-at-all-costs). Les salariés, particulièrement les jeunes sans famille, sans ancres régionales ou dépendants d’un visa de travail, font face à une équation implicite : adhérez à la culture ou partez.
Ce que la science dit réellement de la productivité et des heures travaillées
C’est ici que le récit des startup heurte des faits solidement établis.
Productivité : le plafond existe
Des chercheurs de l’université du Michigan ont étudié cette relation : « À environ 40 heures par semaine sur cinq jours, les travailleurs peuvent maintenir leur productivité relativement bien. Mais au-delà, leur rendement s’affaiblit progressivement à cause de la fatigue accumulée ».
Conclusion clé : un salarié travaillant 70 heures par semaine produit quasi autant qu’un travaillant 50 heures.
Un test grandeur nature le confirme. En 2022, au Royaume-Uni, 61 organisations ont participé à un essai de semaine de quatre jours sur six mois. Les résultats :
Stress et absentéisme en baisse
Rétention des talents améliorée
Productivité stable (pas de perte)
Risques sanitaires : l'alarme de l'OMS et l'OIT
En 2021, l’Organisation mondiale de la santé et l’Organisation internationale du travail ont publié une analyse conjointe :
Métrique
Risque
vs. Baseline
———-
——–
————
Décès par maladie cardiaque
+17 %
35–40h/semaine
Accident vasculaire cérébral
+35 %
35–40h/semaine
Heures considérées dangereuses
55h+ par semaine
—
Cette surexposition aurait causé 745 000 décès mondiaux en 2016.
Le Japon reconnaît légalement le karōshi (décès par surmenage) ; la Corée en débat l’ampleur.
L'absence de corrélation : le mot des experts
Ben Wilmott, responsable de la politique publique auprès de la Confederation of British Industry and Professional Managers, est catégorique : « Il n’existe aucune corrélation entre le nombre d’heures travaillées et la productivité. Il y a plutôt de bonnes preuves que travailler longtemps accroît les risques de problèmes de santé. L’accent devrait être sur travailler plus intelligemment plutôt que plus longtemps. »
Consentement affiché, coercition silencieuse : la dynamique de pouvoir occultée
Tamara Myles, experte en culture d’entreprise, ajoute une nuance souvent occultée : « Ces entreprises tech qui vivent cette culture 996 ne la cachent pas ; elles la vendent comme un badge d’honneur ».
Mais elle pointe une dynamique de pouvoir invisible : « Vous pourriez rester parce que le marché du travail est difficile en ce moment, ou parce que vous êtes là pour un visa et dépendez de l’emploi. Des dynamiques de pouvoir peuvent donc être en jeu. »
Autrement dit : le consentement affiché masque parfois une coercition silencieuse.
Le discours interne minore l’effort en parlant de flexibilité temporelle. Will Gao raconte : « Si j’ai une super idée sur laquelle je travaille, je vais juste continuer jusqu’à 2h ou 3h du matin, puis je rentre le jour suivant à midi ». L’image suggère une autonomie — on travaille quand on est inspiré. La réalité sous-jacente : les 70 heures restent obligatoires.
Cadre légal : pourquoi 996 est légal en Occident, mais non en Chine
Au Royaume-Uni : l'opt-out permet la dérogation
La loi plafonne la semaine moyenne à 48 heures, mais les salariés peuvent signer une dérogation écrite pour travailler plus. Un opt-out consenti par écrit rend 996 légale. C’est ainsi que Rilla et Browser-Use opèrent sans transgression formelle en sol britannique.
Aux États-Unis : aucune régulation fédérale
L’absence de plafond fédéral offre une liberté encore plus large. Aucune régulation comparable à celle du Royaume-Uni ne s’applique — ce qui explique pourquoi les startup IA US affichent leurs pratiques sans crainte légale majeure.
En Chine : le revirement institutionnel
La Chine, berceau de 996, a resserré légalement en 2021. Le modèle y est devenu officiusement indéfendable, même s’il persiste dans les faits.
Une ironie historique : le retour de ce qu'on croyait dépassé
Il y a un siècle, Henry Ford a donné l’exemple inverse. Dans les années 1920, le fondateur de la manufacture automobile a réduit les horaires de ses usines et adopté une semaine de 40 heures sur cinq jours. Cette décision, révolutionnaire pour l’époque, reposait sur un calcul : les ouvriers reposés étaient plus productifs et moins enclins à quitter l’emploi. Ford avait compris que l’intensité ne remplace pas l’efficacité.
Cent ans plus tard, l’écosystème de la Silicon Valley réinvente la roue en sens inverse. La différence majeure : Ford innovait en humanité. Les startup IA font pression sous couvert de nécessité technologique.
La question sans réponse : que deviennent les salariés ?
Reste une question centrale restée sans réponse documentée : combien de temps cette intensité tient-elle ?
Rilla compte 120 salariés ; Browser-Use, sept. Aucune donnée publique n’existe sur les taux de départ, les diagnostics de burnout ou la satisfaction à douze mois.
Les histoires que partagent Will Gao et Magnus Müller reflètent peut-être un noyau dur de fondateurs motivés par l’actionnariat. Elles ne décrivent pas nécessairement l’expérience du salarié lambda, recruté à 25 ans, sans stock-options, travaillant pour un salaire fixe.
Adrian Kinnersley l’affirme : « Vous auriez du mal à concurrencer avec une culture de 35 heures dans l’environnement actuel ». Peut-être.
La vraie question reste ouverte
Combien de temps avant qu’une startup IA aux normes humaines (40 à 50 heures, télétravail, stabilité familiale) sorte un produit meilleur qu’une Rilla épuisée ?
Ce signal ne s’est pas encore manifesté, mais il attend juste le bon produit-marché, le bon timing et le bon capital patient.
Conclusion
Pour l’heure, les startup IA US ont choisi : elles importent la culture 996 chinoise, non parce qu’elle fonctionne, mais parce que la compétition laisse croire qu’on n’a pas le choix.
La science suggère le contraire. Henry Ford le savait. Le reste, c’est juste du brouillard par inertie.
FAQ
Qu'est-ce que la culture 996 et d'où vient-elle?
Un modèle de travail « 9h à 21h, six jours par semaine » popularisé par Jack Ma et Richard Liu en Chine à partir des années 2010.
Pourquoi les startup IA occidentales adoptent-elles les semaines de 70 heures?
La compétition extrême sur le marché de l’IA crée une urgence perçue; les fondateurs estiment que les heures travaillées garantissent la productivité.
Qu'en dit la science sur la productivité au-delà de 50 heures?
Aucune corrélation n’existe; la productivité plafonne vers 40–50h/semaine. Au-delà, elle stagne à cause de la fatigue accumulée.
Quels sont les risques sanitaires documentés du surmenage?
L’OMS et l’OIT rapportent +17% de risque de décès cardiaque et +35% de risque d’AVC pour une semaine de 55h+ vs 35–40h.
Est-ce légal en Occident de proposer ou d'exiger des semaines de 70 heures?
Au Royaume-Uni: oui avec une dérogation écrite. Aux États-Unis: oui, aucun plafond fédéral. En Chine: désormais officiellement rejeté depuis 2021.
La législature de New York examine deux projets de loi pour réguler l’IA générative. Le NY FAIR News Act impose des labels obligatoires et une validation humaine du contenu généré par IA dans la presse. Le second, S9144, suspend l’octroi de permis pour les nouveaux data centers durant trois ans, justifié par une crise énergétique croissante.
NY FAIR News Act : labels et validation éditoriale obligatoires
Le projet NY FAIR News Act (New York Fundamental Artificial Intelligence Requirements in News Act) encadre l’utilisation de l’IA générative par les organisations médiatiques.
Labellisation et contrôle éditorial
Tout contenu « substantiellement composé, rédigé ou créé » par IA générative doit porter une mention explicite. Plus important : la loi exige qu’une personne disposant du contrôle éditorial examine et approuve chaque contenu avant publication. Cette obligation préserve la chaîne de validation du journalisme, même lorsque l’IA participe à la création.
Protection des sources et transparence interne
La loi ajoute deux garde-fous :
Révéler aux salariés comment et quand l’IA intervient dans la production éditoriale.
Protéger les données confidentielles, notamment l’identité des sources, en interdisant leur consultation par les systèmes d’IA.
Cette dernière mesure défend un principe fondamental du journalisme : le secret des sources.
S9144 : trois ans de suspension pour les data centers
Le second projet, S9144, gèle l’émission de permis pour les nouveaux data centers pendant au moins trois ans.
La crise énergétique comme déclencheur
La raison invoquée : la montée des tarifs électriques et gaziers pour résidents et entreprises. Con Edison, le principal distributeur régional, a obtenu une augmentation tarifaire de 9 % étalée sur trois ans, directement répercutée sur les factures.
National Grid New York prévoit qu’au moins 10 gigawatts de capacité électrique supplémentaire seront nécessaires dans les cinq ans. Le moratoire vise à freiner cette pression énergétique en limitant temporairement l’ajout d’infrastructures gourmandes.
Deux régulations complémentaires pour un enjeu systémique
Ces deux projets abordent sous des angles différents l’impact croissant de l’IA générative :
NY FAIR News Act : encadre les risques de désinformation et la perte de contrôle éditorial dans les médias.
S9144 : s’attaque à une conséquence massive et indirecte : la surcharge des réseaux électriques provoquée par les data centers nécessaires pour entraîner et exécuter les modèles d’IA.
New York n’est pas isolée. Partout aux États-Unis, la consommation énergétique des data centers croît plus vite que la capacité des grilles. En combinant ces deux initiatives, New York signale une stratégie double : encadrer l’usage éditorial de l’IA et maîtriser son empreinte énergétique.
Calendrier flou et détails en suspens
Ces deux projets sont « en attente d’examen » par le Sénat de New York, mais aucune date de vote n’a été confirmée. L’avancement réel, les amendements possibles et les chances d’adoption demeurent incertains.
Les éventuelles exemptions — data centers essentiels (santé, services critiques) ou catégories médiatiques spécifiques — n’ont pas été clarifiées publiquement.
Néanmoins, ces initiatives marquent un changement : plutôt que d’attendre des directives fédérales, New York agit sur deux fronts — responsabilité éditoriale et soutenabilité énergétique. C’est le signe d’une régulation régionale qui anticipe les défis matériels de l’IA générative, bien au-delà de ses usages éditoriaux.
FAQ
Qu'est-ce que le NY FAIR News Act ?
Loi imposant des labels obligatoires sur le contenu généré par IA dans les médias, avec obligation de révision humaine avant publication.
Pourquoi New York instaure-t-elle un moratoire sur les data centers ?
Pour freiner la hausse des tarifs énergétiques, amplifiée par la demande croissante liée à l’IA et aux data centers.
Quand ces lois seront-elles votées ?
Aucune date officielle n’a été annoncée. Les projets sont en attente d’examen par le Sénat de New York.
Qui doit approuver le contenu généré par IA sous le NY FAIR News Act ?
Une personne disposant du contrôle éditorial avant la publication.
Combien de data centers New York compte-t-elle actuellement ?
Plus de 130 data centers sur son territoire, avec une demande de connexion qui a triplé en un an.
TSMC transfère la production de puces 3nm, ses technologies les plus avancées, de Taïwan au Japon. Le PDG C.C. Wei a annoncé jeudi 5 février que la deuxième usine de Kumamoto produirait désormais ces puces critiques pour l’IA, plutôt que des technologies matures. Un investissement de 17 milliards de dollars qui redessine la géographie mondiale des semiconductors.
TSMC transfère sa production 3nm au Japon : du plan initial à la révision stratégique
TSMC révise profondément sa stratégie pour Kumamoto. La deuxième usine, en construction, devait produire des puces 6 à 12 nanomètres, des technologies matures moins complexes. L’investissement était évalué à 12,2 milliards de dollars.
Le nouvel objectif change radicalement : passer au 3 nanomètres, la deuxième génération la plus avancée du marché, jusque-là exclusive à Taïwan. L’enveloppe budgétaire grimpe à 17 milliards de dollars selon le quotidien japonais Yomiuri Shinbun, que TSMC n’a pas confirmé officiellement.
« Nous pensons que cette usine contribuera davantage à la croissance économique locale et, surtout, formera une base pour les activités liées à l’IA au Japon », a déclaré le PDG de TSMC.
Une architecture à deux niveaux
Cette nouvelle orientation se comprend avec Kumamoto Fab 1, la première usine japonaise de TSMC, opérationnelle depuis décembre 2024. Elle produit actuellement des puces 12 à 28 nanomètres pour les capteurs d’image, l’électronique automobile et les circuits de contrôle industriel.
Avec Fab 2 en 3nm, TSMC crée une architecture cohérente : une base de technologies matures doublée d’une ligne d’avant-garde pour les applications critiques.
Usine
Technologie
Lancement
Secteurs
Fab 1
12–28 nm
Décembre 2024
Auto, capteurs, contrôle industriel
Fab 2
3 nm
2026–2027 (supposé)
IA, data centers
Trois facteurs expliquent cette accélération
L’explosion de la demande mondiale pour l’IA constitue le premier levier. Les data centers se multiplient, les modèles de langage exigent des capacités de calcul massives, et l’IA envahit l’électronique grand public. TSMC subit une pression irrésistible sur ses capacités 3nm, concentrées jusqu’à présent à Taïwan.
La saturation des capacités taïwanaises pose un risque critique. Avec une seule île fabricant la quasi-totalité des puces 3nm mondiales, TSMC court un goulot d’étranglement majeur. Ouvrir une deuxième source réduit cette vulnérabilité, accélère les délais de livraison et sécurise l’approvisionnement IA global.
La dimension géopolitique finalise le tableau. Localiser en régions alliées — Japon, États-Unis — offre à TSMC une couverture face aux tensions autour de Taïwan et aux contrôles à l’exportation. Produire localement signale à Washington et Tokyo une volonté de renforcer la sécurité des chaînes d’approvisionnement.
TSMC construit désormais un triptyque stratégique : Taïwan (centre technologique avec le 2nm), Kumamoto (hub IA japonais en 3nm), Arizona (production américaine en 2nm à partir de 2027).
Un coup politique majeur pour le Japon
L’annonce intervient trois jours avant les élections législatives japonaises du 8 février. Sanae Takaichi, ministre du cabinet en charge des semiconductors et de la revitalisation régionale, en récolte un bénéfice politique immédiat.
Le gouvernement avait désigné l’IA, la robotique et la conduite autonome comme secteurs stratégiques. Avec TSMC en 3nm, le Japon renforce son crédibilité industrielle et sa capacité technologique.
En parallèle, le Japon soutient Rapidus, une entreprise visant à produire du 2nm en Hokkaido d’ici 2027. Cette approche double positionne le Japon comme acteur majeur de la fabrication de semiconductors critiques, partenaire fiable des États-Unis et des alliés occidentaux.
Takaichi a souligné : « Les puces 3nm revêtent une grande importance pour la sécurité économique. » Le Japon entend réduire sa dépendance vis-à-vis des importations taïwanaises et américaines.
Zones d'ombre et défis d'exécution
Plusieurs paramètres critiques demeurent non résolus : le calendrier exact de démarrage (annoncé pour 2026–2027 sans précision), le volume mensuel de production (confidentiel), les subsidies gouvernementales supplémentaires (non formalisées), et la viabilité à long terme de Fab 1, qui connaît des débuts laborieux.
Fab 1 est restée sous-utilisée par rapport à ses capacités, insuffisamment soutenue par la demande automobile et industrielle. L’arrivée de Fab 2 en 3nm IA risque de creuser une asymétrie : une usine ancienne marginalisée, une usine neuve stratégiquement vitale. TSMC devra équilibrer cet écosystème pour justifier les deux investissements.
Reproduire les rendements 3nm en Kumamoto, respecter les délais annoncés et convaincre les clients IA, en tête NVIDIA, de diversifier leurs sources : trois défis majeurs se profilent avant la fin 2027.
La fin de la concentration taïwanaise
Cette annonce entérine un tournant stratégique majeur : la fin de la concentration absolue de la fabrication de pointe en Taïwan. TSMC distribue désormais ses technologies critiques sur trois continents.
Le Japon, longtemps marginalisé dans la chaîne de valeur des semiconductors modernes, retrouve un rôle stratégique crucial pour l’ère de l’IA. L’ambition affichée est claire ; la réalité industrielle confirmera ou démentira ces attentes.
FAQ
Pourquoi TSMC bascule sa deuxième usine japonaise à 3nm ?
Pour répondre à l’explosion de la demande IA, réduire la saturation taïwanaise, et diversifier géographiquement les technologies critiques face aux tensions géopolitiques.
Quand la production 3nm démarrera-t-elle à Kumamoto Fab 2 ?
Aucune date officielle, mais une arrivée en 2026 ou début 2027 est supposée.
Quel est l'investissement total pour Kumamoto Fab 2 ?
17 milliards de dollars selon la presse japonaise (hausse de 4,8 Md$ par rapport au plan initial).
Comment s'articulent Kumamoto Fab 1 et Fab 2 ?
Fab 1 (depuis décembre 2024) produit du mature-node (12–28 nm) ; Fab 2 produira du 3nm IA, créant une architecture double au Japon.
Quel est l'impact géopolitique pour le Japon ?
Le Japon devient hub avancé de semiconductors critiques, aux côtés de Taïwan et des États-Unis, renforçant sa sécurité économique et sa position IA.
Seulement 5 % des entreprises ont déployé des agents IA en production. Ce n’est pas un problème de capacité des modèles, mais d’infrastructure. L’injection de prompts, l’exfiltration de données, l’escalade de privilèges : ces risques ne sont pas théoriques. Deux ans après le boom de l’IA générative, l’isolation du code, la gouvernance et la conformité restent les goulots d’étranglement critiques. Ce guide consolide la pile technique qui émerge en 2026 — technologies de sandboxing, plateformes, frameworks de conformité, patterns opérationnels — pour transformer ces 5 % en stratégie reproductible.
Pourquoi seulement 5 % des entreprises déploient des agents en production
Le paradoxe est flagrant. Les modèles de langage génèrent du code avec une précision impressionnante. Les frameworks orchestrent des workflows complexes. Pourtant, 95 % des projets d’agents restent bloqués en phase pilote, et 47 à 53 % de ceux déployés fonctionnent sans supervision active.
La raison n’est pas technique au sens classique. C’est un trilemme : sécurité vs performance vs simplicité opérationnelle. Choisissez deux. Vous sacrifierez le troisième.
La sécurité d'abord
Un agent IA peut générer et exécuter du code arbitraire. Pas du code prévisible. Du code que vous ne pouvez pas anticiper au moment du déploiement. Donner à un processus non supervisé la permission d’accéder à une base de données de production, à un système de fichiers, ou au réseau revient à confier un terminal root à un apprenti.
Les conteneurs classiques offrent une isolation au niveau du processus — insuffisant si l’agent s’échappe via une vulnérabilité du noyau. Les microVMs Firecracker isolent au niveau du matériel avec un démarrage en 150 ms, mais ajoutent 20 à 30 % de latence. gVisor offre un compromis à 100–150 ms avec 10 à 20 % d’overhead — acceptable, mais pas gratuit.
La performance ensuite
Les clients attendent des réponses en secondes, pas en minutes. Un agent qui met 5 secondes à démarrer son bac à sable, 10 secondes à initialiser son environnement d’exécution, et 2 secondes pour chaque appel d’outil finit par sembler lent même s’il résout le problème correctement.
À cette latence s’ajoute le coût : une microVM par requête, c’est une instance CPU dédiée multiplié par le trafic concurrent. Les conteneurs sont plus rapides et moins chers. Mais ils vous ramènent au problème de sécurité.
La simplicité enfin
Déployer un agent sécurisé implique des décisions architecturales imbriquées : choix de la technologie d’isolation, configuration du réseau (deny-by-default pour les sorties ?), audit des outils autorisés, vérification des modèles d’accès, définition des escalades, validation de la conformité (GDPR, HIPAA, EU AI Act, SOC2).
Chaque couche ajoutée requiert expertise. Les équipes startup manquent de bandwidth. Les grandes organisations se noient dans les cycles d’approbation.
Résultat : les entreprises restent en pilot. Elles font fonctionner des agents sur des données synthétiques, dans des environnements contrôlés, sans accès réseau, et cherchent un moyen d’évoluer sans prise de risque. Cette fragmentation du marché de l’infrastructure — avec une dizaine de plateformes de sandboxing concurrentes, chacune avec sa propre API, ses propres limites, ses propres tarifs — a ralenti l’adoption. Jusqu’à maintenant.
Landscape des menaces : injection de prompts, supply chain, exfiltration
La sécurité des agents n’est pas une menace abstraite. L’OWASP a publié son Top 10 pour applications agentic en janvier 2026. Deux CVE récentes illustrent la réalité de production.
Injection de prompts : le risque principal
L’injection de prompts ne ressemble pas aux injections SQL classiques. Avec SQL, les syntaxes d’attaque et légitime sont distinguables. Vous pouvez filtrer, échapper, valider.
Avec les prompts, l’attaque est du langage naturel. L’agent ne peut pas mathématiquement différencier une instruction d’un utilisateur autorisé d’une instruction cachée dans un document qu’on lui demande de traiter.
Cas réel : GitHub Copilot (CVE-2025-53773). Une page web publique contenait du texte blanc sur fond blanc : des instructions d’attaque que l’utilisateur ne voyait pas. Copilot, scrappant la page pour du contexte, lisait le texte invisible, l’exécutait, et renvoyait des réponses compromises.
Cas réel : Vanna.AI (CVE-2024-5565). Un agent SQL générait du code Python exécuté directement contre une base de données. Un utilisateur injectait un prompt malveillant dans sa requête. Vanna.AI le traitait comme une instruction légitime, générait du Python contenant du code d’exfiltration, et l’exécutait. Pas de bac à sable. Pas de validation. Données perdues.
L’OWASP cite un taux de succès de 84 % pour les injections de prompts via la framework Hackode. Dans 84 % des cas testés, l’injection contournait ou modifiait le comportement attendu de l’agent.
Fuite de données : supply chain et exfiltration réseau
Les agents IA utilisent des outils — appels d’API, requêtes de base de données, accès au système de fichiers. Chaque outil est un vecteur potentiel de fuite.
Supply chain. Quel package npm, PyPI, ou crate le générateur de code du LLM utilise-t-il ? Les modèles hallucinent — ils inventent des références de packages qui n’existent pas. Selon IKANGAI, 19,7 % des références de packages mentionnées par les LLMs sont hallucinations. L’agent télécharge un package requests-secure-auth au lieu de requests ? C’est une vraie vulnérabilité de typosquatting, générée par le LLM lui-même.
Exfiltration réseau. Un agent non supervisé avec accès réseau peut lancer des requêtes sortantes n’importe où. DNS, HTTP, WebSocket — tous les canaux de sortie constituent des vecteurs d’exfiltration.
Trust entre agents
Dans les systèmes multi-agents, les agents parlent les uns aux autres. 82,4 % des LLMs vont exécuter un appel d’outil malveillant si demandé par un autre agent, même si ce même appel aurait été rejeté s’il provenait d’un utilisateur direct.
Implication directe : isoler chaque agent n’est pas suffisant si les agents se font confiance mutuellement. Vous devez établir des limites de confiance explicites entre agents, signer les appels d’outils, et conserver des traces d’audit immuables.
OWASP Top 10 Agentic : les dix risques majeurs
L’OWASP énumère dix risques majeurs pour les agents. Les quatre premiers — injection de prompts, fuite d’information sensible, mauvais usage d’outils, surcharge de ressources — sont directement atténués par le sandboxing. Les autres requièrent des contrôles applicatifs en plus.
Isolation technology 101 : Firecracker vs gVisor vs conteneurs vs WebAssembly
Pour comprendre comment choisir, il faut d’abord comprendre ce que chaque technologie offre.
Conteneurs Docker classiques
Un conteneur Docker n’isole que au niveau du processus. Il utilise les namespaces Linux pour créer l’illusion de machines séparées, mais partage le noyau hôte. Si un attaquant échappe à l’application via une CVE du noyau, il compromet tous les conteneurs sur cette machine.
Métrique
Performance
—
—
**Cold start**
~50 ms
**Overhead**
2–5 %
**Isolation**
Faible (kernel shared)
**Écosystème**
Extrêmement mature
gVisor (Google Sandbox)
gVisor est une couche d’application qui intercepte les appels système du conteneur et les exécute de manière sécurisée. Au lieu de transmettre directement l’appel au noyau hôte, gVisor implémente sa propre version Linux compatible mais isolée.
Métrique
Performance
—
—
**Cold start**
100–150 ms
**Overhead**
10–20 % CPU
**Isolation**
Moyen-élevée (résiste CVE noyau)
**Écosystème**
Google Cloud Run, Modal, Vercel Functions
Firecracker microVMs
Firecracker est un hyperviseur allégé créé par AWS pour les fonctions Lambda. Chaque exécution lance une microVM entière — son propre noyau Linux, son propre système de fichiers, son propre PID 1 — isolée au niveau du matériel via KVM.
Métrique
Performance
—
—
**Cold start**
~150 ms
**Overhead**
20–30 %
**Isolation**
Très élevée (hardware KVM)
**Écosystème**
E2B, AWS Lambda, AWS Fargate
Kata Containers
Kata combine les avantages de Firecracker et de gVisor. Elle utilise des hyperviseurs allégés pour isoler les conteneurs au niveau du matériel, tout en restant compatible avec Docker et Kubernetes.
Métrique
Performance
—
—
**Cold start**
~200 ms (dépend du pull d’image)
**Overhead**
15–25 %
**Isolation**
Très élevée (hardware KVM)
**Écosystème**
Kubernetes-native, CNCF
WebAssembly (Wasm)
WebAssembly n’isole pas au niveau du système d’exploitation. C’est une sandbox au niveau du langage — le code Wasm s’exécute dans une machine virtuelle qui contrôle la mémoire, l’accès aux outils, les appels système.
Métrique
Performance
—
—
**Cold start**
<10 ms
**Overhead**
Minimal
**Isolation**
Élevée (VM-level)
**Écosystème**
Wasmtime, Wasmer, Deno (émergent)
Tableau comparatif
Technologie
Cold Start
Overhead
Isolation
Agents untrusted
—
—
—
—
—
**Conteneurs**
~50 ms
2–5 %
Faible
Non
**gVisor**
100–150 ms
10–20 %
Moyen-élevé
Oui (SaaS)
**Firecracker**
~150 ms
20–30 %
Très élevée
Meilleur choix
**Kata**
~200 ms
15–25 %
Très élevée
Oui (K8s)
**WebAssembly**
<10 ms
Minimal
Élevée
À venir
Comparaison des plateformes : E2B, Modal, Daytona, Northflank
Le marché converge sur une liste courte de fournisseurs. Chacun a un positionnement différent.
E2B : Firecracker optimisé pour agents
Positionnement : Plateforme spécialisée pour exécuter du code d’agents IA. Démarrage ultra-rapide.
E2B utilise Firecracker microVMs avec cold start de 150 ms. Elle propose des SDK pour Python et JavaScript avec intégrations natives LangChain, OpenAI, Anthropic. Tarification : $0.05/vCPU-heure, usage-based, sessions jusqu’à 1 heure gratuitement, 24 heures en payant.
Forces : Démarrage ultra-rapide, intégrations par défaut avec frameworks agent populaires, tarification transparente.
Faiblesses : Limite de session 24 heures en payant, BYOC non mature.
Modal : gVisor + GPU, approche serverless
Positionnement : Plateforme serverless pour workloads ML et agents. GPU inclus. Scaling automatique.
Modal utilise gVisor avec cold start <100 ms. Elle est Python-first et permet de déployer directement depuis Jupyter. GPU H100 disponible à $3.95/hr. Scaling automatique géré en backend.
Positionnement : Plateforme d’exécution d’entreprise. Isolation Kata (hardware KVM). Support BYOC.
Northflank utilise Kata Containers pour isolation hardware-level. Elle autorise BYOC (Bring Your Own Container) pour contrôle image. Sessions illimitées. Tarification all-in ~$2.74/hr H100. Orientée entreprise avec SOC2, SLA.
Forces : BYOC, isolation Kata (hardware KVM), tarification all-in plus claire, audit trail SOC2.
Faiblesses : Cold start plus lent (dépend du pull d’image), moins d’automatisation que Modal.
Faiblesses : Moins mature, transparence pricing/SLA inférieure.
Matrice décisionnelle
Besoin
Menace
Latency
Priorité
Recommandation
—
—
—
—
—
Agents court-lived ultra-rapides
Élevée
<150ms
Performance
E2B
ML inference + agents
Moyenne
Flexible
GPU
Modal
Multi-tenant enterprise
Élevée
Acceptable
BYOC
Northflank
Agents stateful long-lived
Moyenne
Flexible
État
Daytona
MCP : standardisation et interopérabilité cross-platform
Jusqu’en 2024, chaque plateforme d’exécution avait son propre SDK, son propre modèle d’intégration d’outils. Vous codiez un agent pour Modal ? Vous redéployez entièrement pour E2B.
En janvier 2025, la Linux Foundation a lancé l’Agentic AI Foundation. Anthropic a donné à la Fondation le Model Context Protocol (MCP) — un standard ouvert pour les agents à déclarer et invoquer des outils, accéder aux données, gérer le contexte.
Qu'est-ce que MCP ?
MCP est un protocole transport-agnostique (JSON-RPC sur stdio, HTTP, WebSocket). Un agent dit : « Je dois lire des fichiers. Je dois appeler une API Stripe. Je dois interroger une base de données. » Le protocole standardise comment décrire ces besoins et comment exécuter les outils.
Avant MCP : Redéploiement complet, réécriture agent.
Après MCP : Même code. Changez le transport (E2B vs. Modal vs. Northflank). Pas de réécriture.
Avantages
Interopérabilité. Un agent écrit pour E2B peut migrer vers Modal en changeant une variable d’environnement.
Écosystème décentralisé. Tiers peuvent publier des serveurs MCP pour leurs services (Stripe, Salesforce, Slack). Les agents les découvrent sans SDK propriétaire.
Prévention du vendor lock-in. Vous ne dépendez pas d’une plateforme d’exécution unique. Vous négociez tarifs, SLA, isolation — sachant rester portable.
Adoption 2026
Anthropic Claude est MCP-native depuis janvier 2025. LangChain et LlamaIndex intègrent le support MCP. Modal et Northflank commencent à publier des serveurs MCP. Stripe, GitHub, Linear, Salesforce ont annoncé ou lancé serveurs MCP.
Impact stratégique : Le marché fragmenté converge autour d’un standard. Les PME peuvent enfin changer de fournisseur sans réécriture.
Gouvernance et conformité : OWASP, NIST, GDPR, EU AI Act
Un agent techniquement isolé n’est pas un agent conforme. La conformité émerge d’une pile réglementaire multidimensionnelle.
OWASP Top 10 Agentic Applications 2026
L’OWASP identifie les risques critiques. Pour les agents, elle recommande des contrôles : sandboxing, allowlist stricte des outils, masquage de PII en logs, audit trail immuable, rétention policy.
L’OWASP ne prescrit pas une solution. Elle propose une matrice risques × contrôles. Vous taillez les contrôles au profil de risque.
NIST AI Risk Management Framework 1.0
NIST structure la gouvernance IA en quatre piliers : Govern → Map → Measure → Manage.
Govern : Créer une charte d’agents approuvés, définir les rôles, publier les policies.
Manage : Escalader incidents, retirer agents dériving, corriger et redéployer.
NIST est prescriptif mais non obligatoire aux USA. Il devient le baseline de facto pour SOC2 Type II.
GDPR et données de l'UE
Déployez un agent en UE ou traitant des données d’UE-residents ? GDPR s’applique.
Les logs d’agent sont des données de traitement. Vous devez : accepter consentement, chiffrer les logs, appliquer rétention, offrir droit d’accès et oubli.
Implication : Les résidents UE peuvent demander une copie de toutes les données traitées ; ils peuvent demander suppression.
EU AI Act et classification high-risk
L’EU AI Act (2024, en vigueur 2025) classe les systèmes IA en fonction du risque. Les agents autonomes déterminant l’accès au crédit, l’emploi, les allocations sociales sont high-risk. Les amendes montent jusqu’à €35M ou 7 % du chiffre d’affaires global.
Pour les high-risk agents, l’UE impose :
Risk assessment documentation : Preuve que vous avez évalué les risques.
Testing & validation : Test des décisions ; red-teaming.
Human-in-the-loop oversight : Un humain approuve les décisions impactantes.
Incident notification : Signaler les incidents graves sous 72 heures.
SOC2 Type II pour agents
Tout audit SOC2 Type II couvre maintenant les systèmes IA. Les auditeurs vérifient : RBAC strict, monitoring, incident response, audit trail immuable.
Les fournisseurs d’exécution d’agents produisent des rapports SOC2 ; c’est un facteur de sélection critique pour acheteurs enterprise.
Patterns Human-in-the-Loop : gouvernance et escalade
Aucun agent ne devrait être 100 % autonome dès le jour 1. L’escalade humaine n’est pas une régression. C’est une architecture saine.
Les quatre phases d'autonomie
Phase 1 : Read-Only + Approval du tout
L’agent accède à des données, les lit, génère des rapports, mais ne modifie rien sans approbation. Coût humain : élevé. Time-to-value : long. Transparence : maximale.
Phase 3 : Autonomie de routine, supervision événementielle
L’agent fonctionne entièrement autonome, mais envoie des digests et alerte sur anomalies. L’humain revoit et peut intervenir proactivement. Coût humain : bas. Time-to-value : très rapide.
Phase 4 : Autonomie complète, audit rétroactif
L’agent décide et agit sans humain. L’audit rétroactif capture l’activité. Coût humain : minimal. Risque : dérive sans supervision. Seulement pour agents low-risk.
Critères de décision
Réversibilité : L’action peut-elle être annulée ?
Fréquence : Combien de fois par jour ?
Impact business : Si l’agent se trompe, quel coût ?
Trace audit : Pouvez-vous tracer qui a ordonné quoi ?
Patterns techniques
Escalade webhook : Agent génère action → envoie webhook à système d’approbation. Approver valide → agent procède/rejette.
Fallback mode : Si approver non-respond dans N secondes, escalade à autre approver. Jamais de deadlock.
Observabilité et monitoring : sept outils pour la télémétrie des agents
Les agents non supervisés ne sont pas seulement une menace sécurité. Ils sont une menace commerciale. Un agent qui dépense 10× le budget d’API prévu — ces problèmes ne sont pas des CVE. Ce sont des anomalies comportementales.
Arize — ML observability specialisé. Détecte data drift, prediction drift, tool call patterns, cost monitoring, red-teaming intégrée. Idéal pour : orgs avec many deployed agents.
Splunk — Ingère logs, recherche temps réel, alertes. Module Splunk AI Observability dédié agents. Idéal pour : enterprise Splunk existant.
Datadog — APM + logs + traces. Support agents IA émergent. Idéal pour : infra Kubernetes multi-tenant.
Vellum — Plateforme end-to-end agents. Gestion versions prompts, A/B testing, observabilité. Idéal pour : PME/startup, une pane of glass.
Azure AI Foundry — Suite Microsoft agents. Monitoring auto, HITL workflows, audit trail. Idéal pour : enterprise Microsoft stack.
Mythes et réalités de la sécurité des agents (8 points)
Mythe 1 : Les conteneurs suffisent. Réalité : Conteneurs partagent le noyau hôte. Une CVE du noyau = escape. Pour code LLM-généré, il faut microVM ou gVisor.
Mythe 2 : Les guardrails en prompt suffisent. Réalité : Guardrails n’enferment rien. Sandboxing pour sécurité. Les deux nécessaires.
Mythe 3 : L’air-gapping = sécurisé. Réalité : Prévient exfiltration réseau mais pas escape local. Combinez avec isolation + policy.
Mythe 4 : Propriétaire = plus sûr. Réalité : Sécurité dépend architecture, pas ownership. Choisissez sur capacité. Ajoutez sandboxing indépendamment.
Depuis 2024, les grands groupes mondiaux attribuent massivement leurs réductions d’effectifs à l’intelligence artificielle. Pourtant, les données économiques racontent une histoire très différente : l’IA ne représente que 4,5 % des licenciements enregistrés. Enquête sur ce mensonge par omission stratégique.
Qu'est-ce que l'AI Washing ? Une rhétorique stratégique
Le terme « AI washing » décrit une pratique simple mais efficace : attribuer des décisions commerciales défaillantes — surembauche mal gérée, mauvaise stratégie, ou simple ajustement de marché — à l’intelligence artificielle plutôt qu’à des erreurs de direction.
Contrairement à la fraude déclarée, il ne s’agit pas toujours de mensonge volontaire. C’est un usage stratégique du flou.
Cas d'école : le discours unifié des géants technologiques
Les exemples se multiplient rapidement. En mai 2025, Klarna annonce que son effectif a diminué de 40 % en partie grâce à l’IA. Salesforce réduit de 4 000 ses postes d’assistance client, affirmant que l’IA peut accomplir 50 % de ce travail. Pinterest, Meta, Microsoft : le discours s’unifie autour d’une même justification.
La vérité sous-jacente ? Les entreprises ont embauché frénétiquement pendant la pandémie, puis doivent corriger le tir. Mais dire « nous nous sommes trompés » aux investisseurs et aux salariés ? C’est trop coûteux pour une valorisation boursière. L’IA devient le responsable idéal d’une réalité bien plus prosaïque.
Les chiffres réels : le grand écart avec le discours
L'IA représente 4,5 % des licenciements
Entre janvier et novembre 2025, selon Oxford Economics et Challenger, Gray & Christmas, les chiffres parlent d’eux-mêmes :
55 000 licenciements attribués à l’IA
245 000 réductions liées aux « conditions de marché »
Part réelle de l’IA : 4,5 %
Les véritables causes ? Le ralentissement de la consommation, les taux d’intérêt élevés, la surembauche post-pandémie — facteurs largement documentés mais infiniment moins séduisants pour les marchés financiers.
Aucune perturbation macroéconomique observable
En février 2026, le Yale Budget Lab publie une enquête qui devrait refroidir les prophètes de l’apocalypse technologique :
Aucune perturbation macroéconomique visible du marché du travail
L’occupational mix (répartition des emplois entre secteurs et compétences) reste stable
Le chômage des métiers exposés à l’IA n’a pas augmenté
Paradoxe glaçant : 71 % des Américains interrogés par Reuters et Ipsos en août 2025 craignent de perdre leur emploi à cause de l’IA. L’anxiété est réelle, massive, documentée. Mais les preuves économiques du cataclysme annoncé ? Elles n’existent pas.
Martha Gimbel, économiste au Yale Budget Lab, le formule sans détour : « Aucune façon de regarder les données qui montre des effets macroéconomiques majeurs à ce moment précis. Si vous êtes directeur général, vous ne dites pas ‘j’ai mal géré la situation macroéconomique’. Vous dites ‘le monde change rapidement, il faut nous redimensionner’. »
Pourquoi les CEO choisissent cette rhétorique
L’équation est transparente : invoquer l’IA, c’est transformer une faiblesse managériale en adaptation forward-looking.
Les investisseurs récompensent les coupes d’effectifs (signal d’efficacité immédiate). L’IA, c’est le futur, l’innovation, la promesse. Combiner les deux dans un même discours offre une formule irrésistible pour les marchés financiers.
Admettre publiquement une surembauche, c’est voir sa crédibilité tomber. Blâmer l’IA, c’est se placer du côté des gagnants de demain. C’est un scapegoat parfait : le phénomène est réel, suffisamment flou pour défier les preuves immédiates, et assez lointain pour que les conséquences se manifestent trop tard pour être vérifiées.
Le vrai coût caché : la workslop
Mais voilà qui complique le narratif : la charge opérationnelle réelle de l’IA existe bel et bien.
Qu'est-ce que la workslop ?
En novembre 2025, Zapier publie une enquête auprès de 1 100 salariés d’entreprises de 250+ collaborateurs. Les résultats décrivent un phénomène majeur : la workslop — les défaillances, imprécisions et erreurs générées par l’IA, qui demandent ensuite des heures de correction manuelle.
Les chiffres alarmants
58 % des travailleurs passent plus de 3 heures par semaine à refaire ou corriger les outputs de l’IA. 35 % passent plus de 5 heures par semaine. En moyenne : 4,5 heures par semaine — soit plus d’une demi-journée de travail — consacrées au nettoyage des dégâts.
Les tâches les plus touchées : l’analyse de données (55 %), la recherche et rédaction (52 %), les communications client (46 %). Autrement dit, les tâches critiques.
Les conséquences négatives mesurées
74 % de ces travailleurs ont connu au moins une conséquence négative directement causée par une défaillance IA : travail rejeté par un collègue, fuite de données, plainte client, délai manqué, problème de conformité.
Les équipes finance et comptabilité sont les plus frappées : 4,6 heures par semaine de cleanup, 85 % en subissant les conséquences.
Le paradoxe central
Or, et c’est le paradoxe qui rend l’AI washing si audacieux : 92 % de ces mêmes travailleurs affirment que l’IA booste leur productivité.
Même avec cinq heures hebdomadaires de nettoyage, même en gérant les crises. L’IA n’est donc pas inutile — elle transforme réellement le travail. Mais elle génère une charge cachée que personne ne compte dans le bilan officiel.
Comment fonctionne l'astuce
C’est ici que l’AI washing révèle son astuce :
Les entreprises crient sur les toits les gains d’efficacité supposés
Elles invoquent l’IA pour justifier les réductions d’effectifs
Elles ne parlent jamais de cette workslop
Les 4,5 heures hebdomadaires de correction manuelle ? Elles sont absorbées par le salarié restant — l’un des peu à avoir survécu à la vague de licenciements. Voilà comment l’IA réduit nominalement les effectifs sans réduire réellement le travail.
La fatigue à l'IA s'installe chez les consommateurs
Les consommateurs aussi commencent à voir clair dans ce jeu.
Une étude de la Washington State University, relayée par CNET en 2025, révèle un phénomène mesurable : l’inclusion du mot « IA » dans une description de produit réduit l’intention d’achat. Les consommateurs relient désormais « IA » à l’inflation de promesses creuses.
45 % des consommateurs refusent de payer un abonnement ou une fonctionnalité qualifiée « IA ». 25 % les trouvent carrément inutiles. Carl Pei, fondateur de Nothing, a envisagé d’éliminer le terme « IA » de ses produits, tellement le mot s’était chargé de désenchantement.
Pendant ce temps, 56 % des entreprises — selon PwC — admettent n’avoir obtenu « absolument rien » de leurs investissements IA jusqu’à présent.
Paradoxe vertigineux : on licencie pour l’IA, on blâme l’IA pour les coupes, mais on reconnaît secrètement que l’IA n’a rien livré.
Les régulateurs commencent à tirer la sonnette
Les premières poursuites
La SEC, l’agence américaine de régulation boursière, n’a pas tardé à remarquer. En mars 2024, elle a poursuivi deux sociétés : Global Predictions et Dellia. Le motif : elles promettaient une IA capable de prédire les performances de marché, puis ne livraient rien de fondé. Les fausses promesses relevaient de la fraude en valeurs mobilières. Le message était clair : dire « on a de l’IA » ne suffit pas ; il faut livrer.
Gary Gensler, alors président de la SEC, a déclaré en octobre 2025 : « L’AI washing peut violer les lois sur les valeurs mobilières. »
Le flou réglementaire persiste
Pourtant, et c’est crucial, aucun cas SEC majeur n’a encore visé directement l’AI washing dans les licenciements. Le cadre réglementaire reste vague : existe-t-il une ligne entre « hype marketing » et « mensonge punissable » ? Où passe-t-elle ? Nul ne le sait avec certitude.
De plus, l’arrivée au pouvoir de l’administration Trump, traditionnellement favorable à la déréglementation, jette une ombre sur la trajectoire de cet enforcement. Accélération ou ralentissement : la question reste ouverte.
Gagnants et perdants du jeu
L’AI washing crée des vainqueurs et des vaincus bien distincts.
Gagnants court-termistes : directeurs généraux qui font crédible auprès des investisseurs et des conseils d’administration, cabinets de conseil qui vendent massivement des projets de « transformation IA », vendeurs d’outils IA qui surfent le buzz.
Perdants : salariés licenciés sur justifications floues ou falsifiées, qui subissent une perte d’emploi sans compréhension réelle de sa cause ; consommateurs confrontés à des produits lancés à la hâte avec un label « IA » qui ne signifie rien ; chercheurs et développeurs en IA véritable dont le signal devient noyé dans le bruit ; régulateurs eux-mêmes dont la crédibilité s’érode face à un phénomène qu’ils peinent à saisir légalement.
Trois scénarios d'évolution
Scénario A : l'AI washing persiste
La SEC multiplie les cas de poursuites, mais reste marginale (moins de 5 par an). Les CEO continuent à manier le flou. Les consommateurs se détournent davantage des produits estampillés « IA ». La crédibilité des entreprises se fissure progressivement.
Scénario B : une vraie récession accélère l'adoption de l'IA
Soudain, l’occupational mix se déplace visiblement. Le chômage augmente dans certains secteurs. L’IA n’est plus un scapegoat commode : elle devient une vraie perturbation observable. L’AI washing devient inutile, remplacé par un vrai débat sur les impacts technologiques. La régulation accélère.
Scénario C : le backlash collectif
Les 74 % de travailleurs ayant subi des conséquences négatives de l’IA, combinés à l’épuisement du public face au hype, entraînent un repli. Les investissements IA ralentissent. L’innovation subit. Le contrôle public s’intensifie, mais sur une technologie devenue moins attrayante.
Les signaux clés à surveiller
Comment savoir si l’AI washing persiste ou s’effondre ?
Enforcement régulateur : la cadence des poursuites SEC dépasse-t-elle 10 cas majeurs en 2026 ?
Impact réel sur l’emploi : l’occupational mix du BLS se déplace-t-il sensiblement pour certains rôles ?
Communication d’entreprise : le mot « IA » dans les appels aux investisseurs disparaît-il ou s’intensifie-t-il ?
ROI mesurable : les données PwC et Gartner rapportent-elles du ROI réel ou persistons-nous dans les promesses ?
Cadre légal : de nouvelles lois d’obligation de transparence sur l’IA en recrutement vont-elles émerger ?
Sentiment collectif : les sondages Reuters et Ipsos montrent-ils un repli de la peur de l’IA ou son intensification ?
Conclusion : le flou comme arme
L’AI washing n’est pas tant un mensonge déclaré qu’un usage stratégique du flou. Les entreprises ne disent pas formellement « c’est l’IA qui a licensié ces gens ». Elles disent « nous nous adaptons à l’ère de l’IA », ce qui est techniquement vrai.
Elles exploitent l’absence de régulation claire, l’anxiété publique massifiée, et le fait que les preuves macroéconomiques d’un cataclysme IA n’existent pas encore. Mais cette stratégie fabrique ses propres contradictions. Elle génère une charge opérationnelle massive (les 4,5 heures de workslop par semaine). Elle érode la confiance des consommateurs et des salariés. Elle finit par réveiller les régulateurs.
Le Yale Budget Lab dit « pas de perturbation encore ». Mais le MIT dit que c’est techniquement possible. Goldman Sachs dit que 6 à 7 % de la main-d’œuvre pourrait être déplacée si l’adoption accélère. Et Martha Gimbel, l’économiste du Yale Budget Lab, le formule avec une candeur troublante : « Le monde change vite. On se redimensionne. »
Jusqu’à présent, le redimensionnement était blâmé sur l’IA. Demain, si l’IA vraiment fonctionne, le blâme ne suffira plus.
FAQ
Qu'est-ce que l'AI washing exactement ?
L’AI washing est une pratique qui consiste à attribuer des décisions commerciales défaillantes — surembauche mal gérée, mauvaise stratégie, ou simple ajustement de marché — à l’intelligence artificielle plutôt qu’à des erreurs de direction. C’est un usage stratégique du flou plutôt qu’un mensonge déclaré.
Combien de licenciements sont réellement dus à l'IA selon les données économiques ?
Entre janvier et novembre 2025, selon Oxford Economics et Challenger, Gray & Christmas, l’IA ne représente que 4,5 % des licenciements enregistrés, avec 55 000 licenciements attribués à l’IA contre 245 000 réductions liées aux conditions de marché.
Qu'est-ce que la workslop et quel impact a-t-elle sur les travailleurs ?
La workslop désigne les défaillances, imprécisions et erreurs générées par l’IA qui demandent ensuite des heures de correction manuelle. En moyenne, 58 % des travailleurs passent plus de 3 heures par semaine à refaire ou corriger les outputs de l’IA, et 74 % ont connu au moins une conséquence négative directement causée par une défaillance IA.
La SEC poursuit-elle les entreprises pour AI washing ?
La SEC a poursuivi deux sociétés (Global Predictions et Dellia) en mars 2024 pour des promesses de résultats IA infondées, mais aucun cas SEC majeur n’a encore visé directement l’AI washing dans les licenciements. Le cadre réglementaire reste vague.
Quels sont les signaux à surveiller pour détecter si l'AI washing persiste ?
Les signaux clés incluent la cadence des poursuites SEC, les déplacements observables du occupational mix du BLS, l’évolution de la mention « IA » dans les communications d’entreprise, le ROI réel rapporté par les études, l’émergence de nouvelles lois de transparence, et les tendances de sentiment collectif dans les sondages.
Nitto Boseki produit le T-glass, un tissu de fibre de verre caractérisé par un coefficient d’expansion thermique ultra-bas. Sans ce matériau, les substrats qui hébergent les processeurs se déforment sous la chaleur et les GPU crashent. L’entreprise contrôle entre 60 et 70 % du marché mondial.
Nitto Boseki contrôle 60-70% de la production mondiale de T-glass, un matériau critique pour les puces IA
Le T-glass est intégré dans les substrats des GPU Nvidia, TPU Google et puces Apple
L’entreprise adopte une stratégie délibérée de rareté plutôt que d’augmenter sa production
Des alternatives (Taiwan Glass, Nan Ya Plastics, Grace Fabric Technology) tentent de concurrencer mais restent loin derrière
La Chine investit massivement dans l’énergie et développe des alternatives domestiques au T-glass
Le monopole invisible : pourquoi Nittobo contrôle l'avenir des data centers
Nitto Boseki (Nittobo) produit le T-glass, un tissu de fibre de verre caractérisé par un coefficient d’expansion thermique ultra-bas. Cette propriété technique masque une réalité physique immédiate : sans T-glass, les substrats qui hébergent les processeurs se déforment sous la chaleur. Les connexions électroniques s’écrasent. Les GPU crashent.
L’entreprise contrôle entre 60 et 70 % du marché mondial du T-glass avancé. Ses deux concurrents directs, Asahi Kasei et Asahi Glass, partagent le reste. Mais c’est Nittobo qui détient les secrets manufacturiers — un avantage technique remontant à plus de 40 ans.
« T-glass est difficile à fabriquer, et il ne sera pas facile pour les concurrents de rattraper Nittobo dans un avenir proche », explique Noritsugu Hirakawa, analyste chez Daiwa Securities. Ce n’est pas une hyperbole : chaque fibre doit être plus fine qu’un cheveu humain, parfaitement circulaire, sans la moindre bulle d’air. Les rendements de production demeurent fragiles. Les nouveaux entrants qui tentent de reproduire le processus font face à des taux de rebut catastrophiques.
Asymétrie de puissance : une tiny company qui commande les géants
Nittobo génère un revenu net annuel de 37 millions de dollars environ — une somme modeste comparée aux géants de la tech. Pourtant, ce petit fabricant textile influe directement sur la stratégie d’expansion de Nvidia, Apple, Google et Amazon.
C’est un cas quasi-textuel de domination asymétrique : une entreprise de taille mineure exerce un contrôle stratégique sur des acteurs infiniment plus puissants.
Pourquoi le T-glass est critique pour les puces d'IA
Le T-glass n’est pas un matériau exotique utilisé occasionnellement. Il est intégré dans l’infrastructure critique des puces modernes.
Les substrats intégrés (« IC substrates ») qui accueillent les GPU Nvidia, les TPU Google et les puces d’Apple reposent largement sur deux technologies : l’ABF (Ajinomoto Build-up Film) et les substrats BT (bismalimiide-triazine).
Le T-glass, en tant que tissu, forme la couche de renforcement structural. Lorsqu’une puce dissipe des centaines ou des milliers de watts dans un data center, le substrat subit des cycles de chauffage et de refroidissement intenses. Sans stabilité dimensionnelle, sans cette propriété de très faible expansion thermique, le matériau se déforme. Les connexions microscopiques se rompent. C’est un mécanisme d’échec mécanique brutal.
Applications actuelles du T-glass
Au-delà des data centers IA, le T-glass s’utilise aussi dans les iPhones premium, les équipements de packaging avancé (CoWoS) et les systèmes de communication haute fréquence.
Depuis l’explosion de la demande en serveurs d’IA (2023–2024), la hiérarchie d’allocation s’est rigidifiée : les clients des puces GPU et TPU obtiennent la priorité.
La pénurie : une stratégie délibérée de rareté
Nitto Boseki aurait facilement pu accélérer sa production face à la demande exponentielle du boom IA. Ce n’est pas le cas. Le CEO Hiroyuki Tada a adopté une stratégie explicite : ne pas « étendre la capacité au même rythme que le marché de l’IA ».
En langage d’affaires, c’est une stratégie de niche premium : maintenir une rareté artisanale, exploiter les prix élevés, privilégier les marges à la croissance. Quoi que propose Apple, Nvidia ou Google, la réponse reste non.
Calendrier de dégagement (vs. attentes du marché)
Les délais de mise en ligne de nouvelles lignes de production ont glissé d’année en année. Fin 2025, Nittobo promettait une augmentation significative courant 2026. Or, la plupart des sources presse spécialisées considèrent ces promesses comme partielles.
La pénurie s’étendra vraisemblablement jusqu’en 2027.
Cette scarcité a déclenché un arbitrage visqueux et peu documenté chez les fabricants de substrats. Apple, qui commande du T-glass pour les iPhones depuis longtemps, se voit dépassée dans la file d’attente par Nvidia et les fabricants de GPU. Le géant de Cupertino a envoyé des équipes à Tokyo à l’automne 2025 pour négocier directement avec Nittobo, sans résultat notable selon les rapports de presse.
L'arithmétique cachée : hiérarchie d'accès et perdants
Le T-glass révèle la hiérarchie invisible du pouvoir d’accès technologique.
Nvidia et les hyperscalers jouissent d’une priorité de facto. Les data centers clients — Amazon Web Services, Google Cloud, Microsoft Azure — déploient leurs budgets pour sécuriser les H100 et H200, même si le T-glass se raréfie. Mitsubishi Gas Chemical, principal fabricant de substrats utilisant le T-glass de Nittobo, oriente ses productions vers les clients de Nvidia d’abord.
Fabricants de puces secondaires (Qualcomm, AMD, Apple) ont le pouvoir d’achat, mais pas la priorité absolue.
Consumer electronics est reléguée en dernier recours. Électronique grand public, téléphones mobiles, écrans sont affectés en premier. Goldman Sachs prévoit des déficits de deux chiffres pour le T-glass destiné aux substrats BT durant les prochains trimestres.
Les alternatives : entre promesses et obstacles technologiques
Plusieurs entreprises tentent de briser le monopole de Nittobo. Aucune n’a réussi à ce jour.
Taiwan Glass a récemment certifié une fibre Low-Dk (faible constante diélectrique) destinée aux substrats PCB. C’est un début. Mais le Low-Dk n’est pas le T-glass : les propriétés thermiques restent inférieures. Taiwan Glass accumule de l’expérience, mais la courbe d’apprentissage s’étire.
Nan Ya Plastics (groupe Formosa, Taiwan) annonce qu’elle pourrait atteindre environ 20 % de la capacité de production de Nittobo d’ici 2027. Ce chiffre reste conditionnel — il dépend des résultats d’essais qualité en cours et de l’absence de problèmes de rendement à l’échelle.
Grace Fabric Technology, basée en Chine et partiellement contrôlée par Mitsubishi Gas Chemical, se positionne comme une alternative domestique. Aucune production en volume n’a été confirmée. Les risques industriels demeurent aigus.
Barrière technologique : pourquoi la concurrence tarde
Chaque fibre de verre doit mesurer quelques microns de diamètre (plus fine qu’un cheveu), sa section doit être parfaitement circulaire, sans aucune imperfection. Les équipements de production eux-mêmes exigent une maîtrise ultra-précise. Les rendements chez les nouveaux entrants oscillent entre 60 et 70 %, contre 85 à 90 % chez Nittobo.
Personne n’est prêt à risquer une montée en charge de puces IA haute-gamme sur un substrat de qualité inférieure. La marge d’erreur est zéro.
L'angle géopolitique : la Chine et la captation énergétique
Pendant que l’Occident négocie avec une petite entreprise textile au Japon, la Chine avance sur un front stratégiquement imbriqué : l’énergie.
En 2025, la Chine a construit 543 gigawatts de nouvelle capacité électrique — plus que la totalité des centrales électriques de l’Inde. Depuis 2022, cumulée, cette capacité surpasse celle du réseau électrique américain complet.
66 % de cette expansion provient des énergies renouvelables (solaires et éoliennes), 34 % du charbon pour la sécurité d’approvisionnement.
Ce que cela signifie concrètement : la Chine a éliminé une limite critique pour la fabrication de semi-conducteurs et l’entraînement des modèles IA à grande échelle. Data centers et usines de production requièrent de l’électricité continue, massive et bon marché.
Les États-Unis et l’Europe demeurent bridés par débats de permis, considérations environnementales et infrastructure vieillissante.
L'asymétrie stratégique
Si la Chine maîtrise la production énergétique et développe des alternatives au T-glass, elle disposera d’un avantage structurel : fabriquer sans contrainte d’énergie, itérer rapidement, muscler son infrastructure d’IA, s’affranchir de la dépendance au T-glass de Nittobo.
Pendant ce temps, Nvidia, Apple et Google négocient avec une entreprise textile japonaise pour accéder à un matériau sans lequel leurs puces ne fonctionnent pas. Le contraste symbolise une réalité géopolitique : la domination technologique du 21e siècle ne sera pas décidée sur les algorithmes, mais sur le contrôle des matériaux, de l’énergie et de la supply chain.
Trois scénarios pour 2027
Scénario 1 : Statu quo prolongé (probabilité dominante)
Nittobo reste le fournisseur majeur avec une expansion marginale. Nan Ya Plastics atteint effectivement 20 % de la capacité, mais le scaling reste asymptotique. Les alternatives chinoises demeurent expérimentales. Le T-glass reste un bien rare. Les prix restent élevés. Nvidia, Google et Amazon s’assurent un accès sécurisé via contrats long terme. Apple et les fabricants de consumer electronics voient leurs délais s’allonger.
Nitto Boseki capitalise sur sa position. Ses marges explosent. Aucun acteur n’a les moyens de contourner le monopole par la force.
Q-glass, une alternative basée sur le quartz, sort enfin des laboratoires. Ses propriétés rivalisent avec le T-glass et son coût diminue suffisamment pour justifier une adoption en masse. Ou Grace Fabric Technology déverrouille un processus qui améliore les rendements et permet une montée en charge. Le relief s’accélère. La rareté recule.
Cet scénario s’appuie sur des innovations réelles, actuellement en cours, mais sans calendrier confirmé.
Tensions entre les États-Unis et la Chine autour de la supply chain. Restrictions d’export du Japon envers la Chine ou vice-versa ; favoritisme de Nittobo envers certains alliés. Représailles chinoises. La supply chain se fragmente en deux sphères — occidentale et sino-centrique. La Chine accélère les alternatives domestiques. L’Occident sécurise son accès auprès de Nittobo par contrats stratégiques. Chacun construit son périmètre fermé. Les prix et les délais s’en ressentent.
Ce que cela change pour vous
Le T-glass n’est pas un sujet réservé aux ingénieurs d’électronique. C’est une fenêtre sur la fragilité de la chaîne d’approvisionnement mondiale qui alimente l’IA.
Si vous achetez un iPhone (2026–2027), ce que vous ne verrez jamais — mais qui aura contribué au délai de production ou au coût final — est un matériau. Un tissu de fibre de verre, mesuré en microns, produit au Japon par une entreprise que vous ne connaissiez pas.
Si vous exploitez une infrastructure cloud d’IA, vous déployez des GPU Nvidia, entraînez des modèles — vous accédez en priorité à ce matériau. Votre accès sécurisé repose sur un pouvoir d’achat suffisant pour négocier avec Nittobo. Les startups et les acteurs du tiers-monde n’ont pas cet accès. C’est une forme de gate-keeping invisible, qui n’apparaît jamais sur les feuilles de spécifications des processeurs.
Si vous travaillez en Chine dans les semi-conducteurs, vous avez peut-être un avantage : l’électricité pour fabriquer, l’urgence stratégique pour développer des alternatives, et la capacité industrielle à itérer rapidement. Quand l’Occident attend du T-glass, vous construisez en parallèle.
Conclusion
C’est ainsi que le matériel dicte la géopolitique de l’IA. Nitto Boseki, entreprise textile centenaire, en est devenue une pièce centrale — par une technicité que personne ne remarque jusqu’à ce qu’elle manque.
FAQ
Qu'est-ce que le T-glass et pourquoi est-ce critique pour l'IA ?
Le T-glass est un tissu de fibre de verre caractérisé par un coefficient d’expansion thermique ultra-bas. Il forme la couche de renforcement structural des substrats qui accueillent les GPU et autres puces IA. Sans T-glass, les substrats se déforment sous la chaleur et les connexions électroniques s’écrasent, causant l’arrêt des processeurs.
Qui produit le T-glass et quel est son marché ?
Nitto Boseki (Nittobo) contrôle entre 60 et 70 % du marché mondial du T-glass avancé. Ses deux concurrents directs sont Asahi Kasei et Asahi Glass, qui partagent le reste. Nittobo détient les secrets manufacturiers depuis plus de 40 ans, ce qui lui confère un avantage technique difficile à rattraper.
Pourquoi Nitto Boseki refuse-t-elle d'augmenter sa production ?
Le CEO Hiroyuki Tada a adopté une stratégie explicite de niche premium : maintenir une rareté artisanale pour exploiter les prix élevés et privilégier les marges à la croissance. L’entreprise génère un revenu modeste mais exerce un contrôle stratégique sur les géants de la tech.
Quelles alternatives au T-glass existent actuellement ?
Taiwan Glass a certifié une fibre Low-Dk mais ses propriétés thermiques restent inférieures. Nan Ya Plastics annonce pouvoir atteindre 20 % de la capacité de Nittobo d’ici 2027. Grace Fabric Technology en Chine se positionne comme alternative domestique mais aucune production en volume confirmée. Aucune n’a réussi à ce jour à briser le monopole.
Comment ce monopole affecte-t-il les prix des serveurs d'IA et des appareils électroniques ?
La pénurie délibérée de T-glass maintient les prix élevés. Nvidia et les hyperscalers obtiennent la priorité d’accès, tandis que les fabricants de consumer electronics sont relégués en dernier recours. Goldman Sachs prévoit des déficits de deux chiffres pour le T-glass destiné aux substrats durant les prochains trimestres, ce qui impacte les délais et coûts finaux.
Après avoir inventé le terme « vibe coding » en février 2025, Andrej Karpathy introduit officiellement « agentic engineering » un an plus tard. La différence ? Le vibe coding accepte aveuglément tout ce que génère une IA. L’agentic engineering confie aux agents IA autonomes la tâche d’écrire, tester et affiner le code — mais sous une orchestration et une révision humaines rigoureuses. Ce guide traduit cette nouvelle discipline en workflows opérationnels concrets.
L’agentic engineering requiert une orchestration humaine rigoureuse et continue, contrairement au vibe coding
Trois prérequis non-négociables : tests robustes, spécification écrite, CI/CD opérationnel
Quatre phases clés : discovery, planification, orchestration, exécution et validation
Les tests deviennent des validation gates que l’agent doit franchir pour réussir
Circuit breaker sur les coûts et monitoring continu pour éviter les hallucinations LLM
Vibe Coding vs. Agentic Engineering : la distinction critique
Depuis fin 2024, deux termes circulent dans les équipes tech. Ils sonnent proches. Ils désignent des univers opposés.
Qu'est-ce que le vibe coding ?
Le vibe coding repose sur un postulat simple : un humain prompt une IA, reçoit du code, l’accepte sans révision substantielle et le déploie. C’est rapide. C’est commode. C’est dangereux en production.
Addy Osmani, ingénieur chez Google Cloud, le dit crûment : « Vibe coding means going with the vibes and not reviewing the code. That’s the defining characteristic. »
Le vibe coding a ses cas d’usage légitimes — scripts personnels, prototypes MVP, apprentissage. Il s’arrête là.
Qu'est-ce que l'agentic engineering ?
L’agentic engineering, c’est l’inverse. Les agents IA ne reçoivent pas d’ordre du type « génère-moi une feature ». Ils reçoivent un cahier des charges précis, une architecture cible, des tests à passer. Ils écrivent du code, le testent, itèrent jusqu’à ce que les tests passent. Un humain — architecte, reviewer, décideur — reste maître du navire à chaque étape critique.
Osmani résume : « Agentic engineering isn’t easier than traditional engineering — it’s a different kind of hard. You’re trading typing time for review time. »
Comparaison directe
**Critère**
**Vibe Coding**
**Agentic Engineering**
**Autorité**
Acceptation humaine ponctuelle
Orchestration humaine continue
**Révision**
Optionnelle, souvent nulle
Obligatoire, structurée
**Processus**
Prompt → Code → Deploy
Spec → Plan → Discovery → Orchestration → Validation
**Risque production**
Élevé
Contrôlé
**Compétence requise**
Minimal
Ingénierie solide
Le piège courant
Certaines équipes pensent pratiquer l’agentic engineering en écrivant un prompt ambitieux et en croisant les doigts. C’est du vibe coding peint en noir.
Prérequis : fondations avant d'engager les agents
Avant de confier la moindre tâche critique à un agent IA, trois éléments non-négociables doivent déjà être en place.
1. Des tests robustes
Osmani appelle ça « le pivot » : transformer un agent non fiable en système fiable. Sans suite de tests solide, vous ne saurez jamais si l’agent a réellement réussi ou s’il hallucine.
Les tests servent de validation gate. L’agent itère jusqu’à ce qu’ils passent, point final. Visez 60–70 % de couverture minimum.
2. Une spécification écrite
Pas un message Slack. Pas une note Figma. Un document : architecture, interfaces, contraintes, conditions de succès.
L’agent doit savoir exactement ce qu’il cherche à accomplir. Si vous improvisez, il improvise aussi — et ses improvisations sont imprévisibles.
3. Un CI/CD opérationnel
Si votre pipeline de déploiement est manuel, branlant ou documenté sur Post-it, les agents vont pourrir le système. Ils accélèrent le processus existant, ils ne le créent pas.
Checklist d'infrastructure préalable
✓ Suite de tests étendue (>60 % couverture)
✓ Design docs à jour, lus par l’équipe
✓ CI/CD automatisé, fiable, testé en échec
✓ Logging centralisé (ELK, Datadog, etc.)
✓ Git branching strategy solide
✓ Monitoring production
✓ Runbooks pour incidents critiques
Si vous cochez moins de 5 cases, le problème n’est pas l’agent — c’est votre infrastructure.
Mise en garde : développeurs junior et agents
Enrôler des développeurs junior dans un processus agentic alors qu’ils ne maîtrisent pas les fondamentaux pose un risque majeur. Osmani relève : « AI didn’t cause the problem; skipping the design thinking did. »
Obligation absolue : chaque diff généré par un agent doit être révisé, compris et validé par un développeur senior.
Phase 1 : discovery — cartographier le système
Avant que l’agent n’exécute quoi que ce soit, il faut qu’il comprenne le terrain.
La discovery phase est une exploration méthodique de l’architecture cible. L’agent inspecte le dépôt Git (structure, dépendances, patterns), questionne le système en live (configuration, services, stockage, réseau), génère une baseline quantifiée, puis centralise tout dans un document opérationnel.
Cas pratique : migration multi-conteneurs
Patrick McCanna, ingénieur ops, a documenté une migration de services d’un Raspberry Pi 3 vers un serveur AMD Ryzen. La discovery a révélé :
Services réservés sur la cible : Ollama, Open WebUI, n8n
Sans cette discovery, l’agent aurait échoué à la première étape.
Étapes concrètes de discovery
1. Exploration repo. L’agent scrape le dépôt Git. Il cartographie : arborescence, dépendances, patterns d’infra.
2. Inspection live. L’agent fait de la reconnaissance en direct : docker ps -a # conteneurs docker volume ls # volumes df -h # espace disque curl http://localhost:8080/health # services vivants
Créer un post, uploader une image, générer une carte. Vérifier que tout marche.
Vérifications d'intégrité
Checksum avant/après ; vérifier que la base de données n’est pas corrompue.
Monitoring post-déploiement
Activer les sondes de readiness, observer les logs 30 min. Pas d’erreur 5xx ? Pas de latence dégradée ? Bon.
Documentation finale
L’agent génère un rapport final : timeline d’exécution, diffs appliqués, logs importants, checklist post-migration validée. Conservez-le pour la prochaine migration.
Pièges courants et solutions
Piège 1 : accepter le rapport sans preuve
Shannon a résolu ça avec une règle simple : « No exploit, no report. » Chaque vulnérabilité déclarée doit être prouvée par une exploitation réelle.
Dans votre contexte : Pas de changement déclaré sans vérification par baseline counts et tests fonctionnels.
Piège 2 : hallucinations LLM
L’agent affirme « 6 conteneurs migrés ». Vérifiez : `docker ps` en dit quoi ? Si le chiffre ne match pas, enquête immédiate.
Piège 3 : scope creep
L’agent était censé migrer 6 conteneurs. Il en crée 7 « pour optimiser ». Interdire. L’agent suit le spec, point final.
Piège 4 : coûts token imprévisibles
Shannon coûte ~$50 USD par run. Budgetez large. Fixez un circuit breaker en coûts : limite avant chaque workflow.
Piège 5 : production sans staging
Cutover directement en prod sans tester en staging est suicidaire. McCanna a utilisé une DNS temporaire pour tester l’exécution complète en staging avant prod.
Copiez ce pattern.
Atrophie de compétences junior
Un développeur junior qui passe un prompt et merge sans comprendre ne développe aucune intuition. Osmani l’a observé : « Disproportionately risky pour junior (can prompt but can’t debug). »
Solution obligatoire : Pour chaque diff généré par agent, revue + compréhension + explication écrite avant merge.
❌ Agent génère 300 lignes. Junior merge.
✓ Agent génère 300 lignes. Junior : lit, comprend, explique par écrit. Senior : valide compréhension et qualité. Merge.
Simon Willison : « LLM for Code » — patterns pour génération fiable
Patrick McCanna : « Using Custom AI Agents to Migrate Services » — cas d’usage reproductible
Conclusion
L’agentic engineering n’est pas une alternative au développement traditionnel. C’est une discipline qu’on superpose à une infrastructure déjà rigoureuse. Si votre équipe n’a pas tests robustes, pas specs écrites, pas CI/CD fiable, les agents vont accélérer le chaos, pas la productivité.
Mais si vous avez ces fondations, les agents deviennent des force multipliers. Ils exécutent des plans. Ils itèrent rapidement. Ils s’arrêtent aux checkpoints que vous définissez. Les humains gardent l’autorité.
Le vrai challenge n’est pas technique. C’est organisationnel : valider chaque diff, maintenir la compréhension, refuser la tentation de faire confiance aveuglément. C’est du travail. Mais c’est du vrai travail d’ingénierie.
FAQ
Quelle est la différence entre vibe coding et agentic engineering ?
Le vibe coding accepte aveuglément tout ce que génère une IA sans révision substantielle. L’agentic engineering confie aux agents IA autonomes la tâche d’écrire, tester et affiner le code — mais sous une orchestration et une révision humaines rigoureuses. L’agentic engineering n’est pas plus facile ; c’est un échange entre le temps de rédaction et le temps de révision.
Quels sont les prérequis avant de déployer des agents IA en production ?
Trois éléments non-négociables : une suite de tests robuste (visant 60–70 % de couverture minimum), une spécification écrite détaillée (architecture, interfaces, contraintes), et un CI/CD opérationnel et fiable. Si vous cochez moins de 5 cases dans la checklist d’infrastructure, le problème n’est pas l’agent — c’est votre infrastructure.
Quelles sont les 4 phases clés de l'agentic engineering ?
Phase 1 : Discovery — cartographie méthodique du système cible et des contraintes. Phase 2 : Planification — construction d’un plan d’exécution en phases avec enrichissements humains. Phase 3 : Orchestration — pilotage des agents avec prompts structurés et tests comme validation gates. Phase 4 : Exécution & Validation — vérification de baseline counts, tests fonctionnels et monitoring post-déploiement.
Comment éviter les hallucinations LLM lors d'une migration d'agents ?
Générez des baseline counts avant toute mutation (posts, images, données). L’agent affirme « 6 conteneurs migrés » ? Vérifiez avec `docker ps`. Utilisez des tests fonctionnels comme validation gates que l’agent doit franchir. Comparez baseline counts avant/après. Si le chiffre ne match pas, enquête immédiate. Maintenez un circuit breaker sur les coûts tokens pour limiter les hallucinations longues.
Quels outils utiliser pour orchestrer des workflows multi-agents autonomes ?
LangGraph — Framework Anthropic pour workflows multi-agents, gratuit et open-source. Temporal.io — Moteur de workflow durable gérant retries, timeouts et patterns saga. Anthropic Agent SDK — Recommandé pour le raisonnement structuré. Shannon (GitHub `KeygraphHQ/shannon`) — Agent de pentesting autonome déjà déployé en production avec benchmarks publiés.
54 000 suppressions d’emplois attribuées à l’intelligence artificielle en 2025. Mais les économistes soupçonnent une autre histoire : derrière ce tsunami de justifications technologiques se cacheraient des enjeux bien plus terrestres — tarifs douaniers, sur-embauche pandémique, maximisation des profits. Un phénomène baptisé AI washing par les chercheurs.
54 000 licenciements déclarés comme liés à l’IA en 2025, bien au-delà des suppressions justifiées par les tarifs douaniers (8 000)
Les CEOs changent constamment de discours : Andy Jassy d’Amazon déclare en octobre que les licenciements ne sont « pas vraiment liés à l’IA »
Déployer une IA mature capable de remplacer un employé requiert 18 à 24 mois selon Forrester, bien au-delà des licenciements de 2025
Trois causes réelles documentées : sur-embauche pandémique, tarifs douaniers, et réduction des coûts de main-d’œuvre via externalisation
Seuls 6 % des emplois américains seront automatisés d’ici 2030 selon Forrester, très loin des 54 000+ suppressions en 2025
Les chiffres de la grande justification
Cinquante-quatre mille : c’est le nombre de licenciements déclarés par les grandes entreprises américaines en 2025 comme directement liés à l’intelligence artificielle, selon le cabinet Challenger, Gray & Christmas.
Ce volume dépasse largement les suppressions justifiées par les tarifs douaniers, qui ont franchi la barre des 8 000 à peine.
Amazon a ouvert la marche. En janvier, le géant annonce 16 000 suppressions d’emplois. En octobre, une deuxième vague : 14 000. C’est Beth Galetti, vice-présidente des Ressources humaines, qui fournit l’explication : l’IA transforme les organisations, qui doivent devenir « plus maigres » pour rester compétitives.
Hewlett-Packard suit le même script. En novembre 2025, le PDG Enrique Lores annonce 6 000 suppressions en invoquant l’adoption de l’IA.
Duolingo offre un cas révélateur. En avril 2025, le cofondateur Luis von Ahn déclare vouloir devenir « AI-first », arrêtant les contrats externes pour des tâches confiables à la technologie. Quelques mois plus tard, interrogé par le New York Times, il rectifie : Duolingo n’a jamais licencié ses salariés permanents. Seul le vivier de contractants temporaires a fluctué.
Quand les dirigeants se contredisent
Le revirement de Duolingo n’est pas isolé. Amazon l’illustre encore plus crûment.
En octobre 2025, Andy Jassy, PDG d’Amazon, déclare publiquement : « Ce n’est pas vraiment lié à l’IA, en fait. C’est vraiment une question de culture ». Cela contredit frontalement le discours de sa VP quelques semaines auparavant.
Cette instabilité narrative intrigue les analystes. Fabian Stephany, chercheur à l’Oxford Internet Institute, spécialiste du AI washing, explique le mécanisme :
« Vous pouvez dire : “Nous intégrons la plus nouvelle technologie dans nos processus métier, nous sommes vraiment des pionniers technologiques, et nous devons nous débarrasser de ces personnes.” »
Stephany concède que dans certains domaines — le support client notamment — les capacités actuelles de l’IA s’alignent plausiblement avec les tâches en question. Mais cette vraisemblance technique ne valide pas pour autant l’ensemble des affirmations des dirigeants.
Trois causes réelles, documentées
Les économistes proposent trois explications alternatives, chacune documentée et concurrente avec la narrative officielle.
La sur-embauche pandémique
Durant 2020–2021, avec des taux d’intérêt proches de zéro et une rareté de talents, les entreprises ont gonflé drastiquement leurs effectifs. Aujourd’hui, avec des taux normalisés, elles corrigent cet excédent. Le Wall Street Journal a documenté ce phénomène : les réductions 2025 correspondent largement à une rebalance cyclique, pas à une révolution technologique.
Les tarifs douaniers : la gêne politique
Sous la deuxième administration Trump, les droits de douane menacent les marges des géants technologiques. Mais les CEOs hésitent à le dire. Martha Gimbel, directrice exécutive du Yale Budget Lab, décrypte ce silence :
« Vous avez observé une vraie réticence chez certains secteurs du business américain à dire quoi que ce soit de négatif sur les impacts économiques de l’administration Trump, parce qu’ils craignent des représailles. En attribuant les licenciements à de nouvelles efficiences créées par l’IA, on évite ce contrecoup potentiel. »
Amazon elle-même l’illustre. En avril 2025, le géant avait envisagé d’afficher publiquement le coût des tarifs sur sa plateforme. La Maison-Blanche a qualifié l’idée d’« hostile ». L’initiative a été abandonnée.
La réduction des coûts de main-d'œuvre
Un ancien cadre sénior d’Amazon, licencié en octobre, le confirme anonymement :
« J’ai été licencié pour économiser sur les coûts de main-d’œuvre. »
Puis il ajoute, révélant le vrai mécanisme :
« Peut-être que l’IA a aidé à avoir une personne moins expérimentée — et moins payée — faire une partie du travail. »
Autrement dit : l’IA n’a pas supprimé le travail ; elle a permis son externalisation à moindre coût.
Le délai qui pose question
JP Gownder, analyste principal chez Forrester, soulève un problème temporel majeur. Déployer une application d’IA mature capable de remplacer un employé requiert généralement 18 à 24 mois. Or, les licenciements de 2025 interviennent bien avant cet horizon.
« Si vous n’avez pas une application d’IA mature, déployée et prête à faire le travail… cela pourrait vous prendre 18 à 24 mois pour remplacer cette personne par l’IA — si cela fonctionne vraiment. »
Gownder identifie aussi un pattern récurrent : nombre de CEOs, peu familiers des détails technologiques, déclarent : « Licencions 20 à 30 % de nos effectifs et remplaçons-les par l’IA », sans évaluer la faisabilité réelle.
Les projections long terme renforcent ce scepticisme. Forrester estime que seulement 6 % des emplois américains seront automatisés d’ici 2030 — très loin des 54 000+ supprimés en 2025 au nom de l’IA.
Les cas où l'IA tient techniquement
Cela dit, l’IA ne brille pas par son absence totale.
Marc Benioff, PDG de Salesforce, affirme avoir réduit son support client de 9 000 à 5 000 agents grâce à des systèmes d’IA. C’est techniquement plausible : le support client figure parmi les tâches les plus proches des capacités actuelles de l’IA. Stephany juge cette affirmation plus fondée que les autres.
Martha Gimbel nuance toutefois :
« Les déclarations de CEO sont possiblement la pire façon de comprendre comment le changement technologique affecte le marché du travail. »
Ce que le "AI washing" révèle
Le phénomène n’est pas une théorie du complot. Il reflète une réalité simple : face à des pressions financières réelles — sureffectif, tarifs, exigences de marges — les dirigeants préfèrent invoquer la technologie plutôt que l’austérité ou les tensions politiques.
L’IA passe pour du progrès inévitable. Les tarifs sonnent comme une critique du gouvernement. La sur-embauche pandémique ressemble à une erreur managériale passée. Le choix est transparent : quel récit minimise le contrecoup politique et commercial ?
Les revirements de Jassy et von Ahn révèlent un indice supplémentaire : l’instabilité même de cette narration suggère qu’elle ne repose pas sur des fondations solides. Un discours ancré dans l’opérationnel tiendrait mieux.
Trois signaux pour clarifier
La vérité émergerait de trois indicateurs concrets :
Publication de rapports d’impact internes détaillant le retour sur investissement réel de l’IA par entreprise.
Étude indépendante quantifiant quelle fraction des 54 000 suppressions correspond à de l’IA réellement déployée et fonctionnelle.
Constance du discours en 2026 : si les CEOs continuent à affiner et préciser leurs claims d’IA, cela suggère une causalité réelle. S’ils changent de direction, cela conforte la thèse de la rationalisation post-hoc.
Conclusion
D’ici là, le chiffre de 54 000 reste inscrit dans le registre des raisons officielles. Les moteurs réels attendent toujours d’être nommés.
FAQ
Qu'est-ce que le "AI washing" ?
Invoquer l’IA pour légitimer des décisions financières ou de réduction des coûts, sans que la technologie soit réellement responsable des changements.
Combien de licenciements ont été attribués à l'IA en 2025 ?
54 000 suppressions d’emplois, selon le cabinet Challenger, Gray & Christmas — bien plus que ceux liés aux tarifs douaniers (< 8 000).
Pourquoi les CEOs invoqueraient-ils l'IA plutôt que la vraie raison ?
L’IA passe pour du progrès inévitable, tandis que les tarifs sonnent comme une critique gouvernementale et la sur-embauche comme une erreur d’hier.
Quel délai faut-il pour déployer une IA capable de remplacer un employé ?
Généralement 18 à 24 mois selon Forrester. Or, les licenciements de 2025 interviennent avant cet horizon.
Quels secteurs ont réellement vu l'IA remplacer des emplois ?
Le support client est le plus crédible, notamment chez Salesforce (réduction de 9 000 à 5 000 agents).