Sommaire
- Ce qui s'est passé chez Uber
- La phrase qui dérange : le COO ne sait pas mesurer le retour
- Uber n'est pas seul : Microsoft débranche Claude Code
- La mécanique : pourquoi le token-based pricing rend l'IA imprévisible
- Le piège : encourager l'usage sans le piloter
- Le signal marché : tout le monde bascule vers la facturation à l'usage
- Comment cadrer un budget IA avant qu'il n'explose
- Questions fréquentes
Uber a épuisé l'intégralité de son budget IA 2026 en quatre mois. Pas sur un projet raté, pas sur un fournisseur défaillant : sur des outils que ses propres ingénieurs adorent — Claude Code et Cursor. La réponse de l'entreprise tient en un chiffre : un plafond de 1 500 dollars par mois et par outil, désormais imposé à chaque salarié. Et une phrase, signée du directeur des opérations : le lien entre cette dépense et la valeur créée « n'est pas encore là ».
Ce n'est pas un accident de gestion isolé. Trois semaines plus tôt, Microsoft annonçait l'annulation de la plupart de ses licences Claude Code internes, pour la même raison. Une enquête sectorielle place 85 % des entreprises au-dessus de leurs prévisions de coût IA. Ce qui se joue chez Uber n'est pas une erreur de budget : c'est le premier symptôme visible d'un changement de nature du logiciel. L'IA agentique a transformé un coût fixe — la licence — en un coût variable qui suit l'usage, et que presque aucune direction financière ne sait encore piloter.
Cet article décrit ce qui s'est réellement passé, pourquoi le mécanisme est structurel et non conjoncturel, et comment un dirigeant peut cadrer sa dépense IA avant de la découvrir à découvert.
Ce qui s'est passé chez Uber
[FAIT] Début juin 2026, Uber a instauré un plafond mensuel de 1 500 dollars par employé et par outil de codage agentique. Claude Code (Anthropic) et Cursor sont comptés séparément : la consommation sur l'un n'entame pas le budget de l'autre (Bloomberg, TechCrunch). Chaque salarié dispose d'un tableau de bord interne traçant sa consommation, et les dépassements restent possibles, au cas par cas.
[FAIT] La mesure répond à une révélation interne d'avril 2026 : Uber avait consommé son budget IA annuel complet en quatre mois (ActuIA). L'adoption de Claude Code y est passée de 32 % à 84 % des ingénieurs concernés entre décembre 2025 et mars 2026, avec un coût mensuel par développeur compris entre 500 et 2 000 dollars (AI Weekly). Aujourd'hui, environ 10 % du code d'Uber est écrit et soumis par des agents, selon le PDG Dara Khosrowshahi.
[ANALYSE] L'ironie est instructive : Uber commercialise elle-même une offre « Agentic AI Solutions » auprès de clients tiers (ActuIA). Une entreprise qui vend de l'IA agentique vient de découvrir, sur ses propres comptes, que la facture de l'IA agentique est difficile à tenir. Si une organisation de cette taille, avec ces moyens et cette culture data, se fait surprendre, l'hypothèse qu'une PME y échappe spontanément est faible.
La phrase qui dérange : le COO ne sait pas mesurer le retour
[FAIT] Andrew Macdonald, président et directeur des opérations d'Uber, a reconnu publiquement la difficulté à relier la dépense IA à la valeur produite (Fortune) :
« Ce lien n'est pas encore là. Il est très difficile de tracer une ligne entre l'une de ces statistiques et "OK, maintenant nous produisons réellement 25 % de fonctionnalités utiles en plus pour nos utilisateurs". »Andrew Macdonald — Président & COO d'Uber, Fortune, mai 2026
[FAIT] Il ajoute la conséquence logique : « Si vous n'êtes pas capable de tracer une ligne directe vers le nombre de fonctionnalités utiles que vous livrez à vos utilisateurs, cet arbitrage devient plus difficile à justifier » (Fortune). Pour mémoire, la R&D d'Uber a atteint 951 millions de dollars au premier trimestre 2026, en hausse de 17 % sur un an.
Uber n'est pas seul : Microsoft débranche Claude Code
[FAIT] Quelques jours avant Uber, Microsoft a engagé l'annulation de la majorité de ses licences Claude Code internes au sein de sa division Experiences & Devices — l'équipe responsable de Windows, Microsoft 365, Outlook, Teams et Surface — avec une échéance fixée au 30 juin 2026 (AI Weekly). Le pilote, lancé en décembre 2025 auprès d'environ 5 000 ingénieurs, avait atteint un taux d'adoption de 84 à 95 % de la cohorte en avril 2026 — avant de consommer son budget sous l'effet de la facturation au token.
[FAIT] Le constat dépasse ces deux noms. Fortune titrait dès le 22 mai 2026 que « l'IA coûte plus cher que de payer des employés humains » sur certaines tâches, en pointant précisément le modèle de facturation par tokens et agents (Fortune). Axios parle, lui, d'un « choc d'étiquette » (AI sticker shock) qui frappe les directions financières américaines (Axios).
| Entreprise | Ce qui a été constaté | Réaction | Échéance |
|---|---|---|---|
| Uber | Budget IA annuel épuisé en 4 mois | Plafond 1 500 $/mois/outil | Juin 2026 |
| Microsoft (Experiences & Devices) | Budget consommé, ~5 000 ingénieurs, 84–95 % d'adoption | Annulation des licences Claude Code | 30 juin 2026 |
| Marché (enquête Mavvrik) | 85 % des entreprises au-dessus de leurs prévisions de coût IA | Marge brute en baisse de +6 pts pour 84 % | 2025–2026 |
Sources : Bloomberg, AI Weekly, Fortune, Axios
La mécanique : pourquoi le token-based pricing rend l'IA imprévisible
[FAIT] Pendant trente ans, le logiciel d'entreprise s'est acheté à coût fixe : une licence, un abonnement par poste, un montant connu d'avance et indépendant de l'intensité d'usage. Un développeur qui utilisait son IDE huit heures par jour ne coûtait pas plus cher que celui qui l'ouvrait une heure. L'IA agentique rompt ce contrat. La facturation se fait au token — l'unité de texte traitée par le modèle — donc proportionnelle à l'usage réel. Plus l'outil est bon, plus on s'en sert ; plus on s'en sert, plus il consomme ; plus il consomme, plus il coûte.
[FAIT] Le contre-argument habituel est que les tokens deviennent moins chers. C'est vrai : Gartner anticipe une inférence 90 % moins chère d'ici 2030. Mais la même analyse de mars 2026 ajoute le facteur décisif : les modèles agentiques consomment 5 à 30 fois plus de tokens par tâche que la génération de texte classique, parce qu'ils raisonnent en plusieurs étapes, lisent et relisent du contexte, et s'auto-corrigent. La baisse du prix unitaire est plus que compensée par l'explosion du volume.
[FAIT] Les ordres de grandeur unitaires le confirment. Mi-2026, l'API d'Anthropic facture Claude Opus à 5 dollars le million de tokens en entrée et 25 dollars en sortie ; Sonnet à 3 et 15 dollars ; Haiku à 1 et 5 dollars (AI Weekly). Pris isolément, ces prix paraissent dérisoires. Rapportés à un agent qui traite des millions de tokens par jour, sur des centaines de développeurs, ils produisent les factures de 500 à 2 000 dollars mensuels constatées chez Uber.
Le piège : encourager l'usage sans le piloter
[ANALYSE] L'erreur d'Uber n'est pas technique, elle est managériale, et elle est commune. Pour réussir une transformation IA, le réflexe légitime est de pousser l'adoption : former, encourager, lever les freins. Uber l'a fait à fond — jusqu'à classer les équipes par consommation. Mais en l'absence d'une métrique de valeur, l'incitation à adopter devient une incitation à dépenser. On obtient exactement ce qu'on mesure : une adoption record, et une facture record, sans preuve de retour.
[FAIT] Le marché valide ce diagnostic. Selon une enquête citée par ActuIA, 40 % des entreprises n'ont pas atteint leurs objectifs de réduction de coûts liés à l'IA — et pourtant 83 % des directeurs financiers prévoient d'augmenter leur budget IA de plus de 15 % sur deux ans (ActuIA). On dépense davantage dans un outil dont on n'a pas démontré le retour : c'est le profil classique d'un investissement piloté par la peur de rater le train, pas par la mesure.
Le signal marché : tout le monde bascule vers la facturation à l'usage
[FAIT] Le mouvement n'est pas marginal, il est structurel côté éditeurs. Au 1er juin 2026, GitHub Copilot est passé à une facturation à l'usage, et Cursor a de nouveau modifié sa grille tarifaire d'équipe (CloudZero, Finout). Dès l'été 2025, Cursor avait dû s'excuser publiquement et rembourser des clients après des dépassements surprises — un développeur rapportait 350 dollars de surfacturation en une seule semaine.
[ANALYSE] Le même fait, lu du côté de l'utilisateur, donne une piste de pilotage. Un développeur a calculé que huit mois d'usage quotidien intensif de Claude Code représentaient environ 10 milliards de tokens — soit plus de 15 000 dollars au prix de l'API, mais 100 dollars par mois sur un forfait illimité (plan Max). L'écart entre facturation à l'usage et forfait peut atteindre un facteur de plusieurs dizaines selon l'intensité. Le bon réflexe n'est donc pas de fuir l'IA, c'est de choisir le bon modèle de prix pour le bon profil d'usage.
| Modèle de prix | Logique | Adapté quand… | Risque |
|---|---|---|---|
| Forfait fixe (par poste) | Montant connu d'avance | Usage intensif et régulier | Faible — prévisible |
| Facturation à l'usage (token) | Proportionnel à la consommation | Usage faible, ponctuel ou pilote | Élevé sans plafond |
| Plafond par utilisateur | Usage libre sous un seuil | Déploiement large à risque maîtrisé | Maîtrisé |
Comment cadrer un budget IA avant qu'il n'explose
Le cas Uber n'est pas un argument contre l'IA — c'est un mode d'emploi par la négative. Voici ce qu'il enseigne, transposable à une organisation de n'importe quelle taille.
[ANALYSE] 1. Mesurer le résultat, jamais la consommation. Le tableau de bord d'Uber suivait les tokens et l'adoption. Le bon indicateur suit ce que l'entreprise livre : fonctionnalités mises en production, tickets résolus, délais raccourcis, défauts évités. Si le seul chiffre qui monte est la facture, la transformation a échoué quel que soit le taux d'adoption.
[ANALYSE] 2. Plafonner par tête, dès le premier jour. Un plafond visible par utilisateur, comme les 1 500 dollars d'Uber, n'interdit pas l'usage : il le rend conscient. Mis en place après coup, c'est un correctif douloureux ; posé d'emblée, c'est un cadre. Le plafond doit s'accompagner d'un tableau de bord de consommation accessible à chacun.
[ANALYSE] 3. Choisir le modèle de prix selon le profil d'usage. Pour un usage intensif et régulier, le forfait fixe protège du dérapage. Pour un usage ponctuel ou un pilote, la facturation à l'usage évite de payer une capacité inutilisée. Mélanger les deux selon les équipes est souvent l'optimum — encore faut-il l'avoir décidé, pas subi.
[ANALYSE] 4. Cadrer le pilote avant de cadrer le déploiement. La séquence saine est l'inverse de celle d'Uber : un périmètre restreint, une métrique de valeur définie à l'avance, un budget plafonné, une décision de généralisation prise sur les résultats — pas sur l'enthousiasme. C'est précisément le travail d'un audit IA en amont : déterminer où l'IA crée une valeur mesurable, et à quel coût soutenable.
La séquence Uber-Microsoft de mai-juin 2026 marque la fin d'une illusion : celle d'une IA dont le coût se signerait une fois pour toutes. Le logiciel agentique se paie à l'usage, et l'usage se gouverne. Les organisations qui réussiront leur transition ne seront pas celles qui dépensent le plus, ni celles qui adoptent le plus vite — ce sont celles qui auront, avant de déployer, défini ce qu'elles mesurent et ce qu'elles plafonnent. La question n'est plus « combien coûte l'IA », mais « savons-nous relier ce qu'elle coûte à ce qu'elle nous rapporte ». Uber, pour l'instant, répond non.
Questions fréquentes
Pourquoi le budget IA d'Uber a-t-il explosé si vite ?
Uber a encouragé l'adoption massive des agents de code (Claude Code, Cursor) en instaurant un classement interne récompensant les équipes les plus consommatrices. L'adoption de Claude Code est passée de 32 % à 84 % des ingénieurs concernés entre décembre 2025 et mars 2026, avec un coût mensuel par développeur compris entre 500 et 2 000 dollars. Combinée à une facturation à l'usage (au token), cette adoption a consommé l'intégralité du budget IA annuel 2026 en quatre mois.
Qu'est-ce que le plafond de 1 500 dollars change concrètement ?
Uber a fixé un plafond mensuel de 1 500 dollars par employé et par outil — Claude Code et Cursor sont comptés séparément. Chaque salarié dispose d'un tableau de bord interne traçant sa consommation, et les dépassements sont autorisés au cas par cas. L'objectif n'est pas d'interdire l'IA mais de transformer une dépense ouverte en dépense gouvernée, avec un seuil visible par tête.
Pourquoi le coût de l'IA augmente alors que le prix des tokens baisse ?
Le prix unitaire du token baisse — Gartner anticipe une inférence 90 % moins chère d'ici 2030. Mais les modèles agentiques consomment 5 à 30 fois plus de tokens par tâche que la génération de texte classique, car ils raisonnent en plusieurs étapes, lisent du contexte et s'auto-corrigent. La baisse du prix unitaire est plus que compensée par l'explosion du volume consommé. Résultat : la facture monte malgré des tokens moins chers.
Microsoft a-t-il vraiment abandonné Claude Code ?
Microsoft annule la majorité de ses licences Claude Code internes dans sa division Experiences & Devices (Windows, Microsoft 365, Outlook, Teams, Surface), avec une échéance fixée au 30 juin 2026. Le pilote, lancé en décembre 2025 auprès d'environ 5 000 ingénieurs, avait atteint un taux d'adoption de 84 à 95 % en avril 2026 — et consommé son budget annuel sous l'effet de la facturation au token. Le cas confirme qu'Uber n'est pas une exception.
Comment une PME peut-elle éviter le même dérapage ?
En cadrant avant de déployer : fixer un plafond par utilisateur, suivre la consommation en temps réel, choisir des forfaits à coût fixe quand l'usage est prévisible plutôt qu'une facturation à l'usage, et surtout définir une métrique de valeur (fonctionnalités livrées, tickets résolus, temps gagné) plutôt que de récompenser la consommation brute. Le piège d'Uber n'est pas d'avoir utilisé l'IA, c'est d'avoir mesuré l'usage au lieu de mesurer le résultat.