Uber a épuisé son budget IA 2026 en quatre mois : pourquoi les agents de code échappent à tout budget

Sommaire

Ce qui s'est passé chez Uber
La phrase qui dérange : le COO ne sait pas mesurer le retour
Uber n'est pas seul : Microsoft débranche Claude Code
La mécanique : pourquoi le token-based pricing rend l'IA imprévisible
Le piège : encourager l'usage sans le piloter
Le signal marché : tout le monde bascule vers la facturation à l'usage
Comment cadrer un budget IA avant qu'il n'explose
Questions fréquentes

Uber a épuisé l'intégralité de son budget IA 2026 en quatre mois. Pas sur un projet raté, pas sur un fournisseur défaillant : sur des outils que ses propres ingénieurs adorent — Claude Code et Cursor. La réponse de l'entreprise tient en un chiffre : un plafond de 1 500 dollars par mois et par outil, désormais imposé à chaque salarié. Et une phrase, signée du directeur des opérations : le lien entre cette dépense et la valeur créée « n'est pas encore là ».

Ce n'est pas un accident de gestion isolé. Trois semaines plus tôt, Microsoft annonçait l'annulation de la plupart de ses licences Claude Code internes, pour la même raison. Une enquête sectorielle place 85 % des entreprises au-dessus de leurs prévisions de coût IA. Ce qui se joue chez Uber n'est pas une erreur de budget : c'est le premier symptôme visible d'un changement de nature du logiciel. L'IA agentique a transformé un coût fixe — la licence — en un coût variable qui suit l'usage, et que presque aucune direction financière ne sait encore piloter.

Cet article décrit ce qui s'est réellement passé, pourquoi le mécanisme est structurel et non conjoncturel, et comment un dirigeant peut cadrer sa dépense IA avant de la découvrir à découvert.

Ce qui s'est passé chez Uber

Début juin 2026, Uber a instauré un plafond mensuel de 1 500 dollars par employé et par outil de codage agentique. Claude Code (Anthropic) et Cursor sont comptés séparément : la consommation sur l'un n'entame pas le budget de l'autre (Bloomberg, TechCrunch). Chaque salarié dispose d'un tableau de bord interne traçant sa consommation, et les dépassements restent possibles, au cas par cas.

La mesure répond à une révélation interne d'avril 2026 : Uber avait consommé son budget IA annuel complet en quatre mois (ActuIA). L'adoption de Claude Code y est passée de 32 % à 84 % des ingénieurs concernés entre décembre 2025 et mars 2026, avec un coût mensuel par développeur compris entre 500 et 2 000 dollars (AI Weekly). Aujourd'hui, environ 10 % du code d'Uber est écrit et soumis par des agents, selon le PDG Dara Khosrowshahi.

Fait — Le détail qui change tout Uber n'a pas seulement autorisé ces outils : l'entreprise a mis en place un classement interne récompensant les équipes les plus consommatrices d'IA, et a encouragé ses ingénieurs à les utiliser « autant que possible ». Le dérapage budgétaire n'est pas un effet secondaire imprévu — c'est la conséquence directe d'une incitation à consommer, branchée sur une facturation à l'usage.

Tableau de bord : Uber a epuise son budget IA en 4 mois et plafonne a 1 500 dollars par mois et par outil (500 a 2 000 dollars par developpeur et par mois) ; Microsoft coupe ses licences Claude Code (echeance 30 juin 2026, environ 5 000 ingenieurs, 84 a 95 pourcent d adoption). Outils concernes : Claude Code et Cursor. — Mai-juin 2026 : Uber et Microsoft revoient leur copie sur le cout des agents de code. Otium, dapres Bloomberg, TechCrunch, Fortune, AI Weekly et ActuIA.

L'ironie est instructive : Uber commercialise elle-même une offre « Agentic AI Solutions » auprès de clients tiers (ActuIA). Une entreprise qui vend de l'IA agentique vient de découvrir, sur ses propres comptes, que la facture de l'IA agentique est difficile à tenir. Si une organisation de cette taille, avec ces moyens et cette culture data, se fait surprendre, l'hypothèse qu'une PME y échappe spontanément est faible.

La phrase qui dérange : le COO ne sait pas mesurer le retour

Andrew Macdonald, président et directeur des opérations d'Uber, a reconnu publiquement la difficulté à relier la dépense IA à la valeur produite (Fortune) :

« Ce lien n'est pas encore là. Il est très difficile de tracer une ligne entre l'une de ces statistiques et "OK, maintenant nous produisons réellement 25 % de fonctionnalités utiles en plus pour nos utilisateurs". »

Andrew Macdonald — Président & COO d'Uber, Fortune, mai 2026

Il ajoute la conséquence logique : « Si vous n'êtes pas capable de tracer une ligne directe vers le nombre de fonctionnalités utiles que vous livrez à vos utilisateurs, cet arbitrage devient plus difficile à justifier » (Fortune). Pour mémoire, la R&D d'Uber a atteint 951 millions de dollars au premier trimestre 2026, en hausse de 17 % sur un an.

Analyse — Adoption n'est pas valeur C'est le cœur du sujet, et il est contre-intuitif. Les indicateurs qu'Uber suivait — taux d'adoption, tokens consommés, lignes de code générées — montent tous. Mais aucun ne prouve que l'entreprise livre plus, mieux, ou plus vite à ses clients. On a mesuré l'activité de l'outil, pas le résultat de l'entreprise. Quand le seul tableau de bord disponible valorise la consommation, la consommation devient l'objectif. Et la consommation, en régime de facturation au token, se paie.

Graphique : 84 % d'adoption de Claude Code, 95 % des ingénieurs utilisant l'IA chaque mois, 10 % du code écrit par des agents — mais lien dépense IA vers valeur client non établi — Tous les indicateurs d'usage montent. Le lien avec la valeur livrée, lui, reste à établir. Otium, d'après Fortune, ActuIA et AI Weekly.

Uber n'est pas seul : Microsoft débranche Claude Code

Quelques jours avant Uber, Microsoft a engagé l'annulation de la majorité de ses licences Claude Code internes au sein de sa division Experiences & Devices — l'équipe responsable de Windows, Microsoft 365, Outlook, Teams et Surface — avec une échéance fixée au 30 juin 2026 (AI Weekly). Le pilote, lancé en décembre 2025 auprès d'environ 5 000 ingénieurs, avait atteint un taux d'adoption de 84 à 95 % de la cohorte en avril 2026 — avant de consommer son budget sous l'effet de la facturation au token.

Le constat dépasse ces deux noms. Fortune titrait dès le 22 mai 2026 que « l'IA coûte plus cher que de payer des employés humains » sur certaines tâches, en pointant précisément le modèle de facturation par tokens et agents (Fortune). Axios parle, lui, d'un « choc d'étiquette » (AI sticker shock) qui frappe les directions financières américaines (Axios).

Entreprise	Ce qui a été constaté	Réaction	Échéance
Uber	Budget IA annuel épuisé en 4 mois	Plafond 1 500 $/mois/outil	Juin 2026
Microsoft (Experiences & Devices)	Budget consommé, ~5 000 ingénieurs, 84–95 % d'adoption	Annulation des licences Claude Code	30 juin 2026
Marché (enquête Mavvrik)	85 % des entreprises au-dessus de leurs prévisions de coût IA	Marge brute en baisse de +6 pts pour 84 %	2025–2026

Sources : Bloomberg, AI Weekly, Fortune, Axios

La mécanique : pourquoi le token-based pricing rend l'IA imprévisible

Pendant trente ans, le logiciel d'entreprise s'est acheté à coût fixe : une licence, un abonnement par poste, un montant connu d'avance et indépendant de l'intensité d'usage. Un développeur qui utilisait son IDE huit heures par jour ne coûtait pas plus cher que celui qui l'ouvrait une heure. L'IA agentique rompt ce contrat. La facturation se fait au token — l'unité de texte traitée par le modèle — donc proportionnelle à l'usage réel. Plus l'outil est bon, plus on s'en sert ; plus on s'en sert, plus il consomme ; plus il consomme, plus il coûte.

Le contre-argument habituel est que les tokens deviennent moins chers. C'est vrai : Gartner anticipe une inférence 90 % moins chère d'ici 2030. Mais la même analyse de mars 2026 ajoute le facteur décisif : les modèles agentiques consomment 5 à 30 fois plus de tokens par tâche que la génération de texte classique, parce qu'ils raisonnent en plusieurs étapes, lisent et relisent du contexte, et s'auto-corrigent. La baisse du prix unitaire est plus que compensée par l'explosion du volume.

Des tokens moins chers ne font pas une IA moins chère. Un agent qui consomme trente fois plus de tokens annule largement une remise unitaire de 90 %. Lecture Otium des données Gartner, mars 2026

Graphique du coût mensuel par développeur en dollars : un forfait fixe reste autour de 100 à 200 dollars par mois, tandis que la facturation à l'usage grimpe de 500 à 2 000 dollars selon l'intensité d'usage constatée chez Uber — À usage intensif, la facturation au token dépasse largement un forfait fixe. Otium, d'après les coûts constatés chez Uber et les grilles Anthropic 2026.

Les ordres de grandeur unitaires le confirment. Mi-2026, l'API d'Anthropic facture Claude Opus à 5 dollars le million de tokens en entrée et 25 dollars en sortie ; Sonnet à 3 et 15 dollars ; Haiku à 1 et 5 dollars (AI Weekly). Pris isolément, ces prix paraissent dérisoires. Rapportés à un agent qui traite des millions de tokens par jour, sur des centaines de développeurs, ils produisent les factures de 500 à 2 000 dollars mensuels constatées chez Uber.

Analyse — Le coût devient un comportement, pas une ligne La conséquence managériale est profonde. Avec une licence, le coût est une décision d'achat : on signe une fois, on budgète une fois. Avec le token, le coût est un comportement quotidien : chaque prompt, chaque agent lancé en arrière-plan, chaque relance d'une tâche échouée est une micro-dépense. Le budget n'est plus fixé à l'achat — il est produit, chaque jour, par les habitudes de centaines de personnes. Aucun service achats n'est outillé pour ça. C'est un problème de FinOps, pas de procurement.

Le piège : encourager l'usage sans le piloter

L'erreur d'Uber n'est pas technique, elle est managériale, et elle est commune. Pour réussir une transformation IA, le réflexe légitime est de pousser l'adoption : former, encourager, lever les freins. Uber l'a fait à fond — jusqu'à classer les équipes par consommation. Mais en l'absence d'une métrique de valeur, l'incitation à adopter devient une incitation à dépenser. On obtient exactement ce qu'on mesure : une adoption record, et une facture record, sans preuve de retour.

Le marché valide ce diagnostic. Selon une enquête citée par ActuIA, 40 % des entreprises n'ont pas atteint leurs objectifs de réduction de coûts liés à l'IA — et pourtant 83 % des directeurs financiers prévoient d'augmenter leur budget IA de plus de 15 % sur deux ans (ActuIA). On dépense davantage dans un outil dont on n'a pas démontré le retour : c'est le profil classique d'un investissement piloté par la peur de rater le train, pas par la mesure.

Fait — Le cas extrême La presse a rapporté qu'une entreprise aurait dépensé jusqu'à 500 millions de dollars en un seul mois sur Claude, faute de toute limite par licence (Yahoo Finance). Le chiffre, issu d'un rapport relayé sans identification de l'entreprise, doit être pris comme une borne haute anecdotique plus que comme un cas représentatif. Il illustre toutefois la même mécanique, poussée à l'absurde : sans plafond ni gouvernance, une facturation à l'usage n'a pas de plafond naturel.

Le signal marché : tout le monde bascule vers la facturation à l'usage

Le mouvement n'est pas marginal, il est structurel côté éditeurs. Au 1er juin 2026, GitHub Copilot est passé à une facturation à l'usage, et Cursor a de nouveau modifié sa grille tarifaire d'équipe (CloudZero, Finout). Dès l'été 2025, Cursor avait dû s'excuser publiquement et rembourser des clients après des dépassements surprises — un développeur rapportait 350 dollars de surfacturation en une seule semaine.

Le même fait, lu du côté de l'utilisateur, donne une piste de pilotage. Un développeur a calculé que huit mois d'usage quotidien intensif de Claude Code représentaient environ 10 milliards de tokens — soit plus de 15 000 dollars au prix de l'API, mais 100 dollars par mois sur un forfait illimité (plan Max). L'écart entre facturation à l'usage et forfait peut atteindre un facteur de plusieurs dizaines selon l'intensité. Le bon réflexe n'est donc pas de fuir l'IA, c'est de choisir le bon modèle de prix pour le bon profil d'usage.

Modèle de prix	Logique	Adapté quand…	Risque
Forfait fixe (par poste)	Montant connu d'avance	Usage intensif et régulier	Faible — prévisible
Facturation à l'usage (token)	Proportionnel à la consommation	Usage faible, ponctuel ou pilote	Élevé sans plafond
Plafond par utilisateur	Usage libre sous un seuil	Déploiement large à risque maîtrisé	Maîtrisé

Comment cadrer un budget IA avant qu'il n'explose

Le cas Uber n'est pas un argument contre l'IA — c'est un mode d'emploi par la négative. Voici ce qu'il enseigne, transposable à une organisation de n'importe quelle taille.

1. Mesurer le résultat, jamais la consommation. Le tableau de bord d'Uber suivait les tokens et l'adoption. Le bon indicateur suit ce que l'entreprise livre : fonctionnalités mises en production, tickets résolus, délais raccourcis, défauts évités. Si le seul chiffre qui monte est la facture, la transformation a échoué quel que soit le taux d'adoption.

2. Plafonner par tête, dès le premier jour. Un plafond visible par utilisateur, comme les 1 500 dollars d'Uber, n'interdit pas l'usage : il le rend conscient. Mis en place après coup, c'est un correctif douloureux ; posé d'emblée, c'est un cadre. Le plafond doit s'accompagner d'un tableau de bord de consommation accessible à chacun.

3. Choisir le modèle de prix selon le profil d'usage. Pour un usage intensif et régulier, le forfait fixe protège du dérapage. Pour un usage ponctuel ou un pilote, la facturation à l'usage évite de payer une capacité inutilisée. Mélanger les deux selon les équipes est souvent l'optimum — encore faut-il l'avoir décidé, pas subi.

4. Cadrer le pilote avant de cadrer le déploiement. La séquence saine est l'inverse de celle d'Uber : un périmètre restreint, une métrique de valeur définie à l'avance, un budget plafonné, une décision de généralisation prise sur les résultats — pas sur l'enthousiasme. C'est précisément le travail d'un audit IA en amont : déterminer où l'IA crée une valeur mesurable, et à quel coût soutenable.

Analyse — La vraie leçon Uber n'a pas un problème d'IA, il a un problème de gouvernance de l'IA. L'outil fonctionne, l'adoption est réelle, le code généré existe. Ce qui manque, c'est la chaîne qui relie une dépense à un résultat. Tant que cette chaîne n'est pas construite, augmenter le budget IA revient à accélérer sans tableau de bord. Le plafond de 1 500 dollars n'est pas une défiance envers l'IA — c'est le premier instrument de mesure qu'Uber installe, après coup, sur un moteur qu'il avait lancé à plein régime.

La séquence Uber-Microsoft de mai-juin 2026 marque la fin d'une illusion : celle d'une IA dont le coût se signerait une fois pour toutes. Le logiciel agentique se paie à l'usage, et l'usage se gouverne. Les organisations qui réussiront leur transition ne seront pas celles qui dépensent le plus, ni celles qui adoptent le plus vite — ce sont celles qui auront, avant de déployer, défini ce qu'elles mesurent et ce qu'elles plafonnent. La question n'est plus « combien coûte l'IA », mais « savons-nous relier ce qu'elle coûte à ce qu'elle nous rapporte ». Uber, pour l'instant, répond non.

Questions fréquentes

Pourquoi le budget IA d'Uber a-t-il explosé si vite ?

Uber a encouragé l'adoption massive des agents de code (Claude Code, Cursor) en instaurant un classement interne récompensant les équipes les plus consommatrices. L'adoption de Claude Code est passée de 32 % à 84 % des ingénieurs concernés entre décembre 2025 et mars 2026, avec un coût mensuel par développeur compris entre 500 et 2 000 dollars. Combinée à une facturation à l'usage (au token), cette adoption a consommé l'intégralité du budget IA annuel 2026 en quatre mois.

Qu'est-ce que le plafond de 1 500 dollars change concrètement ?

Uber a fixé un plafond mensuel de 1 500 dollars par employé et par outil — Claude Code et Cursor sont comptés séparément. Chaque salarié dispose d'un tableau de bord interne traçant sa consommation, et les dépassements sont autorisés au cas par cas. L'objectif n'est pas d'interdire l'IA mais de transformer une dépense ouverte en dépense gouvernée, avec un seuil visible par tête.

Pourquoi le coût de l'IA augmente alors que le prix des tokens baisse ?

Le prix unitaire du token baisse — Gartner anticipe une inférence 90 % moins chère d'ici 2030. Mais les modèles agentiques consomment 5 à 30 fois plus de tokens par tâche que la génération de texte classique, car ils raisonnent en plusieurs étapes, lisent du contexte et s'auto-corrigent. La baisse du prix unitaire est plus que compensée par l'explosion du volume consommé. Résultat : la facture monte malgré des tokens moins chers.

Microsoft a-t-il vraiment abandonné Claude Code ?

Microsoft annule la majorité de ses licences Claude Code internes dans sa division Experiences & Devices (Windows, Microsoft 365, Outlook, Teams, Surface), avec une échéance fixée au 30 juin 2026. Le pilote, lancé en décembre 2025 auprès d'environ 5 000 ingénieurs, avait atteint un taux d'adoption de 84 à 95 % en avril 2026 — et consommé son budget annuel sous l'effet de la facturation au token. Le cas confirme qu'Uber n'est pas une exception.

Comment une PME peut-elle éviter le même dérapage ?

En cadrant avant de déployer : fixer un plafond par utilisateur, suivre la consommation en temps réel, choisir des forfaits à coût fixe quand l'usage est prévisible plutôt qu'une facturation à l'usage, et surtout définir une métrique de valeur (fonctionnalités livrées, tickets résolus, temps gagné) plutôt que de récompenser la consommation brute. Le piège d'Uber n'est pas d'avoir utilisé l'IA, c'est d'avoir mesuré l'usage au lieu de mesurer le résultat.