La guerre du compute : IA vs Gaming

En 2020, NVIDIA tirait la moitié de ses revenus du gaming. En 2025, le gaming ne représente plus que 9 % de son chiffre d'affaires — le datacenter en pèse 91 %. Le silicium n'a pas changé. Les architectures (Ada, Blackwell) sortent des mêmes wafers TSMC. Le client, lui, a basculé. Parallèlement, le plus gros jeu jamais produit, GTA VI, se prépare à sortir en mai 2026 avec un budget estimé à 1 à 2 milliards de dollars — montant qui, en 2026, coûte moins cher qu'un seul entraînement d'IA frontalière projeté par Epoch AI. Et pendant que Rockstar finalise neuf ans de travail artisanal, Google DeepMind, Microsoft et NVIDIA publient des modèles qui génèrent le jeu image par image. Cet article raconte ce basculement, chiffres sourcés à l'appui.

1. Le même silicium, deux packaging

Il faut commencer par un fait technique souvent ignoré : la RTX 5090 qui anime un PC gaming haut de gamme et le B200 qui entraîne GPT-5 ou Claude Opus 4.7 partagent la même architecture. Tous deux appartiennent à la génération Blackwell, annoncée par NVIDIA en mars 2024, fabriquée par TSMC sur le process 4N (une variante 5 nm optimisée). La RTX 5090 embarque 92 milliards de transistors, le B200 en embarque 208 milliards (deux dies reliés). Mais le design des cœurs CUDA, des tensor cores, des RT cores, de la pipeline graphique, tout cela vient d'une même famille architecturale.

Ce qui les distingue, c'est l'emballage. Trois différences principales :

La mémoire. La RTX 5090 utilise de la GDDR7 (32 Go), rapide mais moins dense et moins adaptée aux modèles géants. Le B200 embarque de la HBM3e (192 Go par GPU), empilée directement à côté du die via un interposer silicium. La HBM3e coûte environ dix fois plus cher par gigaoctet mais fournit un débit mémoire décuple.
L'interconnect. La RTX 5090 se parle à son hôte via un bus PCIe 5.0. Le B200 utilise NVLink 5, qui permet à huit GPU de se comporter comme un unique processeur virtuel partagé. C'est cet interconnect qui rend possibles les entraînements à grande échelle.
Le régime thermique. La RTX 5090 a un TDP pic de 575 W, refroidie par air. Le B200 peut atteindre 1 000 W, nécessite un refroidissement liquide direct, et ne sort qu'en module rack HGX (huit cartes d'un coup).

Carte graphique NVIDIA RTX 5090 gaming et rack de serveurs HGX B200 datacenter, tous deux issus du même wafer TSMC 4N avec architecture Blackwell. — Même die, deux packaging : le gaming paye 1 800 $, le datacenter paye 40 000 $

La conséquence économique est l'écart de prix unitaire : environ 1 800 $ pour une RTX 5090, environ 40 000 $ pour une B200. Un ratio de 22. Mais le vrai ratio, celui qui compte pour NVIDIA, est l'usage. Une RTX 5090 sert un joueur à la fois. Une B200 en datacenter sert mille utilisateurs Claude simultanés. C'est ce levier qui explique pourquoi, segment par segment, le poids relatif du gaming a fondu.

2. La bascule NVIDIA : gaming stagne, datacenter explose

NVIDIA publie ses résultats par segment chaque trimestre. L'année fiscale de l'entreprise se clôt en janvier. En rapprochant les 10-K annuels déposés auprès de la SEC, la courbe est sans ambiguïté.

Barres comparant le revenu NVIDIA par segment en 2020, 2024 et 2025 : gaming stagne autour de 10 milliards de dollars, datacenter passe de 2,9 à 115,2 milliards de dollars. — Le datacenter a multiplié son chiffre par 40 en 5 ans. Le gaming, par 2.

FY2020, clôturé en janvier 2020 : 5,52 milliards de dollars de revenu Gaming, 2,98 milliards de revenu Data Center. Le gaming est le premier segment, le datacenter un second dynamique mais minoritaire. Ratio 65 / 35.

FY2024, clôturé en janvier 2024 : Gaming passe à 10,45 milliards, Data Center explose à 47,52 milliards. En quatre ans, le gaming a pris 90 %, le datacenter a été multiplié par 16. Ratio 18 / 82.

FY2025, clôturé en janvier 2025 : Gaming atteint 11,35 milliards, Data Center culmine à 115,19 milliards. En cinq ans fiscaux, le datacenter a été multiplié par 39. Le gaming, par 2,1. Ratio 9 / 91.

Autrement dit : sur chaque dollar supplémentaire généré par NVIDIA entre 2020 et 2025, 95 centimes viennent du datacenter, cinq centimes du gaming. Le gaming n'a pas disparu, il est simplement devenu un segment secondaire, dont l'entreprise s'occupe mais qui ne pilote plus ni la roadmap ni les priorités d'allocation de wafers.

Point stratégique Le gaming partage l'usine, plus la priorité. Lorsque NVIDIA doit arbitrer l'allocation limitée de capacité TSMC 4N entre un lot de RTX 5090 et un lot de B200, la marge unitaire du B200 rend l'arbitrage automatique. En 2024-2025, plusieurs pénuries de cartes grand public — dénoncées par les revendeurs et la presse spécialisée — proviennent directement de cet arbitrage.

3. GTA VI vs training frontalière : l'ordre de grandeur bascule

GTA VI doit sortir le 26 mai 2026, selon le calendrier officiel réaffirmé par Rockstar en 2025. Les estimations les plus crédibles du budget de production — relayées notamment par Jason Schreier de Bloomberg en 2024 — situent le coût total entre 1 et 2 milliards de dollars, sur environ neuf ans de développement et plus de 2 000 personnes impliquées. C'est, de très loin, le plus gros investissement jamais réalisé sur un seul produit de divertissement.

Pour mesurer l'ampleur du basculement, il faut comparer ce chiffre à ce que coûtent les modèles d'IA qui tournent aujourd'hui dans les mêmes datacenters que les GPU que NVIDIA arbitre.

Produit	Année	Coût	Source
GTA V (Rockstar)	2013	265 M$	Take-Two / analyse Pachter
Cyberpunk 2077 (CD Projekt)	2020	316 M$	CDPR rapport annuel
GPT-4 training (OpenAI)	2023	78 M$	Epoch AI
Gemini Ultra training (Google)	2023	191 M$	Epoch AI
GTA VI (Rockstar) — estimation	2026	1 000 – 2 000 M$	Bloomberg / J. Schreier 2024
AGI training — projection	2027 —	406 M$ – 8 200 M$	Epoch AI, « Can AI scaling continue through 2030 ? »

Trois constats se dégagent. Un : jusqu'en 2024, les productions AAA coûtaient plus cher à produire que les entraînements de modèles IA frontaliers. GPT-4 s'entraîne pour trois fois moins cher que Cyberpunk 2077. Deux : avec GTA VI, l'industrie du jeu atteint son propre plafond — 1 à 2 milliards de dollars pour un seul titre est une anomalie dont personne, dans le secteur, ne sait si elle peut se reproduire. Trois : au même moment, le référentiel de coût des entraînements IA décolle. Si la projection d'Epoch AI pour le prochain palier de modèles frontaliers (souvent désignés comme « AGI candidates ») se réalise, un unique training atteindra ou dépassera le coût de GTA VI d'ici 2027-2028.

Ce n'est pas un détail anecdotique. C'est une inversion de hiérarchie des coûts qui définit un secteur : le gaming a tenu le rôle d'industrie culturelle la plus chère à produire pendant toute la décennie 2010. L'IA prend ce rôle dans la décennie 2020, en utilisant le même silicium.

4. L'inversion : l'IA commence à générer le jeu

Le dernier étage du basculement est le plus récent. Entre août 2024 et février 2025, quatre annonces techniques importantes ont montré qu'au-delà de l'infrastructure, le contenu même du jeu vidéo peut maintenant être une sortie d'IA générative. Pas encore à l'échelle de GTA VI — mais les premières démonstrations existent, sont publiées, et fonctionnent.

Timeline août 2024 à février 2025 : GameNGen simule DOOM image par image, NVIDIA ACE intègre les LLM dans les NPC, Google Genie 2 génère des mondes 3D jouables, Microsoft Muse co-crée le gameplay. — En six mois, l'IA est passée d'outil de développement à générateur de jeu

GameNGen (27 août 2024, Google DeepMind). Un réseau de neurones entraîné sur des parties de DOOM génère chaque image du jeu image par image, à 20 FPS, sans moteur de jeu sous-jacent. L'utilisateur peut jouer — les contrôles sont pris en compte, la physique émerge correctement, l'ennemi se déplace. Ce n'est pas un DOOM émulé : c'est un DOOM halluciné en temps réel par un neural net. La résolution est basse, la fidélité imparfaite, mais le principe est démontré.

NVIDIA ACE (GDC 2024). NVIDIA annonce une suite de briques permettant aux développeurs d'intégrer des LLM directement dans les personnages non-joueurs. La démonstration phare, Covert Protocol en partenariat avec Inworld AI, montre un PNJ qui répond en langage naturel, décide de ses actions selon un contexte dynamique, et mémorise des interactions précédentes. Convai fournit une brique comparable. Les plus gros studios (Ubisoft, Tencent) ont annoncé des pilotes sur le sujet.

Google Genie 2 (4 décembre 2024, DeepMind). C'est le jalon grand public le plus marquant de la vague. Un foundation world model — issu du même écosystème que Gemini et entraîné sur la même infrastructure TPU Google — génère, à partir d'une image statique (photo, peinture, rendu), un environnement 3D jouable pouvant durer jusqu'à une minute. L'utilisateur peut s'y déplacer, interagir avec les objets, observer une cohérence physique plausible. Genie 2 ne produit pas encore un jeu publiable, mais il produit un prototype jouable en quelques secondes là où un level designer humain met plusieurs jours. Pour la première fois, un utilisateur peut créer son propre jeu à partir d'une image qu'il importe, sans moteur de jeu, sans coder une ligne, sans scripter un shader. Le prompt remplace la pipeline de production.

Microsoft Muse (19 février 2025). Publié dans Nature, Muse — nom public d'un système développé par Microsoft Research avec Xbox Game Studios — est un modèle générateur de gameplay conçu comme assistant de création. Il propose, étend, remixe des séquences jouables, sur la base d'entraînement au jeu multijoueur de studios comme Ninja Theory. C'est le premier modèle de ce type publié dans Nature — un détail qui compte : l'industrie demande désormais à la science de qualifier ses outils.

« Rockstar a mis neuf ans à faire GTA VI. Pendant ce même temps, l'industrie qui lui fournit son silicium a multiplié son chiffre par quarante en changeant de client. Et au moment où le jeu sort, une IA génère un niveau jouable en une seconde. Pas GTA. Pas encore. Mais l'échelle temporelle est en train de casser. »

5. Rentabilité par compute : pourquoi NVIDIA préfère l'IA

Le basculement de NVIDIA du gaming vers le datacenter n'est pas qu'une histoire de volume. C'est une histoire de rentabilité par heure de GPU allumée. Deux modèles économiques cohabitent sur le même silicium, avec des logiques opposées : le gaming est un achat ponctuel avec licence, l'IA est un abonnement récurrent avec facturation à l'usage. Voici les ordres de grandeur, calculés sur la base des tarifs publics d'avril 2026.

Usage	Revenu / heure user	Revenu / GPU / an	Modèle économique
Achat AAA classique GTA VI 70 $ × 50 h jouées	1,40 $	—	Licence unique (pas de récurrence)
Xbox Game Pass Ultimate 20 $/mois × 80 h jouées	0,25 $	—	Abonnement catalogue, GPU local joueur
Claude Pro 20 $/mois × ~40 h user	0,50 $	~10 000 $ *	Abonnement, inférence datacenter
API Claude Sonnet 3 $/15 $ par million tokens in/out	0,80 – 3 $ **	~10 000 $ *	Pay-as-you-go tokens
Agent IA enterprise reasoning + tools, usage soutenu	8 – 25 $ ***	~15 000 $ *	Abonnement B2B par siège ou usage

* Estimation ordre de grandeur : ARR Anthropic ∼ 5 Md$ (2025) / parc GPU estimé 500 000 H100-equivalent ≈ 10 000 $/GPU/an. Valeur brute, hors coûts d'opération.
** Basé sur une conversation type (15 k tokens in + 5 k out) en production sur Claude 4.5 Sonnet.
*** Basé sur tarifs enterprise publics Anthropic / OpenAI / Microsoft Copilot for Sales (40 $/mois/siège) à Zendesk AI (75 $ par agent actif).

Trois constats émergent de ce tableau. Premier constat : le revenu par heure d'usage de Claude Pro dépasse déjà le revenu par heure de gaming sur abonnement (0,50 $ contre 0,25 $). L'IA grand public est déjà deux fois plus rentable par minute d'attention que le gaming par abonnement. Pour NVIDIA, qui fournit les deux, cela signifie que le même silicium, rebadgé, génère structurellement plus de valeur aval quand il finit en datacenter.

Deuxième constat : l'agent IA enterprise est un ordre de grandeur au-dessus du gaming premium. Un agent Claude ou GPT branché sur les outils d'une entreprise facturé 500 à 2 000 $/mois par utilisateur actif — ce qui est devenu banal pour un assistant de vente, un analyste juridique ou un développeur senior augmenté — génère entre 10 et 50 fois plus de revenu par heure qu'un joueur Xbox. C'est ce segment enterprise, pas la conversation grand public, qui structure le revenu datacenter de NVIDIA.

Troisième constat, le plus important : le gaming ne facture pas le compute, l'IA le facture chaque seconde. Un joueur GTA VI paye une fois 70 $ pour jouer cinquante heures, peut-être deux cents. Le GPU qu'il utilise (sa RTX 5090) a été vendu par NVIDIA pour environ 1 800 $, une seule fois, et sa valeur ajoutée pour NVIDIA s'arrête là. À l'inverse, un B200 déployé dans un datacenter Anthropic génère plusieurs milliers de dollars de revenu API par an, pendant les trois à cinq ans de sa durée de vie opérationnelle. C'est mathématique : pour la même surface de silicium produite à TSMC, l'économie IA ferme une boucle de facturation récurrente que l'économie gaming ne ferme pas.

La bascule structurelle Le gaming vend le GPU. L'IA le loue à l'heure. Un GPU gaming génère son revenu total une fois. Un GPU IA génère son revenu total chaque année pendant cinq ans. Cette différence de modèle, plus que le volume, explique pourquoi NVIDIA privilégie ses clients datacenter dans l'allocation de capacité TSMC.

6. Ce que cette bascule signifie

Plusieurs lectures sont possibles. La première, la plus triviale, est économique : NVIDIA a changé de client principal, et cela explique son prix de marché et sa trajectoire boursière 2023-2026. Fin.

La deuxième lecture est plus intéressante : le gaming a financé l'infrastructure qui aujourd'hui l'absorbe. C'est l'industrie du jeu qui, entre 2000 et 2020, a créé le marché de masse du GPU haute performance. Ce marché a permis à NVIDIA d'investir dans la R&D qui a donné CUDA, les tensor cores, les RT cores. Ces briques, initialement conçues pour le rendu graphique, se sont révélées être exactement ce qu'il fallait pour entraîner des réseaux de neurones. Aucun ingénieur gaming ne pouvait le prévoir en 2010. En 2026, le résultat est que l'IA a besoin du même silicium que le gaming, avec des marges dix à vingt fois supérieures. Le gaming s'est fait disrupter par sa propre infrastructure.

La troisième lecture est prospective : si GameNGen, Genie 2 et Muse sont les prémices d'une génération entière de jeux générés par IA, le calendrier de production va se comprimer de plusieurs ordres de grandeur. GTA VI met 9 ans. Un jeu génératif pourrait en mettre 9 mois. Cela ne signifie pas que Rockstar sera remplacé par un modèle demain — la barrière qualitative reste énorme, et la direction artistique humaine reste irremplaçable. Mais cela signifie qu'une couche entière de jeux mid-market (production entre 1 et 50 M$) sera potentiellement recomposée. Et que la métrique « nombre de personnes nécessaires pour produire un jeu » va baisser, pas augmenter.

La quatrième lecture, pour finir, concerne les dirigeants non-gaming. Pourquoi cet article paraît dans le silo Décryptage IA d'un atelier IA sur-mesure ? Parce que cette même courbe — un outil grand public devient infrastructure critique, dont les économies basculent vers l'usage professionnel en cinq ans — se répète partout en ce moment. Le cloud personnel est devenu l'AWS des entreprises. Le smartphone grand public a absorbé les outils métier. Les LLM conversationnels grand public (ChatGPT, Claude) sont en train de devenir les API qui pilotent les processus internes. Le signal à retenir n'est pas le GPU, c'est la structure : un outil devient critique quand le marché qui l'a fait grandir n'est plus celui qui pilote sa roadmap.

7. Notre lecture

Le GPU a changé de camp. Le gaming reste un client, pas un pilote. GTA VI va sortir et battre des records, mais dans un écosystème où la priorité stratégique de son fournisseur de silicium est ailleurs. Les modèles génératifs commencent à produire du jeu directement. Le coût marginal d'un training frontier dépasse déjà le coût d'un blockbuster AAA.

Pour un dirigeant, trois questions concrètes se posent maintenant, même si son entreprise n'est ni gaming ni IA. Un : quelles technologies de consommation que nous utilisons en 2026 sont en train de devenir infrastructure critique pour quelqu'un d'autre, et qu'est-ce que cela signifie pour leur prix, leur disponibilité, leur roadmap ? Deux : les actifs internes que nous produisons à grand coût sont-ils en train de basculer dans le périmètre de ce qu'un modèle génératif peut produire à 1 % du prix ? Trois : avons-nous identifié les fournisseurs dont le client principal a changé en six trimestres, et comprenons-nous les conséquences pour notre propre dépendance ?

L'IA n'a pas tué le gaming. Elle l'a absorbé dans une chaîne industrielle plus large, dont le gaming est désormais un segment parmi d'autres. C'est la même logique qui, dans les années à venir, va reclassifier d'autres industries. Le GPU n'est pas le cas particulier. C'est le cas pionnier.

Pour aller plus loin sur l'infrastructure IA et ses chiffres : consultez notre laboratoire infrastructures IA, qui cartographie 12 873 datacenters, 29 accélérateurs et les coûts de chaque couche, de la roche au token.

1. Le même silicium, deux packaging

2. La bascule NVIDIA : gaming stagne, datacenter explose

3. GTA VI vs training frontalière : l'ordre de grandeur bascule

4. L'inversion : l'IA commence à générer le jeu

5. Rentabilité par compute : pourquoi NVIDIA préfère l'IA

6. Ce que cette bascule signifie

7. Notre lecture

Nous avons 30 minutes.Parlons-en.

Nous avons 30 minutes.
Parlons-en.