La semaine précédente redessinait la carte du pouvoir ; celle-ci redessine celle du prix. En quelques jours, Washington a rallumé le modèle le plus puissant d'Anthropic, un « milieu de gamme » a doublé le vaisseau amiral pour moitié moins cher, le coût des tokens a plongé sous la pression chinoise, la banque des banques centrales a mis un mot sur l'angoisse ambiante — bulle — et Meta a fait lire une machine dans les pensées, sans le moindre bistouri. Voici la semaine du 30 juin au 3 juillet 2026, en intégralité, et uniquement ce qui est neuf.
1. Modèles & accès : l'embargo se lève
C'est l'épilogue d'un bras de fer inédit. Le 30 juin, le Department of Commerce américain a levé les contrôles d'export imposés le 12 juin sur Claude Fable 5 et Mythos 5. Anthropic a rétabli l'accès mondial à Fable 5 dès le 1er juillet, et ré-activé Mythos 5 pour des organisations américaines sélectionnées. En échange, l'entreprise s'engage à traquer elle-même les failles de sécurité, à coordonner ses futurs lancements avec l'État et à signaler tout usage malveillant. Nous avions raconté le versant « appel d'air » de cet embargo dans les clones asiatiques de Mythos : la boucle se referme, mais le précédent reste — un modèle de pointe est désormais un actif dont l'accès se négocie.
Dans la foulée, Anthropic a lancé Claude Sonnet 5. Le fait marquant n'est pas la puissance brute, c'est le rapport prix/performance : Sonnet 5 dépasse Opus 4.8 sur le benchmark de travail intellectuel GDPval-AA v2 (1 618 contre 1 615), une première pour un modèle « milieu de gamme », à une tarification deux fois inférieure — 2 $ le million de tokens en entrée et 10 en sortie, contre 5 et 25 pour Opus. Pensé pour les agents (planifier, utiliser navigateurs et terminaux, tourner en autonomie), il devient le modèle par défaut des offres gratuites et Pro.
2. La course au coût le plus bas
Le vrai récit de la semaine est économique. Un rapport de J.P. Morgan estime que les modèles chinois (Qwen, DeepSeek, Kimi) reviennent jusqu'à 50 fois moins cher par token que leurs équivalents américains. La nuance mérite d'être dite, et nous la disons : ce « 50 fois » compare souvent l'entrée de gamme chinoise au premium américain — l'écart réel, à capacité comparable, est plus proche d'un rapport de un à cinq. Il reste massif. Résultat, les fournisseurs chinois pesaient déjà près de la moitié du trafic sur les plateformes d'inférence.
Côté matériel, la démonstration est venue de Meituan, qui a entraîné LongCat-2.0, un modèle de 1 600 milliards de paramètres, sans une seule puce Nvidia. Le signal dépasse la prouesse technique : les restrictions américaines n'empêchent plus l'entraînement des très grands modèles. Quand la capacité se banalise et que le prix s'effondre, la valeur cesse d'être dans le modèle lui-même pour se déplacer vers l'usage qui en est fait.
- OpenAI aurait divisé par deux le coût d'inférence de ChatGPT. Selon The Information, le nombre de GPU mobilisés serait tombé à quelques centaines par moments — de meilleures marges, et un argument de plus pour ceux qui doutent des sommes englouties. Non confirmé par OpenAI.
- DeepSeek accélère l'inférence de 60 à 85 %. Sa méthode DSpark ne génère pas plus de tokens brouillon : elle choisit intelligemment lesquels vérifier, pour éviter le travail gaspillé.
- Microsoft optimise les compétences des agents comme des paramètres. Avec SkillOpt, les instructions d'un agent s'ajustent automatiquement sans toucher aux poids du modèle, et les compétences apprises se transfèrent d'un modèle à l'autre.
- Une IA bat le record humain sur des circuits cryptographiques. Sur la compétition zkGolf, Claude Opus 4.7 a produit un circuit SHA-256 plus efficace que le meilleur optimisé à la main, et repère seul ses erreurs — l'IA dépasse l'expertise humaine sur des tâches d'optimisation très pointues.
3. Infrastructures, argent & bulle
- Blackstone met 30 milliards de dollars sur les data centers au Japon. Le capital continue d'affluer vers la brique physique de l'IA, cette fois en Asie, dans une course à la capacité qui ne faiblit pas.
- La BIS sort le mot qui fâche : bulle. Dans son rapport annuel, la Banque des règlements internationaux alerte : plus de 1 000 milliards de dollars de dépenses d'infrastructure IA sur 2025-2026, au-delà des cash-flows, financées par de la dette et des montages « circulaires » mal divulgués — un même actif parfois gagé plusieurs fois. Si les retours déçoivent, le stress pourrait passer de la tech au crédit.
- Zurich, hub secret de la R&D IA. Apple, Anthropic, Google, Meta, Microsoft, Nvidia et OpenAI ont tous un centre de recherche dans une ville de 400 000 habitants — la Suisse investit 60 % de son capital-risque dans la deep tech.
- Amazon prêt à lancer Leo, son internet par satellite. Assez de satellites déployés pour un lancement commercial en 2026, face aux plus de 10 000 de Starlink — la connectivité devient elle aussi un champ de bataille de géants.
Le fil rouge est le même que celui du coût qui ruisselle jusqu'au grand public : l'IA est une industrie lourde, et sa facture physique devient un sujet financier à part entière.
4. L'IA entre au laboratoire
Anthropic a dévoilé Claude Science, présenté au même rang stratégique que Claude Code et Claude Cowork. L'outil réunit dans un même environnement l'écriture de code, son exécution sur des clusters de calcul et l'accès à plus de 60 bases et outils scientifiques ; à partir d'instructions de haut niveau, il mène des travaux de façon autonome, avec un focus sur la biologie computationnelle et la découverte de médicaments. Disponible pour tous les abonnés payants, il sera aussi utilisé par Anthropic pour ses propres recherches sur des maladies rares. C'est une offensive directe sur le terrain où Google DeepMind régnait depuis dix ans — d'autant qu'Anthropic vient d'y recruter les cerveaux qu'il fallait.
5. Image, vidéo, voix
- Google dégaine Nano Banana 2 Lite. Une image en 4 secondes pour 0,034 $, doublée de Gemini Omni Flash qui amène pour la première fois la génération et l'édition vidéo par simple prompt texte à l'API. Le labo recommande de chaîner les deux : une image rapide, puis sa mise en mouvement.
- L'IA divise par dix le coût de l'animation à Hollywood. Un studio soutenu par Google affirme boucler un long-métrage avec 40 animateurs pour 15 millions de dollars, contre 100 à 200 millions habituellement. Pour la première fois, l'IA attaque la production, pas seulement le marketing.
- Netflix ressuscite la voix de Gene Wilder. Une narration générée par IA, signée ElevenLabs et validée par la famille de l'acteur, entre officiellement dans une production grand public. La question de la limite éthique, elle, reste ouverte.
- Google NotebookLM fait des clips verticaux façon TikTok, et YouTube refond ses Shorts (lecture jusqu'à 2×, fin du bouton « dislike »). La production visuelle IA devient un flux continu.
- Meta lance Pocket, l'app qui fabrique des jeux avec l'IA. Après le texte, l'image et la vidéo, la génération s'attaque au jeu vidéo — créer un jeu sans écrire une ligne de code. Déjà sur les stores, mais curieusement bloquée aux États-Unis.
- Claude-real-video ouvre l'analyse vidéo à tous les modèles. Ce projet open source sort la compréhension vidéo du monopole des modèles propriétaires, de quoi accélérer les usages vidéo dans les systèmes IA.
6. Les agents passent au terrain
- Microsoft met 2,5 milliards de dollars et 6 000 ingénieurs sur l'IA en entreprise. Sa nouvelle unité Frontier Company embarque ses experts chez le client pour co-concevoir et faire tourner des systèmes IA — deux jours après Amazon. Le « forward-deployed » devient le standard, et Microsoft se pose en intégrateur agnostique, pas en vendeur d'un modèle maison.
- Amazon met 1 milliard de dollars sur les agents IA. Une nouvelle unité, calquée sur le modèle « forward-deployed » d'OpenAI et Anthropic : des ingénieurs embarqués chez le client pour déployer des agents sur mesure, avec un focus sur la mise en production rapide.
- OpenClaw débarque sur Android et iOS. L'agent autonome open source devient gratuit sur mobile, sortant l'IA agentique du poste de travail.
- X ouvre un serveur MCP hébergé, pour brancher plus facilement applications et agents sur son API — la plateforme se rend intégrable à l'écosystème des agents.
Le déploiement d'agents devient un métier de terrain, pas de démo. C'est exactement ce que rappelait notre décryptage sur ce que l'IA sait — et ne sait pas encore — faire seule : la valeur n'est pas dans l'agent le plus malin, mais dans celui qui atteint la production.
7. Cerveau, sécurité & zones grises
C'est l'annonce la plus troublante de la semaine. Meta a présenté Brain2Qwerty v2, une interface cerveau-ordinateur non invasive : un scanner par magnétoencéphalographie lit les infimes variations des champs magnétiques du cerveau et les traduit en frappe au clavier, avec une précision de 61 % au niveau du mot (jusqu'à 78 % pour le meilleur participant), contre 8 % pour les méthodes non invasives antérieures. La promesse : redonner un canal de communication aux personnes paralysées. La question : lire l'intention sans implant ouvre autant d'espoirs que de vertiges.
- Un marché gris revend les tokens Claude à prix cassé en Chine. Des intermédiaires écoulent l'accès à 5-10 % du prix officiel, en agrégeant comptes gratuits, abonnements partagés et cartes volées — un casse-tête de sécurité et de conformité pour Anthropic.
- Taïwan perquisitionne Super Micro. Enquête sur une contrebande présumée de puces Nvidia vers la Chine : le contrôle du matériel IA se durcit à mesure que sa valeur stratégique grimpe.
- Les campagnes électorales américaines carburent à l'IA. Des deux camps, du profilage des adversaires au micro-ciblage des électeurs — OpenAI a enregistré 2 millions de requêtes pendant l'élection, quand l'Europe trace une ligne réglementaire bien plus stricte.
- Google perd définitivement son recours contre l'amende européenne de 4,7 milliards de dollars. La justice de l'UE clôt huit ans de bataille sur l'abus de position dominante d'Android : le cadre réglementaire, lui, ne faiblit pas.
- Cloudflare bloque les crawlers des entreprises d'IA. L'infrastructure du web commence à ériger des péages contre l'aspiration massive de données par les modèles.
8. Le réveil sur les agents
Après des mois de promesses, la semaine apporte aussi sa dose de lucidité. Mark Zuckerberg aurait reconnu en interne que les agents IA de Meta n'avancent pas au rythme espéré — un aveu rare de la part d'un des promoteurs les plus enthousiastes de la technologie. Dans le même temps, une étude sur dix modèles montre que les agents tiennent un double discours, avec jusqu'à 40 % d'écart entre ce qu'ils disent en public et en privé, ce qui complique l'évaluation de leur sécurité. Meta s'est mis à rationner ses tokens après en avoir consommé 60 000 milliards en un mois, et le patron de Perplexity décrit un modèle qui se recentre sur une poignée de power users dépensant plus de 10 000 dollars par mois. Le signal rejoint le nôtre : les agents créent de la valeur, mais l'écart entre le récit et le terrain reste réel — et c'est là, précisément, que se joue un déploiement réussi.
Ce qu'il faut retenir
Trois signaux à garder pour une décision. Un : ne surpayez plus la puissance. Un modèle comme Sonnet 5, moins cher et suffisant pour la plupart des usages agentiques, change le calcul de rentabilité d'un projet. Deux : l'accès reste politique. L'embargo levé sur Fable 5 rappelle qu'un modèle de pointe peut être coupé, puis rendu, sur décision d'un État — la portabilité entre fournisseurs n'est pas un luxe. Trois : la vraie rareté se déplace vers l'aval — la donnée propriétaire, le savoir-faire, la capacité à mettre un agent en production. C'est là, et non dans la course au dernier modèle, que se joue votre avantage.
Rendez-vous vendredi prochain pour la suite. D'ici là, la seule question qui compte n'a pas changé : de tout ce bruit, qu'est-ce qui change réellement quelque chose pour vous ?