Claude Fable 5 : l'IA jugée trop dangereuse arrive sur le marché

Le 9 juin 2026, Anthropic a mis en ligne Claude Fable 5, le modèle le plus puissant jamais rendu accessible au grand public — le même, sous le capot, que Claude Mythos, ce modèle qu'Anthropic refusait de commercialiser en avril parce qu'il découvrait seul des milliers de failles de cybersécurité. Entre les deux, un dispositif inédit : des garde-fous qui interceptent les requêtes sensibles et les redirigent vers Opus 4.8, le modèle précédent. Résultat : des records sur quasiment tous les benchmarks publics, une démonstration de responsabilité saluée jusque dans la presse généraliste… et un tarif exactement doublé par rapport à Opus 4.8. La séquence mérite d'être regardée de près, parce qu'elle dessine la grille de lecture des dix-huit prochains mois : une IA à deux vitesses, et une facture qui change d'ordre de grandeur.

1. Ce qu'Anthropic a annoncé, exactement

L'annonce officielle couvre deux modèles. Claude Mythos 5, d'abord : la nouvelle frontière interne d'Anthropic, décrite dans la system card comme « le modèle le plus capable que nous ayons jamais entraîné ». Il n'est pas en vente libre : il reste réservé aux partenaires du programme Project Glasswing, le dispositif de cyberdéfense monté avec le gouvernement américain et les grands acteurs du logiciel critique. Claude Fable 5, ensuite : le même modèle, équipé de garde-fous supplémentaires, et disponible partout dès le premier jour — API Claude, AWS Bedrock, Vertex AI, Microsoft Foundry, claude.ai et Claude Code.

La nuance sémantique est assumée par Anthropic jusque dans l'étymologie : fabula, « ce qui est raconté » en latin, cousin du grec mythos. Même racine, deux noms : « les garde-fous sont ce qui distingue les deux modèles, et c'est pourquoi nous leur avons donné des noms différents », écrit l'entreprise. Le site d'Anthropic liste désormais cinq familles de modèles : Mythos, Fable, Opus, Sonnet, Haiku. Une classe entière vient de s'ajouter au-dessus de ce qui était, jusqu'à lundi, le haut de gamme.

Côté spécifications : fenêtre de contexte d'un million de tokens par défaut, 128 000 tokens de sortie maximum, raisonnement adaptatif impossible à désactiver, et un identifiant API sans date (claude-fable-5). Le modèle est pensé pour le travail long : Anthropic le présente comme capable de « travailler en autonomie plus longtemps que n'importe quel modèle Claude précédent », plusieurs jours d'affilée dans un harnais agentique. L'anecdote la plus reprise vient de Stripe, testeur précoce : une migration sur une base de code Ruby de 50 millions de lignes, exécutée en une journée là où une équipe entière aurait compté plus de deux mois.

Alex Albert, Research Product Management chez Anthropic, dans la vidéo d'annonce de Claude Fable 5. — Alex Albert (Research Product Management) ouvre la vidéo d'annonce

2. Le garde-fou : une IA qui passe la main

Le cœur du lancement n'est pas un benchmark, c'est un mécanisme. Chaque requête adressée à Fable 5 passe par trois classifieurs de sécurité : cybersécurité offensive, biologie-chimie, et « distillation » (les tentatives d'extraction des capacités du modèle pour entraîner un concurrent). Si un classifieur se déclenche, la réponse n'est pas servie par Fable 5 mais par Opus 4.8, le modèle précédent — et l'utilisateur en est informé. Anthropic chiffre le déclenchement à moins de 5 % des sessions : pour les 95 % restants, écrit l'entreprise, « la performance de Fable 5 est effectivement celle de Mythos 5 ».

Schéma du mécanisme de bascule de Claude Fable 5 : la requête passe par trois classifieurs (cybersécurité, biologie-chimie, distillation) ; si aucun ne se déclenche, Fable 5 répond avec les capacités Mythos ; sinon la réponse bascule vers Opus 4.8, et l'utilisateur est informé. — Le mécanisme de bascule : Fable répond, ou passe la main à Opus 4.8

Techniquement, la bascule est visible dans l'API : un refus renvoie un statut stop_reason: "refusal" avec une catégorie (cyber, bio, reasoning_extraction), et un paramètre fallbacks en bêta permet de rejouer automatiquement la requête sur un autre modèle, sans facturation si le refus intervient avant le premier token. Dans les applications grand public — claude.ai, Claude Code, Claude Cowork — la réponse est simplement étiquetée avec le nom du modèle qui a répondu.

Angeli Jain, Safeguards Product Management chez Anthropic, explique le mécanisme de redirection vers Opus 4.8. — Angeli Jain (Safeguards Product Management) détaille les garde-fous

Ce dispositif a un coût d'usage réel, et les premiers retours le documentent déjà. Rob T. Lee, du SANS Institute, signale que des tâches de cybersécurité parfaitement légitimes — réponse à incident, forensique — déclenchent la bascule vers Opus 4.8. Des utilisateurs rapportent des faux positifs plus cocasses, jusqu'à des questions de biologie de collège. Ethan Mollick, professeur à Wharton et l'un des testeurs les plus écoutés, résume : les garde-fous « se déclenchent à la moindre allusion à un problème de sécurité… et cela arrive beaucoup trop souvent ». Anthropic reconnaît le problème et annonce des classifieurs « volontairement larges aujourd'hui », à affiner.

3. Les chiffres : des records presque partout

Sur la performance brute, le consensus est rapide : Fable 5 prend la tête de quasiment tous les classements publics. Les chiffres ci-dessous viennent de la system card officielle (319 pages), qui précise un point important : les scores de Fable 5 sont mesurés avec ses garde-fous de production actifs, bascule comprise.

Benchmark	Fable 5	Opus 4.8	GPT-5.5	Gemini 3.1 Pro
SWE-bench Verified (code)	95,0 %	88,6 %	—	80,6 %
SWE-bench Pro	80,0 %	69,2 %	58,6 %	54,2 %
Terminal-Bench 2.1 (agents)	84,3 %	82,7 %	83,4 %	70,7 %
FrontierCode Diamond (Cognition)	29,3 %	13,4 %	5,7 %	—
OSWorld-Verified (usage ordinateur)	85,0 %	83,4 %	78,7 %	76,2 %

Source : system card Claude Fable 5 & Mythos 5, table 8.1.A — anthropic.com, 9 juin 2026. Moyenne sur 5 essais.

Les benchmarks verticaux suivent la même pente : meilleur score jamais mesuré par Harvey (droit, 93,4 %), premier modèle à franchir 90 % sur le benchmark analytique de Hex, meilleur résultat historique sur le benchmark finance de Hebbia, et la première place sur CursorBench revendiquée par Michael Truell, le PDG de Cursor. Sur la version sans bride, les chiffres montent encore : Mythos 5 atteint 94,1 % sur GPQA Diamond — un benchmark de niveau doctorat qu'Anthropic déclare désormais « saturé » et qu'elle cessera de publier.

Deux démonstrations ont concentré l'attention au-delà des benchmarks. Fable 5 a terminé Pokémon FireRed en vision pure — captures d'écran brutes, sans harnais d'assistance, ce qu'aucun Claude n'avait réussi. Et Mollick a publié le récit d'une session de neuf heures et demie de travail autonome sur une seule consigne, le modèle orchestrant lui-même des sous-agents Sonnet pour collecter 2 200 vols et horaires de trains. Sa formule a fait le tour des réseaux : « l'an dernier, je parlais de travailler avec un sorcier ; je suis désormais plus proche d'un mécène. Je ne pilote plus : je commande. »

Bureau vide la nuit, un poste de travail allumé où un agent IA travaille seul pendant des heures — illustration de l'autonomie longue durée de Fable 5. — Des heures de travail autonome, sans intervention humaine

4. L'IA à deux vitesses devient officielle

La nouveauté structurelle du 9 juin n'est pas la performance : c'est la ségmentation de l'accès. D'un côté, Mythos 5 intégral pour quelques centaines d'organisations triées sur le volet — environ 200 partenaires Glasswing en avril, élargis à 150 organisations supplémentaires début juin, dans plus de 15 pays, en coordination avec le gouvernement américain et, côté européen, l'ENISA. De l'autre, Fable 5 sous garde-fous pour tout le monde. Entre les deux, un bilan déjà tangible : plus de 10 000 vulnérabilités critiques découvertes par les partenaires Glasswing avec Mythos Preview depuis avril.

Schéma de l'accès à deux vitesses : Mythos 5 intégral réservé aux partenaires Project Glasswing (gouvernement américain, 15+ pays, environ 350 organisations) ; Fable 5 avec garde-fous pour le grand public ; et la fenêtre des abonnements Pro/Max/Team du 9 au 22 juin avant bascule en crédits d'usage. — Trois niveaux d'accès à la même intelligence

Cette architecture a déclenché la principale polémique du lancement. La system card révèle des « interventions silencieuses » qui limitent l'efficacité du modèle sur les requêtes visant le développement de LLM de frontière — environ 0,03 % du trafic, sans notification à l'utilisateur. Des voix connues de la communauté IA y ont vu une ligne rouge : Jeremy Howard a parlé d'un « jour très sombre », Nathan Lambert de laboratoires qui « relèvent l'échelle derrière eux ». S'y ajoute une rétention obligatoire de 30 jours de tout le trafic des modèles classe Mythos — rupture avec les politiques de zéro rétention — qu'Anthropic justifie par la sécurité et assortit d'un engagement : ces données ne servent pas à l'entraînement.

Fait, hypothèse, opinion : le mécanisme et les chiffres ci-dessus sont documentés par Anthropic elle-même. L'ampleur d'un éventuel rejet par les chercheurs reste, elle, du registre de l'anecdote à ce stade — aucune défection nominative vérifiable au 10 juin. Notre opinion : le précédent compte plus que le pourcentage. Un fournisseur vient d'institutionnaliser le droit de dégrader silencieusement certaines requêtes ; la question n'est plus « si » mais « jusqu'où ».

5. Le coup commercial : vertu affichée, prix doublé

Résumons la séquence du point de vue d'Anthropic. Avril : l'entreprise annonce détenir un modèle si puissant qu'elle refuse de le vendre — posture inédite dans l'industrie, couverture médiatique massive. Mai : levée de 65 milliards de dollars sur une valorisation de 965 milliards, qui fait d'Anthropic la startup IA la plus valorisée au monde, devant OpenAI. Juin : le même modèle arrive sur le marché, « rendu sûr », au double du prix du haut de gamme précédent. Chaque étape renforce la suivante : la retenue d'avril crédibilise la sécurité de juin, qui justifie le tarif.

Comparaison des tarifs API par million de tokens : Claude Fable 5 à 10 dollars en entrée et 50 dollars en sortie, soit le double d'Opus 4.8 (5 et 25 dollars), contre 5 et 30 dollars pour GPT-5.5 et 2 et 12 dollars pour Gemini 3.1 Pro. Rappel de la bascule des abonnements en crédits d'usage le 23 juin 2026. — 10 $ / 50 $ le million de tokens : le nouveau plafond du marché

Les chiffres méritent d'être posés froidement. Fable 5 coûte 10 $ par million de tokens en entrée et 50 $ en sortie — exactement deux fois Opus 4.8 (5 $/25 $), et « moins de la moitié » de ce que payaient les partenaires pour Mythos Preview, selon Anthropic. La concurrence est loin en dessous : GPT-5.5 à 5 $/30 $, Gemini 3.1 Pro à 2 $/12 $. Et l'appétit du modèle aggrave l'écart : conçu pour raisonner longtemps, il consomme structurellement plus de tokens par tâche. Simon Willison, parmi les premiers testeurs indépendants, a mesuré 110 $ de tokens en une seule journée d'utilisation via Claude Code, dont une session à 99 $. Son verdict tient en une phrase : « le mot juste pour Fable, c'est qu'il est gros ».

La date à retenir : le 22 juin Jusqu'au 22 juin inclus, Fable 5 est compris sans surcoût dans les abonnements Claude Pro, Max, Team et Enterprise. À partir du 23 juin, Anthropic le retire de ces forfaits : son usage exigera des crédits facturés à la consommation. Quatorze jours pour évaluer le modèle sur vos cas d'usage réels — et pour mesurer ce qu'il coûterait en régime de croisière.

Cette mécanique de bascule vers la facturation à l'usage n'est pas un détail de grille tarifaire : c'est la confirmation d'un mouvement de fond que nous documentions déjà à propos des plafonds de budget IA chez Uber — les outils d'IA quittent le monde du forfait prévisible pour celui du compteur qui tourne. Pour une PME, la conséquence est directe : le choix du modèle devient une décision budgétaire au même titre qu'un choix d'hébergement. Router chaque tâche vers le modèle le moins cher qui la réussit n'est plus une optimisation de confort : au tarif de Fable 5, c'est ce qui sépare un budget tenu d'une dérive à quatre chiffres par développeur et par mois.

6. Comparatif synthétique

	Claude Fable 5	Claude Opus 4.8	GPT-5.5	Gemini 3.1 Pro
Tarif API (in / out, $/MTok)	10 / 50	5 / 25	5 / 30	2 / 12
Contexte	1M tokens	200k–1M	400k	1M
Code (SWE-bench Pro)	80,0 %	69,2 %	58,6 %	54,2 %
Autonomie longue durée	Plusieurs jours	Heures	Heures	Heures
Particularité	Bascule Opus 4.8 sur sujets sensibles, rétention 30 j	Reste le défaut des abonnements	Réponse attendue (GPT-5.6 en rumeur)	Meilleur rapport coût/perf

Données au 10 juin 2026. Benchmarks : system card Anthropic ; tarifs : pages officielles des éditeurs.

7. Notre lecture

Trois choses sont vraies en même temps, et c'est ce qui rend ce lancement intéressant.

Un : le saut de capacité est réel. Les benchmarks convergent avec les retours de terrain indépendants — Karpathy parle d'un « changement d'échelle méritant un saut de version majeur », et les sessions autonomes de plusieurs heures sont documentées par des tiers. Pour le travail long et complexe — migrations, audits de code, analyses financières ou juridiques multi-documents — il n'y a objectivement pas d'équivalent sur le marché au 10 juin 2026.

Deux : la sécurité est devenue un produit. Anthropic a transformé une contrainte (un modèle invendable en l'état) en architecture commerciale : la version dangereuse crédibilise la version bridée, le programme gouvernemental crédibilise l'entreprise, et le tout justifie un prix que personne d'autre n'ose pratiquer. C'est remarquablement exécuté. C'est aussi un précédent : l'accès à la pleine capacité des modèles de frontière se décide désormais entre un laboratoire privé et un gouvernement, organisation par organisation. Pour les entreprises européennes, la présence de l'ENISA dans Glasswing est une porte entrouverte, pas une garantie.

Trois : la facture devient le sujet. Un modèle deux fois plus cher, qui raisonne plus longtemps, donc consomme plus, et qui sort des forfaits le 23 juin : tout pousse vers une discipline de coûts que la plupart des organisations n'ont pas encore. Les quatorze jours de la fenêtre d'essai sont l'occasion de mesurer, pas de s'enthousiasmer : quelles tâches justifient Fable 5, lesquelles tournent aussi bien sur Opus 4.8, Sonnet ou un modèle à 2 $ le million de tokens. Ce travail de routage — le bon modèle au bon endroit — est exactement celui que la bascule à l'usage rend rentable dès le premier mois.

Le modèle jugé trop dangereux est en ligne. La vraie question, pour vous, n'est pas philosophique : c'est de savoir, chiffres en main, ce qu'il vous coûterait — et ce qu'il vous rapporterait.

Claude Fable 5 : l'IA jugée trop dangereuse arrive sur le marché — au double du prix

1. Ce qu'Anthropic a annoncé, exactement

2. Le garde-fou : une IA qui passe la main

3. Les chiffres : des records presque partout

4. L'IA à deux vitesses devient officielle

5. Le coup commercial : vertu affichée, prix doublé

Simulateur : que coûterait votre usage ?

6. Comparatif synthétique

7. Notre lecture

Nous avons 30 minutes.
Parlons-en.

1. Ce qu'Anthropic a annoncé, exactement

2. Le garde-fou : une IA qui passe la main

3. Les chiffres : des records presque partout

4. L'IA à deux vitesses devient officielle

5. Le coup commercial : vertu affichée, prix doublé

Simulateur : que coûterait votre usage ?

6. Comparatif synthétique

7. Notre lecture

Nous avons 30 minutes.Parlons-en.

Nous avons 30 minutes.
Parlons-en.