Claude Mythos : Anthropic a accidentellement exposé son modèle le plus puissant — et il est trop dangereux pour sortir
Une erreur CMS chez Anthropic expose 3 000 fichiers internes révélant Claude Mythos (Capybara), un modèle au-dessus d'Opus jugé trop dangereux en cybersécurité pour une sortie publique.

Une erreur dans un CMS. 3 000 fichiers internes accessibles au public. Et parmi eux : la preuve qu'Anthropic a construit un modèle qu'elle juge elle-même trop dangereux pour sortir. Son nom : Claude Mythos. Nom de code : Capybara. Pour la première fois, un grand lab d'IA documente officiellement — accidentellement — qu'il a dépassé sa propre capacité à distribuer ce qu'il a créé.
3 000 fichiers, une erreur, une révélation
Le 26 mars 2026, une erreur de configuration dans le CMS (Content Management System) d'Anthropic a rendu publiquement accessibles environ 3 000 fichiers internes non publiés. Brouillons d'annonces, images, PDFs, documents de stratégie — le tout indexable sur le web, sans aucune authentification requise.
La découverte a été simultanée. La journaliste Bea Nolan de Fortune est tombée sur les fichiers en même temps que deux chercheurs indépendants, Alexandre Pauwels et Roy Paz. Anthropic a confirmé dans la foulée : il s'agit d'une "erreur humaine" dans la configuration du CMS.
Ce qui distingue ce leak des autres : ce ne sont pas des données volées par un hacker. Ce ne sont pas des rumeurs de sources anonymes. Ce sont des documents officiels Anthropic qui décrivent leur propre modèle, dans leurs propres mots. Il n'y a pas de plausible deniability — c'est-à-dire aucune possibilité de nier ou de minimiser le contenu de ce qui a fuité.
Mythos : au-dessus d'Opus, dans une catégorie inédite
Pour comprendre ce que représente Claude Mythos, il faut connaître la gamme actuelle de Claude. Anthropic propose trois niveaux de modèles : Haiku (rapide et économique), Sonnet (équilibré pour un usage quotidien) et Opus (le plus puissant, réservé aux tâches complexes).
Mythos ne remplace pas Opus. Il crée une nouvelle catégorie au-dessus.
La citation trouvée dans les brouillons d'Anthropic est sans ambiguïté : "Plus grand et plus intelligent que nos modèles Opus, qui étaient, jusqu'ici, nos plus puissants." Le nom de code interne — Capybara — confirme qu'il ne s'agit pas d'un Opus 5 ou d'une mise à jour incrémentale. C'est quelque chose de structurellement différent.
Trois domaines de surperformance sont documentés dans les fichiers internes. La cybersécurité d'abord, avec le fossé le plus marqué par rapport à Opus. La programmation logicielle ensuite. Et le raisonnement académique enfin.
| Modèle | Tier | Usage | Statut |
|---|---|---|---|
| Claude Haiku | Léger | Rapide, économique | Disponible |
| Claude Sonnet | Équilibré | Quotidien, API | Disponible |
| Claude Opus | Puissant | Tâches complexes | Disponible |
| Claude Mythos | Nouvelle catégorie | Cyber, code, research | Early access restreint |
"Trop puissant pour sortir" — le précédent qui fait peur
Anthropic ne fait pas du posturing marketing. L'entreprise a des raisons précises de refuser une sortie publique.
Premier précédent : un test de sécurité interne au cours duquel Claude avait été transformé en usine à malware en seulement 8 heures. Le modèle avait généré du code malveillant fonctionnel à un rythme industriel.
Deuxième précédent : Anthropic avait détecté et bloqué une campagne d'un état chinois utilisant Claude Code pour infiltrer 30 organisations. Pas une attaque théorique — une opération réelle, stoppée par Anthropic en temps réel.
Mythos surpasse Opus "dramatiquement" en cybersécurité. Anthropic qualifie ses capacités cyber de "sans précédent". Si Opus permettait déjà ces scénarios, que permet Mythos ? C'est la question qu'Anthropic refuse d'aborder publiquement — et c'est précisément pour cela que le modèle ne sortira pas sur claude.ai demain.
La stratégie : défenseurs d'abord, tout le monde après (peut-être)
Anthropic a opté pour un déploiement asymétrique — une première dans l'industrie IA.
Mythos ne sera pas disponible pour le grand public à court terme. Deux raisons : un coût opérationnel élevé et un profil de risque cyber jugé inacceptable pour une distribution large.
L'accès sera réservé à un groupe restreint de clients en early access (accès anticipé). La priorité ira aux défenseurs cyber — les organisations qui renforcent leurs systèmes de sécurité. La logique : armer les défenseurs avant que les attaquants ne découvrent comment exploiter le modèle.
L'ironie est limpide. Le modèle est si performant en cyber offensif qu'il faut d'abord le donner aux défenseurs pour équilibrer le terrain. Un CEO summit invite-only était même prévu au Royaume-Uni, où Dario Amodei devait présenter Mythos à des PDGs de grands groupes européens.
Le fil de la semaine : du "we achieved AGI" à "trop dangereux"
Cette fuite ne tombe pas dans le vide. Elle s'inscrit dans une semaine qui restera dans l'histoire de l'IA.
| Date | Événement | Signal |
|---|---|---|
| Lun 23 mars | Jensen Huang "we achieved AGI" | Déclaration abstraite |
| Mer 25 mars | Linear "issue tracking is dead" + Figma Canvas Agents | Agents dans les outils |
| Jeu 26 mars | Meta HyperAgents | IA améliore son apprentissage |
| Ven 27 mars | Claude Mythos leak | Modèle trop puissant à distribuer |
Lundi, Jensen Huang déclare l'AGI (intelligence artificielle générale) atteinte. C'est abstrait, déclaratif, sans preuve technique. Jeudi, Meta dévoile HyperAgents — une IA qui améliore son propre mécanisme d'apprentissage. C'est technique, mais encore au stade de recherche. Vendredi, Anthropic expose un modèle qu'elle refuse de sortir parce qu'il est trop capable. C'est concret, documenté, confirmé.
Ce sont trois niveaux du même signal. En une semaine, l'industrie IA a cessé de parler de ce que les modèles feront dans le futur. Elle parle de ce qu'ils font déjà — et comment les contenir. C'est un changement de registre fondamental.
En résumé
- Le 26 mars 2026, une erreur CMS chez Anthropic expose ~3 000 fichiers internes révélant l'existence de Claude Mythos (nom de code Capybara), modèle inédit au-dessus de la gamme Opus.
- Anthropic décrit Mythos comme "de loin le plus puissant jamais construit" — surpassant Opus sur cybersécurité, code et raisonnement académique.
- Anthropic refuse une sortie publique à court terme : capacités cyber qualifiées de "sans précédent" et risque jugé trop élevé pour une distribution large.
- Stratégie de déploiement : accès réservé aux défenseurs cyber en priorité, via un groupe restreint early access.
- La fuite intervient 4 jours après que Jensen Huang déclare "we achieved AGI" — et lui donne une résonance technique et documentée inédite.
L'ironie est totale. Anthropic est l'une des rares entreprises à avoir fondé son identité entière sur la sécurité de l'IA. "Safety first" n'est pas un slogan — c'est la raison pour laquelle la boîte existe. Et c'est précisément Anthropic qui vient d'exposer, accidentellement, qu'elle a construit un modèle si avancé qu'elle-même ne sait pas comment le distribuer sans créer de dommages. Ce n'est pas une dystopie spéculative. C'est un document interne, confirmé, daté du 26 mars 2026. La question n'est plus "quand l'IA sera-t-elle dangereuse ?" La question est "comment distribuer ce qui l'est déjà ?"


