Claude Mythos : pourquoi Anthropic refuse de le publier
Claude Mythos change déjà la discussion autour des modèles IA avancés. Ici, il n’est plus seulement question de chatbot ou de productivité. Le sujet touche directement le code, les failles zero-day et la défense logicielle.

Cette actualité compte, car Anthropic ne présente pas Mythos comme une simple évolution. L’entreprise le place dans un accès contrôlé, via Project Glasswing, avec un discours centré sur le risque d’usage offensif. Cela suffit à créer une vraie demande d’explication côté développeurs, RSSI et équipes produit.
À retenir
- Claude Mythos n’est pas publié au grand public.
- Le programme Project Glasswing finance jusqu’à 100 M$ de crédits.
- Le modèle affiche 93,9 % sur SWE-bench Verified et 83,1 % sur CyberGym.
Claude Mythos change d’échelle en cybersécurité
Anthropic a lancé Project Glasswing le 7 avril 2026. Le programme réunit des acteurs comme AWS, Apple, Microsoft, Cisco, CrowdStrike ou la Linux Foundation. L’objectif affiché reste défensif : aider les organisations qui maintiennent des logiciels critiques à prendre de l’avance. Anthropic promet aussi jusqu’à 100 millions de dollars de crédits et 4 millions de dollars de dons pour la sécurité open source.
Le point le plus important est ailleurs. Claude Mythos Preview n’est pas présenté comme un pur modèle cyber. Anthropic explique que ses performances en sécurité viennent surtout de progrès plus larges en raisonnement, en code agentique et en capacité à modifier des logiciels complexes. Donc, plus le modèle devient bon pour coder, plus il devient potentiellement utile pour trouver ou corriger des failles.

Les résultats annoncés sont difficiles à ignorer. Anthropic affirme que Mythos a déjà identifié des milliers de vulnérabilités zero-day à travers des infrastructures critiques. Le laboratoire dit aussi qu’il peut trouver et exploiter des failles dans tous les grands systèmes d’exploitation et navigateurs, avec au moins un bug corrigé vieux de 27 ans dans OpenBSD.
Ce que disent vraiment les benchmarks
Sur le code, le saut est net. Les Numériques rapporte 93,9 % sur SWE-bench Verified pour Mythos, contre 80,8 % pour Claude Opus 4.6. Sur SWE-bench Pro, le modèle monte à 77,8 % contre 53,4 %. Ce n’est pas un simple gain marginal. Cela ressemble plutôt à un changement de classe sur l’ingénierie logicielle.
Le signal devient encore plus fort côté sécurité. Mythos atteint 83,1 % sur CyberGym contre 66,6 % pour le précédent meilleur modèle maison. Sur Cybench, Anthropic revendique même 100 %. En clair, le modèle se rapproche d’un outil capable d’enchaîner analyse, compréhension du contexte, reproduction et exploitation.
Pour un lecteur SEO, l’intérêt est simple. Ces chiffres changent la manière d’évaluer une IA. On ne regarde plus seulement la qualité d’une réponse textuelle. On mesure désormais la capacité à agir sur un dépôt, un binaire, un navigateur web ou une chaîne logicielle complète.
Pourquoi Anthropic garde le modèle fermé
La raison officielle tient à la dualité du produit. Un modèle capable de corriger des failles peut aussi les exploiter. Anthropic insiste sur ce point dans son billet technique. L’entreprise précise même que plus de 99 % des vulnérabilités trouvées n’ont pas encore été patchées, ce qui limite fortement ce qu’elle peut publier.
Ce choix n’est donc pas qu’un argument marketing. Il répond aussi à une logique de divulgation coordonnée, avec une gated research preview au lieu d’une diffusion ouverte. Autrement dit, Anthropic essaie de ralentir la dissémination offensive tout en accélérant les usages défensifs chez quelques partenaires triés.
Ce que cela change pour le marché IA
Le sujet dépasse Anthropic. Claude Mythos montre que la prochaine bataille de l’IA ne se jouera pas seulement sur la conversation. Elle se jouera aussi sur les agents capables de lire du code, d’orchestrer des tests, d’ouvrir une sandbox et de proposer une correction crédible. C’est exactement là que les benchmarks prennent soudain une valeur produit.
Pour remettre cela en perspective, Geekinfos a déjà suivi la montée des modèles orientés exécution avec modèle GPT-5.4 et la diffusion plus large de ces usages dans IA générative en France. Claude Mythos pousse simplement cette logique beaucoup plus loin, dans un terrain où l’erreur coûte plus cher.
En pratique, Claude Mythos ne change pas encore le quotidien du grand public. En revanche, il modifie déjà la lecture du marché pour les équipes sécurité, les éditeurs et les développeurs avancés. Quand un modèle ne peut pas être publié sans garde-fous lourds, cela dit quelque chose de très concret sur le niveau atteint par l’IA actuelle.
Mini-FAQ
Claude Mythos est-il public ?
Non. Le modèle reste dans un accès contrôlé via Project Glasswing.
Pourquoi Anthropic le bloque-t-il ?
Parce que ses capacités en cybersécurité peuvent servir autant à défendre qu’à exploiter des failles.
Quel chiffre résume le mieux son avance ?
Le plus parlant reste 93,9 % sur SWE-bench Verified, avec 83,1 % sur CyberGym.


