Anthropic dit que Claude Mythos a trouvé 10 000 failles critiques avant les hackers
Le chiffre a de quoi faire lever les yeux des équipes sécurité : plus de 10 000 vulnérabilités de gravité élevée ou critique déjà repérées par un modèle d’IA dans des composants open source. Derrière cette annonce, Anthropic cherche à imposer un récit inverse à celui qui domine depuis des mois : les grands modèles ne serviraient pas seulement à automatiser l’attaque, mais aussi à industrialiser la défense.
Anthropic met un nombre massif sur la table
Dans une mise à jour publiée le 22 mai 2026, Anthropic affirme que Project Glasswing et ses environ 50 partenaires ont utilisé Claude Mythos Preview pour identifier plus de 10 000 vulnérabilités jugées high ou critical dans de grands projets open source.
Le chiffre frappe d’abord par son ordre de grandeur. Dans la cybersécurité, les annonces autour de l’IA restent souvent vagues, formulées en gains de productivité ou en promesses de détection “augmentée”. Ici, Anthropic avance un volume de découvertes présenté comme déjà mesurable, et l’associe à un programme structuré de divulgation coordonnée.
Le second élément concret se trouve sur le tableau public de coordinated vulnerability disclosure d’Anthropic. Au 22 mai 2026, celui-ci affichait 1 596 vulnérabilités divulguées concernant 281 projets open source. Parmi elles, 97 étaient indiquées comme corrigées, et 88 associées à un identifiant CVE ou GHSA.
Ces chiffres ne se superposent pas exactement aux “plus de 10 000” vulnérabilités détectées. C’est justement l’un des points les plus importants du dossier : Anthropic distingue clairement la masse de vulnérabilités trouvées du sous-ensemble entré dans le processus public de divulgation, puis de la part effectivement corrigée et cataloguée.
Derrière Project Glasswing, une tentative d’industrialiser la chasse aux failles
Le programme Glasswing vise à utiliser un modèle de langage comme moteur de recherche de vulnérabilités à grande échelle sur des bases de code ouvertes. Le nom du modèle, Claude Mythos Preview, compte ici autant que le cadre : Anthropic ne décrit pas une simple démonstration en laboratoire, mais un dispositif opéré avec un réseau d’une cinquantaine de partenaires.
Cette architecture compte. La découverte de vulnérabilités n’est pas seulement un problème de génération d’hypothèses techniques. Il faut aussi sélectionner des cibles, reproduire les bugs, rédiger des rapports exploitables, coordonner avec les mainteneurs, attendre parfois des semaines, puis publier sans exposer prématurément les utilisateurs. C’est souvent à cet endroit que les promesses de l’IA se heurtent au réel. En mettant en avant un tableau public de divulgation, Anthropic essaie de montrer que la chaîne complète existe.
L’annonce suggère aussi un usage de l’IA comme amplificateur de couverture. Le logiciel open source repose sur un paradoxe bien connu : il alimente une grande partie de l’infrastructure mondiale, mais une fraction significative de ces briques critiques est maintenue par de petites équipes, parfois bénévoles, avec peu de moyens d’audit. Si un modèle permet de passer au crible des pans entiers de code avec un coût marginal faible, l’intérêt stratégique devient évident.
Un renversement narratif dans la course à l’IA offensive et défensive
L’angle le plus fort de cette annonce tient moins à la technique qu’au récit qu’elle installe. Les grands modèles sont régulièrement décrits comme des multiplicateurs de risque offensif : aide à l’écriture de payloads, à l’analyse de code, au repérage d’erreurs de configuration, voire à la production d’exploits plus accessibles à des profils moins expérimentés.
Anthropic choisit de mettre en avant le miroir exact de cette crainte : le même type de système peut aussi augmenter la capacité défensive, à condition d’être inséré dans un cadre de divulgation responsable. Dit autrement, l’automatisation n’est pas réservée aux attaquants.
Ce point est loin d’être anecdotique. Depuis 2024, une partie du débat public sur l’IA en cybersécurité repose sur une asymétrie présumée : l’attaque profiterait plus vite et plus fortement de ces outils que la défense. L’annonce de Glasswing n’invalide pas cette inquiétude, mais elle lui oppose un début de contre-preuve quantitative. Le chiffre de 10 000 sert précisément à cela : montrer qu’il ne s’agit plus seulement de quelques proofs of concept, mais d’un volume de découverte présenté comme industriel.
Le vrai test n’est pas la détection, mais la correction
Reste une réalité moins spectaculaire : trouver une faille n’équivaut pas à sécuriser le système. Le tableau de divulgation d’Anthropic fournit sur ce point une lecture plus nuancée que le chiffre brut.
Sur 1 596 vulnérabilités divulguées touchant 281 projets, seulement 97 étaient marquées comme corrigées au 22 mai, soit un peu plus de 6 % du total publié. 88 seulement disposaient d’un identifiant CVE ou GHSA, ce qui montre aussi le temps nécessaire pour transformer une découverte technique en artefact pleinement intégré aux circuits standards de la sécurité.
Cette latence n’a rien d’inhabituel. Dans l’open source, le goulot d’étranglement se situe souvent du côté des mainteneurs : valider un rapport, confirmer l’impact, produire un correctif sans casser la compatibilité, préparer une publication coordonnée. Une IA peut augmenter brutalement le flux entrant de signalements ; elle ne crée pas automatiquement la capacité humaine pour les absorber.
C’est, au fond, la contradiction centrale de ce type d’initiative. Plus la détection devient abondante, plus le traitement opérationnel devient difficile. Une campagne de découverte très efficace peut même mettre sous pression des équipes déjà fragiles. Le bénéfice global dépend alors de la qualité du tri, de la reproductibilité des rapports et du soutien apporté aux projets concernés.
Ce que les chiffres disent — et ce qu’ils ne disent pas encore
Le “plus de 10 000” avancé par Anthropic impressionne, mais il appelle plusieurs précautions de lecture.
D’abord, l’entreprise parle de vulnérabilités de gravité élevée ou critique détectées “depuis le lancement du programme”. Cela ne signifie pas que ces 10 000 cas ont tous été divulgués, validés publiquement ou corrigés. Une partie peut être en cours d’examen, en attente de reproduction, regroupée avec d’autres signalements, ou finalement requalifiée.
Ensuite, le volume seul ne renseigne pas sur la distribution du risque. Dix mille failles dans des dépendances marginales n’auraient pas le même poids que quelques centaines dans des bibliothèques massivement utilisées. Anthropic mentionne des “projets open source majeurs”, mais le bilan public disponible au 22 mai donne surtout une photographie de pipeline, pas encore une cartographie exhaustive de l’impact systémique.
Enfin, la qualité de la détection compte autant que sa quantité. Dans la recherche de vulnérabilités, les false positives peuvent engloutir énormément de temps côté mainteneurs. L’intérêt du programme sera donc jugé, à terme, sur la proportion de signalements réellement exploitables, la rapidité de correction et la réduction mesurable de l’exposition dans les chaînes logicielles.
Une bataille d’image, mais aussi un signal pour l’industrie
Anthropic ne publie pas seulement une performance technique ; l’entreprise envoie aussi un message politique au secteur. Les débats sur la sûreté des modèles ont souvent placé les éditeurs dans une position défensive, sommés d’expliquer comment empêcher les usages malveillants. Avec Glasswing, Anthropic se présente comme un acteur capable d’apporter un bénéfice de sécurité concret, vérifiable par des sources primaires et un tableau public.
Le signal est susceptible d’être entendu bien au-delà de l’écosystème open source. Les grands éditeurs de logiciels, les opérateurs cloud et les intégrateurs sécurité cherchent tous à comprendre si les modèles génératifs peuvent devenir des outils de secure code review, de fuzzing assisté ou de variant analysis à l’échelle. Si Anthropic parvient à démontrer que cette approche produit non seulement des découvertes, mais aussi des correctifs et des références standardisées, la pression montera sur le reste du marché.
Le prochain jalon sera simple à mesurer
L’annonce d’Anthropic marque moins un point final qu’un point de départ observable. Le prochain test ne sera pas un nouveau chiffre spectaculaire, mais l’évolution de trois indicateurs publics : le nombre de vulnérabilités effectivement divulguées, la part corrigée, et la proportion obtenant un CVE ou un GHSA.
Si ces courbes montent nettement dans les prochains mois, Glasswing pourra être regardé comme une preuve que l’IA défensive produit un effet concret sur la sécurité du logiciel mondial. Si, au contraire, l’écart persiste entre les 10 000 vulnérabilités trouvées et la petite fraction absorbée par les mainteneurs, le programme illustrera surtout une autre réalité : en cybersécurité, la découverte est désormais scalable, mais la remédiation reste le vrai facteur limitant.