PandIA

Anthropic accuse Alibaba : 25 000 faux comptes pour aspirer le cerveau de Claude

Anthropic accuse Alibaba : 25 000 faux comptes pour aspirer le cerveau de Claude

Derrière la querelle technique, les volumes donnent le vertige. Anthropic accuse Alibaba d’avoir mené, via 25 000 faux comptes et 28,8 millions d’échanges, la plus vaste opération de distillation jamais détectée contre Claude.

Une accusation hors norme, posée en pleine rivalité technologique

Le 24 juin 2026, Anthropic a publiquement accusé Alibaba d’avoir extrait illicitement des capacités de ses modèles Claude, dans ce que l’entreprise décrit comme “la plus grande attaque de distillation” qu’elle ait observée. D’après les informations rapportées par Reuters, la campagne aurait été active entre avril et juin 2026, en s’appuyant sur près de 25 000 comptes frauduleux pour générer 28,8 millions d’interactions avec Claude.

L’enjeu dépasse de loin une simple violation des conditions d’usage d’une API. Selon Anthropic, l’objectif de l’opération était de récupérer des compétences très ciblées de Claude, notamment en raisonnement agentique et en software engineering, afin d’améliorer les propres modèles d’Alibaba. Dit autrement : il ne s’agirait pas seulement de tester un concurrent, mais de siphonner des comportements jugés stratégiques dans la course aux modèles avancés.

La qualification employée par Anthropic est lourde de sens. Dans l’industrie de l’IA, la distillation désigne habituellement une méthode légitime consistant à entraîner un modèle plus petit ou plus spécialisé à partir des sorties d’un modèle plus performant. Ce qui est en cause ici, c’est une version non autorisée de cette pratique : l’usage massif de requêtes pour reproduire, capter ou imiter des capacités sans accès au modèle source lui-même.

Ce que recouvrent vraiment 28,8 millions d’interactions

À ce niveau, les chiffres transforment un incident technique en affaire industrielle. 28,8 millions d’échanges sur une période d’environ trois mois représentent une intensité rarement associée à des usages “normaux”, même à grande échelle. Le volume suggère une automatisation structurée, avec des comptes multiples, des scénarios de requêtes calibrés et un objectif de collecte systématique.

Une opération pensée pour contourner les garde-fous

Le recours à 25 000 comptes frauduleux laisse entrevoir une stratégie classique d’évitement des mécanismes de détection : dispersion du trafic, rotation des identifiants, dilution des signaux anormaux et capacité à maintenir l’accès malgré d’éventuelles suspensions. Pour un fournisseur comme Anthropic, le défi n’est pas seulement de bloquer une requête suspecte, mais d’identifier un comportement cohérent dans une mer d’interactions qui, prises individuellement, peuvent sembler banales.

La mention des capacités visées est également instructive. Le raisonnement agentique renvoie à l’aptitude d’un modèle à enchaîner des actions, planifier, utiliser des outils ou résoudre des tâches complexes en plusieurs étapes. Le software engineering, lui, concentre une valeur commerciale directe : génération de code, correction de bugs, navigation dans des bases de code, production de tests ou assistance au développement. Ce sont précisément les segments où se joue une partie de la monétisation actuelle des grands modèles.

Une extraction sans voler les poids du modèle

Le point clé est là : dans ce type d’attaque, il n’est pas nécessaire de dérober les weights du modèle. Les réponses suffisent. En multipliant les prompts, en variant les formulations, en observant les chaînes de raisonnement visibles ou les structures de réponse, un acteur peut constituer un corpus massif d’exemples destiné à entraîner, affiner ou évaluer ses propres systèmes.

Cette logique n’est pas nouvelle, mais l’ampleur alléguée l’est. Depuis l’essor de l’IA générative, plusieurs laboratoires ont renforcé leurs conditions contractuelles pour interdire l’usage de leurs sorties dans l’entraînement de modèles concurrents. Ce durcissement reflète une réalité simple : dans un marché où les gains de performance deviennent coûteux, la frontière entre benchmarking agressif et extraction de valeur devient de plus en plus litigieuse.

La ligne de front États-Unis–Chine s’invite dans les API

L’affaire prend une dimension géopolitique immédiate parce qu’elle oppose un acteur emblématique de l’IA américaine à l’un des géants technologiques chinois. Anthropic, soutenu par de puissants partenaires et très exposé aux débats de sécurité nationale à Washington, ne formule pas seulement un grief commercial. En ciblant Alibaba, l’entreprise inscrit implicitement sa plainte dans la rivalité plus large entre les États-Unis et la Chine sur les semi-conducteurs, le cloud, les modèles fondamentaux et les infrastructures de calcul.

Dans ce contexte, l’accusation de “vol” de capacités ne relève plus uniquement du droit privé. Elle nourrit le discours, déjà très présent à Washington, selon lequel les entreprises américaines d’IA doivent protéger leurs modèles non seulement contre les abus commerciaux, mais contre des formes d’extraction assimilables à du renseignement économique.

De la souveraineté des puces à la souveraineté des sorties

Le débat sur la souveraineté IA s’est longtemps concentré sur l’accès aux GPU, aux données et aux talents. Cette affaire déplace le centre de gravité vers un autre actif stratégique : les sorties de modèle elles-mêmes. Si les réponses produites par un système deviennent une matière première exploitable à grande échelle par un concurrent, alors la protection d’une API prend une valeur comparable à celle de la protection d’une propriété intellectuelle classique.

Pour les groupes chinois, la pression est symétrique. Les restrictions américaines sur les puces avancées et certains transferts technologiques ont déjà poussé les grands acteurs locaux à accélérer l’entraînement de modèles domestiques et à optimiser chaque source de performance disponible. Cela ne valide en rien les accusations d’Anthropic, mais cela explique pourquoi l’incitation économique à capter des capacités externes est particulièrement forte.

Une affaire qui pourrait durcir tout l’écosystème

Même en l’absence, à ce stade, de décision judiciaire publique sur le fond, l’effet de l’accusation peut être immédiat. Anthropic envoie un message à trois publics à la fois : ses clients, ses concurrents et les régulateurs. Aux clients, l’entreprise veut montrer qu’elle sait détecter des abus massifs. Aux concurrents, qu’elle est prête à nommer un acteur majeur. Aux autorités, qu’il existe un angle concret pour traiter la question du pillage de capacités IA.

Vers des API plus fermées et plus surveillées

La conséquence la plus probable est un durcissement des accès : vérification d’identité renforcée, limitation plus fine des volumes, détection comportementale, marquage des sorties, segmentation des capacités sensibles et surveillance accrue des usages de masse. Cette évolution pourrait compliquer la vie des développeurs légitimes, en particulier des petites structures, tout en augmentant le coût opérationnel des fournisseurs.

Elle pourrait aussi relancer un débat juridique encore inachevé : une sortie de modèle peut-elle être protégée comme une expression de propriété intellectuelle exploitable en justice contre la distillation concurrente ? Le sujet est central, car une grande partie de la valeur des modèles ne réside plus seulement dans leur architecture, mais dans les comportements qu’ils manifestent à l’usage.

Le prochain test : preuves, riposte et réponses politiques

À court terme, la question décisive sera celle des éléments techniques qu’Anthropic choisira de rendre publics pour étayer ses accusations. Des indicateurs de trafic, des motifs de prompts, des corrélations entre comptes ou des traces d’automatisation pourraient transformer une dénonciation spectaculaire en dossier plus difficile à contester. En parallèle, la réponse d’Alibaba sera scrutée bien au-delà du secteur : démenti frontal, contestation de la méthodologie ou silence juridique n’enverront pas le même signal.

La portée concrète de l’affaire se mesurera sur deux fronts. D’abord, dans l’industrie : si d’autres laboratoires publient des incidents comparables, la distillation non autorisée pourrait devenir l’un des principaux risques opérationnels des API d’IA. Ensuite, sur le terrain politique : un enchaînement d’accusations de ce type fournirait un argument supplémentaire pour de nouvelles restrictions technologiques entre les États-Unis et la Chine.

Le prochain jalon attendu n’est donc pas un simple communiqué, mais la production de preuves techniques exploitables — et, possiblement, l’ouverture d’un contentieux. Si les 25 000 comptes et les 28,8 millions d’interactions sont documentés de manière robuste, l’affaire pourrait servir de précédent pour redéfinir ce qu’un fournisseur de modèles considère comme une extraction illégitime de capacités. Dans la guerre économique de l’IA, la bataille ne se joue plus seulement sur les puces ou les talents, mais sur chaque réponse produite par un modèle.

Recevez les dernières actualités sur l'IA dans votre boite mail

envelope
Si vous souhaitez recevoir un résumé de l'actualité ainsi que nos derniers guides sur l'IA rejoignez nous !
Actualités Guides Liste IA Prompts Newsletter