OpenAI signe Jalapeño avec Broadcom, et vise déjà les puces qui remplaceront Nvidia

Le signal est difficile à manquer : OpenAI ne se contente plus de concevoir les modèles qui dominent l’IA générative, l’entreprise veut aussi maîtriser la couche matérielle qui les exécute. Avec Jalapeño, dévoilé le 24 juin 2026 aux côtés de Broadcom, le laboratoire franchit un cap industriel que peu d’acteurs étaient en mesure d’assumer il y a encore deux ans.

Présentée comme le premier “Intelligence Processor” d’OpenAI, cette puce dédiée à l’inférence des grands modèles de langage marque une étape de verticalisation très nette. Le message est limpide : dans la course à l’IA, la bataille ne se joue plus seulement dans les algorithmes, mais dans le silicium, l’énergie et l’intégration des chaînes de production.

OpenAI passe du logiciel au silicium

Dans leur annonce conjointe, OpenAI et Broadcom expliquent que Jalapeño a été co-développé spécifiquement pour l’inférence LLM. Il ne s’agit donc pas d’un accélérateur générique de plus, mais d’un composant pensé pour une tâche devenue centrale : faire tourner des modèles à grande échelle, vite, avec un coût énergétique et financier soutenable.

Le point le plus frappant tient au calendrier revendiqué par Broadcom : un cycle allant du design à la production en neuf mois. À l’échelle des semi-conducteurs avancés, où les délais se comptent souvent en années, cette cadence est un argument industriel autant qu’un signal politique. Elle suggère une collaboration très resserrée entre le concepteur de modèles et le spécialiste du silicium, avec un objectif clair : réduire le temps entre l’optimisation logicielle et sa traduction matérielle.

OpenAI présente aussi Jalapeño comme le premier jalon d’une plateforme de calcul multi-générationnelle. Autrement dit, la puce n’est pas pensée comme un prototype isolé, mais comme l’amorce d’une feuille de route durable. C’est un point essentiel. Beaucoup d’annonces de puces IA s’arrêtent à un lancement vitrine. Ici, les deux partenaires parlent déjà d’une continuité d’architecture, destinée à accompagner plusieurs générations de modèles et d’infrastructures.

L’inférence, nouveau centre de gravité économique de l’IA

Le choix de cibler l’inférence n’a rien d’anodin. Pendant la première phase du boom de l’IA générative, l’attention s’est concentrée sur l’entraînement des modèles, gourmand en GPU haut de gamme et en puissance de calcul brute. Mais à mesure que les services passent en production et que les usages grand public ou professionnels montent en charge, c’est l’inférence qui devient le poste de coût récurrent le plus sensible.

Chaque requête adressée à un assistant conversationnel, chaque résumé, chaque génération de code ou traitement multimodal consomme du calcul. À l’échelle de centaines de millions d’utilisateurs ou d’intégrations en entreprise, le sujet n’est plus marginal. Il devient structurel. Réduire le coût par token, améliorer la latence et optimiser la consommation électrique sont désormais des leviers aussi stratégiques que l’amélioration des performances des modèles eux-mêmes.

C’est précisément là que Jalapeño prend son sens. En développant une puce maison co-conçue pour ses propres charges de travail, OpenAI cherche à rapprocher matériel et logiciel au maximum. L’objectif implicite : obtenir de meilleures performances par watt, mieux contrôler les coûts d’exploitation et limiter la dépendance aux feuilles de route de fournisseurs tiers.

Une riposte à la dépendance aux GPU tiers

Derrière cette annonce se dessine un rapport de force bien connu dans l’industrie. Les grands acteurs de l’IA restent massivement tributaires de fournisseurs de GPU externes, au premier rang desquels NVIDIA, dont les accélérateurs dominent toujours le marché des data centers IA. Cette dépendance a un coût élevé : tension sur l’approvisionnement, prix soutenus, intégration dictée par des écosystèmes logiciels fermement verrouillés.

Dans ce contexte, le mouvement d’OpenAI s’inscrit dans une tendance plus large. Les géants du cloud et de l’IA cherchent depuis plusieurs années à internaliser une partie de leur pile matérielle. Google l’a fait avec ses TPU, Amazon avec Trainium et Inferentia, Microsoft a avancé avec ses propres puces, tandis que Meta travaille aussi sur des accélérateurs maison. Jalapeño place OpenAI dans cette catégorie : celle des entreprises qui ne veulent plus être seulement clientes d’infrastructures, mais architectes de leur destin matériel.

La différence, ici, tient au profil même d’OpenAI. Jusqu’ici, l’entreprise était d’abord perçue comme un champion des modèles et des produits logiciels. En entrant aussi frontalement sur le terrain du silicium, elle adopte une logique de groupe intégré, plus proche des très grands industriels du numérique que d’un simple laboratoire d’IA.

Broadcom apporte la crédibilité industrielle

Si OpenAI envoie le signal stratégique, Broadcom apporte la crédibilité d’exécution. Le groupe américain dispose d’une longue expérience dans les composants pour réseaux, data centers et infrastructures à très grande échelle. Pour OpenAI, s’associer à Broadcom revient à éviter l’écueil classique des ambitions matérielles mal arrimées à la réalité de la fabrication et du déploiement.

L’autre élément clé de l’annonce concerne l’échelle visée : des data centers de l’ordre du gigawatt, avec Microsoft et d’autres partenaires dès 2026. Le mot est lourd de sens. Un data center gigawatt n’est pas un simple agrandissement d’infrastructure : c’est une catégorie d’investissement qui engage l’alimentation électrique, le refroidissement, le réseau, l’orchestration logicielle et le financement à un niveau quasi industriel.

Cette référence confirme que Jalapeño n’est pas conçu pour quelques baies spécialisées ou pour des expérimentations internes. La puce s’inscrit dans des déploiements massifs, dans lesquels la moindre amélioration de rendement peut se traduire par des économies très concrètes sur la facture énergétique et sur le nombre de serveurs nécessaires pour absorber une charge donnée.

Microsoft, partenaire central d’une nouvelle pile IA

La mention explicite de Microsoft mérite une attention particulière. Le géant de Redmond reste le partenaire infrastructurel majeur d’OpenAI, notamment via Azure. L’arrivée d’une puce co-développée avec Broadcom suggère une évolution de cette relation : Microsoft ne fournit plus seulement le cloud qui héberge les modèles d’OpenAI, il devient aussi l’un des terrains de déploiement d’une pile technique de plus en plus spécifique.

Pour Microsoft, l’intérêt est évident. Si Jalapeño permet d’améliorer l’efficacité de l’inférence des modèles OpenAI, Azure peut gagner en compétitivité sur les services IA, tant en coûts qu’en performances. Pour OpenAI, c’est un moyen de mieux ancrer ses besoins matériels dans l’infrastructure de son partenaire principal, tout en consolidant une trajectoire moins dépendante des composants standard du marché.

Ce rapprochement soulève aussi une question de gouvernance industrielle : à mesure qu’OpenAI contrôle davantage sa pile matérielle, sa relation avec ses partenaires cloud pourrait évoluer d’une logique de simple hébergement vers une logique de co-construction d’infrastructure.

Ce que Jalapeño dit du prochain cycle de l’IA

Au-delà du lancement produit, l’annonce raconte quelque chose de plus large sur l’état du secteur. L’IA entre dans une phase où l’avantage compétitif ne se résume plus à publier un meilleur modèle. Il faut garantir l’accès au calcul, sécuriser l’approvisionnement, comprimer les coûts unitaires et absorber une demande potentiellement explosive sans voir la facture énergétique s’envoler.

Dans cette perspective, Jalapeño ressemble à un coup de théâtre industriel, mais aussi à une forme de rattrapage stratégique. OpenAI aligne enfin son statut de leader logiciel avec une ambition matérielle explicite. L’entreprise suit le chemin des groupes qui ont compris qu’un modèle performant sans contrôle sur l’infrastructure reste vulnérable.

Reste une inconnue majeure : les performances réelles. Ni OpenAI ni Broadcom n’ont, à ce stade, détaillé les métriques de débit, de latence, de consommation ou de coût comparé aux GPU dominants du marché. C’est là que se jouera la crédibilité de Jalapeño. Dans les semi-conducteurs, l’intention stratégique compte, mais les gains mesurables décident du reste.

La prochaine étape sera donc concrète : observer les premiers déploiements à grande échelle annoncés pour 2026, en particulier chez Microsoft, et mesurer si Jalapeño permet effectivement d’abaisser le coût de l’inférence et la consommation par requête. Si les chiffres suivent, OpenAI n’aura pas seulement lancé une puce : l’entreprise aura posé la première pierre d’une chaîne IA intégrée, du modèle jusqu’au data center.

OpenAI signe Jalapeño avec Broadcom, et vise déjà les puces qui remplaceront Nvidia

OpenAI passe du logiciel au silicium

L’inférence, nouveau centre de gravité économique de l’IA

Une riposte à la dépendance aux GPU tiers

Broadcom apporte la crédibilité industrielle

Microsoft, partenaire central d’une nouvelle pile IA

Ce que Jalapeño dit du prochain cycle de l’IA

À lire ensuite

GPT-5.6 Sol a compromis une infrastructure en test, OpenAI parle d'un incident inédit

OpenAI admet que GPT-5.6 Sol a piraté Hugging Face hors sandbox pendant un test

15 milliards de plus pour Alphabet, et le marché comprend que l'addition IA grimpe encore

OpenAI passe du logiciel au silicium

L’inférence, nouveau centre de gravité économique de l’IA

Une riposte à la dépendance aux GPU tiers

Broadcom apporte la crédibilité industrielle

Microsoft, partenaire central d’une nouvelle pile IA

Ce que Jalapeño dit du prochain cycle de l’IA

Recevez les dernières actualités sur l'IA dans votre boite mail

À lire ensuite