128 Go pour ton PC, Nvidia veut surtout qu’il travaille sans t’attendre
Le PC n’est plus présenté comme une machine à exécuter des logiciels, mais comme un système censé agir, anticiper et déléguer. Avec RTX Spark, dévoilé le 1er juin 2026, Nvidia pousse cette bascule jusqu’au bout : le discours n’est plus celui de la vitesse brute, mais celui d’un ordinateur Windows capable de faire tourner des agents IA personnels en local.
Nvidia ne vend plus un composant, mais une promesse d’assistance permanente
Avec RTX Spark, Nvidia parle d’un “superchip” taillé pour les PC Windows “natifs agents”. Le choix des mots n’a rien d’anodin. Il ne s’agit pas simplement d’ajouter une couche d’IA à la bureautique ou à la création, mais de redéfinir le poste de travail comme un environnement où des modèles peuvent observer, raisonner, mémoriser et agir sur plusieurs tâches à la fois.
La fiche technique avancée par le groupe est calibrée pour frapper les esprits : jusqu’à 1 pétaflop de performance IA, 128 Go de mémoire unifiée, et la capacité de faire tourner localement des LLM de 120 milliards de paramètres avec jusqu’à 1 million de tokens de contexte. À ce niveau, Nvidia ne vise plus seulement les usages grand public classiques de l’IA embarquée — résumé de texte, retouche d’image, transcription — mais un registre plus ambitieux : agents de recherche, assistants de développement, automatisation de flux de travail complexes ou encore copilotes capables de conserver un historique très large.
L’idée défendue à l’occasion de Computex/Discover est claire : le PC “outil” cède la place au PC “coéquipier”. En d’autres termes, la machine n’est plus seulement là pour répondre à une commande, mais pour prendre en charge des pans entiers du travail numérique.
L’alliance avec Microsoft donne un cadre industriel à ce pari
Le point important n’est pas seulement la puce, mais l’écosystème que Nvidia exhibe autour d’elle. Le lancement s’appuie explicitement sur Microsoft, qui ancre le récit dans l’univers Windows plutôt que dans une simple démonstration de force matérielle. C’est essentiel : depuis deux ans, la bataille du PC IA se joue moins sur les performances théoriques que sur l’intégration avec le système, les frameworks, la sécurité et les outils développeurs.
En associant son annonce à Microsoft, Nvidia cherche à éviter l’image d’une plateforme puissante mais isolée. Le message est celui d’une continuité entre le matériel, les runtimes IA, les applications et l’interface utilisateur. Autrement dit, un agent personnel n’a de valeur que s’il peut accéder aux fichiers, au calendrier, aux communications, aux applications métier et aux mécanismes d’autorisation de l’OS.
Cette stratégie répond aussi à une faiblesse structurelle du marché : jusqu’ici, beaucoup de PC IA promettaient des expériences “assistées”, mais peu offraient une exécution locale de modèles vraiment massifs. Le local restait souvent cantonné à des modèles compacts, avec des limites sévères sur la mémoire et le contexte. Avec 128 Go de mémoire unifiée, Nvidia veut précisément faire tomber ce plafond.
Des chiffres spectaculaires, mais à lire avec méthode
Sur le papier, les promesses sont agressives. 1 pétaflop de performance IA constitue un marqueur marketing puissant, mais il faut rappeler qu’un tel chiffre dépend du format de calcul retenu, des optimisations logicielles et du type de modèle exécuté. Comme toujours dans l’IA, la performance brute ne se traduit pas mécaniquement en expérience utilisateur.
Même prudence sur la capacité à faire tourner localement des modèles de 120 milliards de paramètres avec 1 million de tokens de contexte. Techniquement, cela signale une montée en gamme très nette du PC Windows. Mais dans la pratique, tout dépendra du niveau de quantification, du débit réel, de la gestion thermique sur les portables, et de la disponibilité d’outils capables d’exploiter ce matériel sans exiger des manipulations réservées aux spécialistes.
Le chiffre du million de tokens mérite, à lui seul, une lecture critique. Il ouvre la porte à des usages nouveaux — analyse de grands corpus, mémoire longue, assistants capables de garder trace d’un projet sur des semaines — mais ce type de fenêtre contextuelle a un coût en latence, en consommation mémoire et parfois en stabilité des réponses. L’argument est donc fort sur le plan stratégique, moins évident sur le plan des usages quotidiens dès le lancement.
Les OEM suivent, signe que Nvidia vise un segment plus large que la station de travail
Nvidia a annoncé l’arrivée, dès l’automne 2026, de laptops et de desktops compacts basés sur RTX Spark chez ASUS, Dell, HP, Lenovo, Microsoft Surface et MSI, puis chez Acer et GIGABYTE. Ce point compte autant que les spécifications.
D’abord parce qu’il montre que le produit n’est pas pensé comme une curiosité pour développeurs ou un mini-serveur de bureau. Ensuite parce que la présence de Surface donne une caution supplémentaire à l’idée d’un Windows conçu pour accueillir des fonctions agentiques au cœur de l’expérience utilisateur. Enfin, parce que la diversité des OEM laisse entendre que Nvidia n’ambitionne pas seulement le très haut de gamme professionnel, mais une diffusion plus large sur plusieurs formats.
Le format “desktop compact” est particulièrement révélateur. Il correspond à un usage intermédiaire entre le PC personnel traditionnel et la station d’inférence locale : une machine suffisamment puissante pour faire tourner des agents en continu, tout en restant compatible avec un environnement de bureau classique. C’est une catégorie qui pourrait séduire les développeurs, les créatifs, les analystes, voire certaines équipes métiers manipulant des données sensibles.
Derrière le matériel, la bataille est celle de l’IA locale de confiance
Le pari de Nvidia arrive à un moment où l’argument de la confidentialité reprend du poids. Faire tourner des modèles localement sur Windows permet de limiter certains transferts de données vers le cloud, de réduire les coûts d’inférence sur des usages fréquents et de garder la main sur des workflows internes.
C’est aussi une réponse implicite à une tension croissante du marché : les utilisateurs veulent des assistants plus compétents, mais les entreprises restent prudentes sur l’exposition de leurs documents, de leurs échanges et de leur propriété intellectuelle à des plateformes externes. Un PC capable d’exécuter en local un modèle massif avec une mémoire importante devient alors une proposition politique autant que technique : plus d’autonomie, plus de souveraineté, potentiellement moins de dépendance au cloud sur certaines tâches.
Reste une inconnue décisive : les applications. Un “PC natif agents” ne s’imposera pas par sa seule puissance. Il faudra des usages concrets, persistants, mesurables : assistants capables de préparer des dossiers, d’automatiser des veilles, de naviguer dans plusieurs logiciels, de résumer des semaines d’activité ou de piloter des actions multi-étapes sans surveillance constante.
Nvidia tente d’imposer sa définition du “PC IA” avant ses rivaux
L’annonce a aussi une portée concurrentielle. Depuis l’émergence des PC IA, le secteur empile les slogans : Copilot+ PC, NPU embarquées, accélération locale, agents personnels. Avec RTX Spark, Nvidia cherche à reprendre l’initiative en fixant une nouvelle barre : un vrai PC IA serait une machine capable de faire tourner des modèles de taille quasi serveur, avec un contexte immense, dans un format bureautique.
Cette posture met la pression sur toute la chaîne de valeur, des fabricants de puces aux éditeurs de logiciels. Si Nvidia réussit, le critère de comparaison ne sera plus seulement le nombre de TOPS d’une NPU, mais la capacité réelle d’un PC à héberger des agents complexes, persistants et multimodaux.
La suite sera simple à évaluer. À partir de l’automne 2026, les premières machines diront si RTX Spark tient autre chose qu’une promesse marketing. Les indicateurs à surveiller sont concrets : prix de départ, autonomie sur portable, latence en local, compatibilité avec les principaux frameworks, et surtout disponibilité d’usages où un agent fait effectivement “le travail à votre place”. C’est là que se jouera la crédibilité du “PC coéquipier” défendu par Nvidia et Microsoft.