Nvidia GTC 2026 :tracer la voie vers 1 000 milliards de dollars de revenus en matière d’IA
Nvidia GTC (ou GPU Technology Conference) est devenue l’une des principales conférences mondiales sur l’IA, avec une croissance chaque année depuis son lancement en 2009 parallèlement à l’influence et aux revenus de l’entreprise. Mais cette année a marqué un changement d’orientation. Dans le passé, l’entreprise se concentrait sur la façon dont elle se développait sur de nouveaux marchés; cette année, elle a démontré comment elle allait se développer sur ces marchés, notamment en tant qu'acteur clé dans le paysage de l'IA. Signe clair des ambitions de Nvidia et de son succès actuel, la société a revu à la hausse sa prévision de 500 milliards de dollars de revenus liés à l'IA d'ici 2026, à un chiffre stupéfiant de 1 000 milliards de dollars d'ici 2027.
En particulier, le PDG Jensen Huang a abordé les besoins croissants en matière d'inférence d'IA ainsi que la croissance rapide des charges de travail agentiques et la façon dont cette croissance pourrait avoir un impact sur l'ensemble de l'informatique d'IA.
La vision de Nvidia pour la pile complète :le gâteau à 5 couches de l'AII
Depuis décembre 2025, Huang promeut l’idée d’un « gâteau à cinq étages » pour l’IA. Ce concept semble résumer la stratégie globale de l’entreprise en matière d’IA, car il tente de communiquer la nature intrinsèquement verticale de la technologie, qui est bien plus complexe qu’une simple application ou un simple modèle. L’IA est présentée comme une infrastructure critique comportant plusieurs couches allant des besoins énergétiques sous-jacents jusqu’aux applications individuelles. Cela tente également de simplifier la complexité d'une pile d'IA complète pour la personne moyenne.

Le gâteau d'IA à cinq étages de Nvidia
Photo gracieuseté de Nvidia
À la base de cette pile se trouve l’énergie, qui attire davantage l’attention en tant que facteur limitant la quantité de calcul pouvant être construite dans un emplacement donné. À leur tour, les puces utilisant cette énergie déterminent la quantité de calcul disponible pour résoudre les problèmes d’IA. Vient ensuite l’infrastructure qui prend en charge ces puces avec les terrains, les bâtiments, l’alimentation électrique, l’équipement informatique, le refroidissement et la mise en réseau. L'infrastructure permet des modèles d'IA, qui varient en fonction de l'application et du cas d'utilisation. Au plus haut niveau, les applications elles-mêmes exploitent les résultats du modèle pour fournir des résultats aux consommateurs, aux utilisateurs professionnels, aux entités gouvernementales, etc. – sur la base de la valeur économique de l'IA.
Huang a déclaré que l’ensemble de la pile informatique devait être réinventé pour prendre en charge « la plus grande construction d’infrastructures de l’histoire de l’humanité ». Nvidia utilise ce message pour se positionner non seulement en tant que fabricant de puces, mais aussi en tant que catalyseur fondamental de toute informatique, car toute informatique s'oriente désormais vers l'IA. Le PDG parle de l'approche de Nvidia combinant « intégration verticale et ouverture horizontale », ce qui signifie que ses modèles sont ouverts à tous, mais son approche de l'informatique est intégrée verticalement à chaque couche.
Vera Rubin Pod, LPX et l'opportunité de revenus 10x
Vera Rubin est la prochaine plate-forme de calcul haut de gamme pour Nvidia qui combine ses processeurs Vera et ses GPU Rubin; il est prévu de commencer à être expédié dans quelques mois. Le Vera Rubin Pod est l’offre à l’échelle du rack de Nvidia qui promet d’apporter une nouvelle augmentation significative de la densité de calcul de l’IA dans les centres de données. Il intègre sept types de puces Nvidia sur cinq systèmes de rack différents pour créer une configuration hautes performances qui, selon la société, permettra la génération de jetons – et de revenus – jusqu'à 10 fois le taux de la plate-forme Blackwell de dernière génération. Nvidia affirme que cela pourrait permettre une opportunité d'inférence annuelle pouvant atteindre 300 milliards de dollars.

Graphique présentant les opportunités d'inférence architecturale de Nvidia
Photo gracieuseté de Nvidia
L’un des principaux facteurs favorables du Vera Rubin Pod est l’utilisation de la plate-forme LPX de Groq, exploitant la puce Groq 3 LM30. L’unité de traitement linguistique de Groq est intrinsèquement différente des GPU de Nvidia, avec une quantité importante de SRAM (mémoire vive statique) par opposition à la DRAM (mémoire vive dynamique). Parce qu'il augmente la bande passante mémoire de 55 fois par rapport à un GPU Rubin, le LPU Groq est intrinsèquement efficace pour gérer les tâches extrêmement gourmandes en mémoire. Cela explique en partie pourquoi Nvidia a acquis la propriété intellectuelle de Groq et ses talents les plus importants pour 20 milliards de dollars en décembre 2025.
Développer au-delà des GPU :une approche matérielle diversifiée
L'exemple de Groq montre comment Nvidia s'éloigne de la tentative de faire de ses GPU la solution à tous les problèmes. Même si l’écosystème de Nvidia s’est depuis longtemps étendu au-delà des GPU, cette expansion a presque toujours été au service du GPU, que ce soit par le biais de processeurs, de puces réseau ou de logiciels. Avec l'introduction des LPU Groq 3, l'architecture de calcul de Nvidia a véritablement dépassé une approche uniquement GPU.
Nous voyons également Nvidia commencer à proposer des produits tels que ses propres processeurs internes basés sur Arm dans une solution rack uniquement CPU. La société positionne le nouveau processeur Vera à 88 cœurs comme compétitif par rapport à Intel et AMD pour les centres de données. Ces processeurs peuvent être configurés avec jusqu'à 256 puces par rack, et Nvidia a déjà des clients, dont Meta, qui cherchent à les déployer. Au-delà des processeurs, Nvidia a également parlé de sa solution Bluefield 4 STX pour les applications orientées stockage; selon l'entreprise, ce produit améliore les performances pour éviter que le stockage ne soit un goulot d'étranglement pour la sortie de l'IA.
Plus de produits Vera Rubin :Nvidia DSX AI Factory et Space 1
Nvidia DSX est la dernière plate-forme basée sur Vera Rubin de la société pour son offre AI Factory, qui comprend une conception de référence pour les usines d'IA et exploite l'Omniverse Digital Twin de Nvidia. (Pour en savoir plus sur Omniverse, voir mon article sur GTC 2025 et l’examen détaillé de mon collègue Bill Curtis sur les évolutions de Nvidia en matière d’IA physique à partir de février 2025.) La société appelle cela une solution clé en main qui tire parti de toutes les capacités que Nvidia et ses partenaires ont créées pour aider à planifier, construire et entretenir des usines d’IA. Cette plate-forme est conçue pour les implémentations auprès des hyperscalers et des plus grandes entreprises qui cherchent à déployer leur propre IA à l'échelle industrielle sans avoir à reconstituer une infrastructure.
Il y a également eu beaucoup de buzz ces derniers temps autour de l’informatique IA dans l’espace, avec de nombreuses startups lancées pour résoudre les problèmes de déploiement. Avant l'annonce du module Space 1 basé sur Vera Rubin, Nvidia déployait principalement des puces Jetson Orin embarquées et des GPU H100 pour les applications spatiales. Nvidia affirme que le nouveau module axé sur l'espace a été conçu pour ces applications extrêmes et offre des performances d'IA dans l'espace jusqu'à 25 fois supérieures à celles du H100. Il propose également un traitement par étapes et des codes de correction d'erreurs pour garantir que le fonctionnement dans l'espace n'affecte pas la sortie. Cela dit, je pense que Space 1 s'adressera à une application assez niche et ne devrait pas être considéré comme validant le besoin de centres de données dans l'espace.
NemoClaw :Création d'agents spécialisés
L'IA agentique est rapidement devenue un domaine d'intérêt important, car des agents tels que Claude Code aident les utilisateurs à accomplir des tâches pratiques. Du point de vue technique, les agents remodèlent la manière dont l'infrastructure informatique est construite et dont les puces à l'intérieur de cette infrastructure sont conçues. L'un des développements récents les plus intéressants est l'introduction d'OpenClaw, un agent open source qui s'exécute localement en utilisant la nouvelle pile open source NemoClaw de Nvidia pour des déploiements plus sûrs d'agents orientés tâches.
La boîte à outils d'agent NemoClaw est conçue pour créer, former et déployer des agents d'IA autonomes et sécurisés, ce qui devrait permettre à chacun de créer plus facilement ses propres agents. Lors du développement de la nouvelle pile, Nvidia a travaillé en étroite collaboration avec le créateur d'OpenClaw et des chercheurs en sécurité pour aider à prévenir les actions agents indésirables ou les résultats potentiellement dangereux.
DLSS 5.0 :le déploiement controversé du rendu neuronal
Nvidia en a surpris beaucoup, dont moi, avec l'annonce du DLSS 5.0, qui est la fonctionnalité optionnelle assistée par l'IA de la société pour améliorer la qualité de l'image et offrir un rendu plus rapide. Cela fonctionne en rendant à une résolution inférieure, puis en utilisant l'IA pour mettre à niveau l'image à la résolution native. La plupart des utilisateurs semblent satisfaits des implémentations précédentes de DLSS. Désormais, DLSS 5.0 introduit des techniques de rendu neuronal pour améliorer encore l'éclairage dans des scènes qui autrement pourraient paraître plates. Cela donne également aux développeurs de jeux plus de contrôle sur l'expérience utilisateur et ils peuvent régler DLSS 5.0 pour modifier la façon dont il affecte les visuels de leurs jeux.
De nombreuses personnes ont réagi négativement aux premières photos et vidéos réalisées avec DLSS 5.0. Je pense qu’il s’agit d’une réaction excessive. De nombreux joueurs détestent la plupart des choses améliorées par l'IA, et la réaction au DLSS 5.0 pourrait être le point culminant de cette frustration. Après avoir vu les démos en personne, je peux dire que presque toutes les améliorations semblent positives et améliorent le réalisme – et cela vient d'un photographe sérieux qui peut être très pointilleux sur les outils d'édition. Au-delà de cela, le DLSS 5.0 est encore loin d’être disponible, on ne sait donc pas exactement à quoi ressemblera le produit final ni quels GPU pourront l’exécuter. L'instanciation actuelle fonctionne sur deux cartes graphiques Nvidia RTX 5090, mais, selon Nvidia, le logiciel sera optimisé pour fonctionner sur un seul GPU d'ici l'automne.
Le point d’inflexion de l’inférence et la projection de marché de Huang à 1 000 milliards de dollars
Dans son discours au GTC, Huang a parlé des opportunités croissantes de revenus de l'IA pour l'industrie, ajoutant que « la demande pour les GPU Nvidia est hors du commun ». Il a affirmé que la croissance de l'inférence génère beaucoup plus de revenus depuis l'édition spéciale du GTC tenue à Washington, D.C., fin 2025 (dont j'ai parlé ici).
Même si c'était il y a seulement quelques mois, la société est en train d'améliorer ses prévisions de revenus de 500 milliards de dollars d'ici 2026 à 1 000 milliards de dollars d'ici 2027. Cela signifie que Nvidia s'attend non seulement à une fin d'année en force, mais s'attend également à ce que 2027 soit encore plus forte – des centaines de milliards de dollars de plus. De mon point de vue d’analyste, il était logique de penser que la transition de la formation en IA vers l’inférence généralisée de l’IA et l’IA agentique omniprésente serait un moteur important pour l’industrie. Mais si Huang a raison, cela pourrait s'avérer être un catalyseur de croissance encore plus important – pour Nvidia et ses partenaires – que quiconque aurait pu l'imaginer il n'y a pas si longtemps.
Divulgation :Nvidia est un client conseil de mon cabinet, Moor Insights &Strategy.
Stratégie d’Entreprise
- Qu'est-ce qu'un Rachat d'Entreprise (EBO) ?
- Qu'est-ce que la gestion de la performance d'entreprise (CPM) ?
- Comment ouvrir un salon de coiffure
- Comment démarrer un service de livraison
- Comment démarrer une entreprise de boîtes à lunch
- Storytelling TikTok :les créateurs façonnent l'avenir du contenu de haute qualité
- Qu'est-ce que la gestion des opérations ?
- La conformité est plus risquée que jamais
- Comment gagner de l'argent selon votre propre horaire
-
New York avec un budget limité :5 façons éprouvées d'économiser de l'argent en tant que touriste Salut! Avant de commencer cet article, je tiens à préciser que je ne viens pas de New York mais que c’est l’une de mes villes préférées et mon lieu de vacances numéro un. Je dois dire que c’est vraime...
-
Comment se débarrasser des anciens chèques La rédaction de chèques peut être périmée, mais la sécurité reste un problème. Des événements se produisent qui pourraient vous obliger à fermer votre compte courant, comme un déménagement, un mariag...
