Partie III · Le matériel et l'infrastructure

Le nerf de la guerre : calcul, puces et datacenters

Chapitre 813 min de lectureMis à jour : juin 2026

8.1Pourquoi l'IA dévore du calcul

8.2GPU, TPU et puces spécialisées

Sa domination ne tient pas qu'au silicium : elle repose aussi sur CUDA, la couche logicielle que tout l'écosystème de l'IA utilise pour programmer ses puces, un « fossé » concurrentiel difficile à franchir. Au CES de janvier 2026, NVIDIA a détaillé sa nouvelle génération Vera Rubin (succédant à l'architecture Blackwell) : chaque GPU Rubin délivre environ 50 pétaFLOP en précision FP4, embarque de la mémoire ultrarapide HBM4, et s'assemble dans des armoires « NVL72 » réunissant 72 GPU et 36 processeurs Vera. La génération suivante, « Feynman », est déjà annoncée.

8.3La chaîne de valeur des semi-conducteurs

Schéma8.1. La chaîne de valeur des puces IA. NVIDIA conçoit les GPU mais ne les fabrique pas (modèle « fabless ») : c'est le taïwanais TSMC qui les grave, à l'aide de machines que seul le néerlandais ASML sait produire. Chaque maillon est un point de passage obligé, donc un point de vulnérabilité.
  • ASML (Pays-Bas) détient un monopole mondial sur les machines de photolithographie à ultraviolets extrêmes (EUV), seules capables de graver les circuits les plus fins. Sans ASML, pas de puces de pointe.
  • TSMC (Taïwan) fabrique environ 90 % des puces les plus avancées au monde (gravées à 3 nanomètres et au-delà) et détient les deux tiers du marché mondial de la fonderie. Sa concentration géographique à Taïwan en fait un point névralgique de l'économie mondiale.
  • NVIDIA (États-Unis) conçoit les GPU mais ne les fabrique pas elle-même (modèle dit « fabless ») : elle confie leur gravure à TSMC.

8.4Les méga-datacenters

À l'échelle mondiale, la puissance dédiée aux datacenters atteindrait environ 132 GW en 2026, et l'on estime qu'environ 10 GW de nouvelle capacité de calcul IA (soit 13 à 15 millions d'accélérateurs) seront ajoutés sur la seule année.

8.5Géopolitique des puces

La séquence de 2025-2026 illustre une partie d'échecs mouvementée. Après l'abrogation, en 2025, du cadre réglementaire hérité de l'administration précédente (créant une période de moindre contrôle pendant laquelle des centaines de milliers de puces auraient transité par des pays tiers), l'administration américaine a resserré les règles fin mai 2026 : toute vente d'accélérateurs avancés (gammes Blackwell et Rubin de NVIDIA, MI350x d'AMD) à une filiale étrangère d'une entreprise chinoise nécessite désormais une licence. En parallèle, le feuilleton de la puce H200 (autorisée, puis bloquée tantôt par Washington, tantôt par Pékin qui pousse vers l'autosuffisance) a conduit NVIDIA à réaffecter ses capacités chez TSMC vers la nouvelle génération Vera Rubin. Plus récemment, mi-2026, la pression américaine s'est portée plus haut dans la chaîne, sur ASML elle-même, soupçonnée par Washington d'avoir laissé une machine de pointe parvenir en Chine.


À retenir (chapitre 8)

  • L'IA est d'abord une affaire de calcul : on entraîne les modèles sur des dizaines de milliers de GPU, et l'inférence (chaque requête) domine la facture sur la durée.
  • NVIDIA domine grâce à ses puces (génération Vera Rubin en 2026) et surtout à son logiciel CUDA ; Google (TPU), AMD et les géants du cloud développent des alternatives.
  • La chaîne de valeur est ultra-concentrée : ASML (machines EUV, Pays-Bas), TSMC (fabrication, Taïwan, ~90 % des puces de pointe), NVIDIA (conception, modèle « fabless »).
  • Les méga-datacenters se chiffrent en gigawatts (Stargate 10 GW, Colossus, Hyperion) ; le capex mondial dépasse 400 milliards de dollars par an.
  • La « guerre des puces » sino-américaine, fondée sur une « stratégie des points d'étranglement », fragmente le monde en deux blocs technologiques.

Face à cette dépendance à quelques géants et à leurs immenses datacenters, une alternative monte en puissance : faire tourner l'IA chez soi, avec des modèles ouverts. C'est l'objet du chapitre 9.