Comment les processeurs « Wafer-Scale » pourraient révolutionner les superordinateurs
Les processeurs sont devenus plus rapides au fil des ans grâce à des composants de plus en plus petits. Mais alors que nous nous dirigeons vers la limite des petits circuits, où allons-nous ? Une réponse consiste à faire en sorte que vos puces aient une taille «à l’échelle d’une tranche».
Sommaire
Qu’est-ce que « Wafer-Scale » ?
Les dispositifs à circuits intégrés tels que les processeurs sont créés à partir de cristaux de silicium. Pour créer un appareil, un énorme cristal de silicium cylindrique est découpé en tranches circulaires. Plusieurs puces sont ensuite gravées dans la surface de la tranche. Une fois que les puces sont prêtes, elles sont testées pour trouver les unités défectueuses, et celles-ci sont marquées.
Les puces de travail sont découpées dans la plaquette et emballées en tant que produits finis à vendre. Le « rendement » est le nombre de puces de travail que vous obtenez d’une plaquette. Toute partie de la plaquette qui est gaspillée en raison d’une défaillance des puces ou parce qu’il s’agit d’une chute doit être récupérée par l’argent généré par les puces en état de marche.
Une puce à l’échelle d’une tranche utilise le entier plaquette pour un seul processeur. Cela semble être une excellente idée, mais il y a eu quelques problèmes sérieux.
Les puces à l’échelle de la tranche semblaient impossibles
Il y a eu quelques tentatives pour « intégrer » une plaquette de silicium entière au fil des ans. Le problème est que le processus utilisé pour fabriquer les micropuces est imparfait. Sur toute plaquette terminée, il y a forcément des défauts.
Si vous avez imprimé plusieurs copies de la même puce sur une plaquette, quelques-unes cassées ne sont pas la fin du monde. Cependant, un seul processeur doit être parfait pour fonctionner. Donc, si vous essayiez d’intégrer l’intégralité de la tranche, ces défauts inévitables rendraient toute la puce géante inutile.
Pour contourner ce problème, les ingénieurs ont dû repenser la conception d’un processeur massif censé fonctionner comme une unité intégrée. Jusqu’à présent, une seule entreprise a réussi à fabriquer un processeur fonctionnel à l’échelle d’une plaquette et elle a dû résoudre de sérieux problèmes techniques pour y arriver.
Le Cerebras WSE-2
Wafer-Scale Engine 2 de Cerebras Systems est une puce absolument massive. Il utilise un processus de 7 nm, similaire aux puces de 7 et 5 nanomètres présentes dans divers appareils tels que les smartphones, les ordinateurs portables et les ordinateurs de bureau.
Le WSE-2 est conçu comme un maillage de cœurs qui sont tous connectés les uns aux autres par une grille massive d’interconnexions à haut débit. Ce réseau de modules de cœur de processeur peut tous communiquer, même si certains cœurs sont défectueux. Le WSE est conçu de manière à ce qu’il y ait plus de cœurs qu’annoncé, conformément au rendement attendu de chaque plaquette. Cela signifie que, même si chaque puce présente des défauts, ils n’affectent en rien les performances conçues.
Le WSE-2 est conçu spécifiquement pour accélérer les applications d’IA qui utilisent une technique d’apprentissage automatique connue sous le nom de « apprentissage en profondeur ». Comparé aux supercalculateurs actuels utilisés pour les tâches d’apprentissage en profondeur, le WSE-2 est des ordres de grandeur plus rapide, tout en utilisant moins d’énergie.
Les avantages des processeurs Wafer-Scale
Les processeurs à l’échelle de la tranche résolvent de nombreux problèmes liés à la conception actuelle des supercalculateurs. Les superordinateurs sont construits à partir de nombreux ordinateurs plus petits et plus simples qui sont mis en réseau. En concevant soigneusement les tâches pour ce type de conception, il est possible d’ajouter toute cette puissance de calcul ensemble.
Cependant, chaque ordinateur de cette baie de supercalculateurs a besoin de ses propres composants de support, et l’augmentation de la distance entre les nombreux packages de CPU individuels de ce réseau introduit de nombreux problèmes de performances et limite les types de charges de travail pouvant être effectuées en temps réel.
Un processeur à l’échelle d’une tranche combine efficacement la puissance de traitement de dizaines ou de centaines d’ordinateurs en un seul circuit intégré, piloté par une seule alimentation, le tout logé dans un seul châssis. Mieux encore, vous pouvez toujours mettre en réseau plusieurs ordinateurs à l’échelle d’une tranche pour créer un supercalculateur traditionnel, mais de manière exponentiellement plus rapide.
Des processeurs Wafer-Scale pour le reste d’entre nous ?
Il est peu probable que nous obtenions une sorte de produit à l’échelle d’une tranche pour les utilisateurs réguliers qui n’essaient pas de construire un supercalculateur, mais il existe également des éléments de la philosophie « plus c’est gros, mieux c’est » évident dans l’électronique grand public.
Un bon exemple est le système sur puce (SoC) M1 Ultra d’Apple, qui est constitué de deux SoC M1 Max connectés par une interconnexion haut débit, qui se présente comme un système unique avec deux fois plus de ressources.
Les conceptions de processeurs d’AMD ont également tiré parti des « chiplets », qui sont des unités centrales de processeur qui peuvent être fabriquées indépendamment, puis « collées » ensemble à l’aide d’un autre type d’interconnexion à grande vitesse. Maintenant que les circuits peuvent cesser de devenir plus petits sur les processeurs, le moment est venu de les construire et peut-être même vers le haut, avec des conceptions de circuits 3D complexes, plutôt que les circuits 2D plus courants que nous utilisons aujourd’hui.
EN RELATION: La puce M1 Ultra d’Apple suralimentera les ordinateurs de bureau Mac