Des accélérateurs IPU pour doper les traitements IA

le 29/10/2021, par Andy Patrizio, IDG NS (adapté par Jean Elyan), Infrastructure, 413 mots

Imprimer

Les serveurs avec accélérateurs IA peuvent accroître les performances à un niveau équivalent à celui des supercalculateurs, le tout dans un encombrement réduit.

Des accélérateurs IPU pour doper les traitements IA

L'entreprise britannique Graphcore, qui développe des accélérateurs pour l'IA et l'apprentissage machine, a considérablement augmenté les performances de ses serveurs IPU (Intelligence Processing Unit) massivement parallèles. Les puces orientées IA de Graphcore sont vendues dans des designs montés en rack appelés IPU-POD. Jusqu'à présent, le rack IPU-POD64 existant pouvait accueillir un maximum de 64 unités. Mais les derniers racks IPU-POD128 et IPU-POD256 peuvent en accueillir deux et quatre fois plus.

Graphcore affirme que les 32 pétaFLOPS de capacité de traitement d'IA de l'IPU-POD 128 et les 64 pétaFLOPS de l'IPU-POD 256, met ses racks au niveau des supercalculateurs d'IA, avec en plus une empreinte beaucoup plus faible que celle d'un superordinateur classique, dont la taille est celle d'un terrain de basket. Les systèmes IPU-POD sont capables de traiter séparément les tâches de calcul d'IA des serveurs, ce qui signifie que différents types de charges de travail d'IA nécessitant des niveaux de performance différents peuvent être exécutés sur le même POD. Par exemple, on peut allouer un IPU-POD à l'apprentissage plus rapide de grands modèles de langage basés sur Transformer sur l'ensemble d'un système, ou diviser le système en vPOD plus petits et plus flexibles pour permettre à un plus grand nombre de développeurs d'accéder aux IPU.

Du HPC au format compact

Cette répartition est rendue possible grâce à la pile logicielle Poplar de Graphcore, qui comprend un SDK, la bibliothèque Graphcore Communication Library (GCL) pour gérer la communication et la synchronisation entre les IPU, et PopRun et PopDist, qui permettent aux développeurs d'exécuter leurs applications sur plusieurs systèmes IPU-POD. Pour la communication IPU intra-rack, les précédents POD utilisaient des IPU-Links de 64Gb/s. Désormais, l'IPU-POD128 et l'IPU-POD256 utilisent le nouveau Gateway Links, une connexion horizontale de rack à rack qui étend les liens IPU-Links en utilisant un tunnel sur l'Ethernet 100Gb.

Les deux systèmes ont été développés pour les hyperscalers du cloud, les laboratoires nationaux de calcul scientifique et les entreprises disposant de grandes équipes d'IA sur des marchés comme les services financiers ou l'industrie pharmaceutique. Parmi les premiers clients de Graphcore figurent le Lawrence Berkeley National Laboratory du Département américain de l'énergie et J.P. Morgan. Les IPU-POD16, IPU-POD64, IPU-POD128 et IPU-POD256 sont livrés dès aujourd'hui par le géant français de l'informatique ATOS et d'autres partenaires intégrateurs de systèmes dans le monde entier. Ils sont aussi disponibles dans le cloud chez Cirrascale.

Kneron vise l'ermbarqué avec sa puce KL730 taillée pour l'IA

Axée sur l'image, la puce d'intelligence artificielle KL730 de Kneron devrait permettre de nombreuses améliorations dans les domaines de l'edge computing, de la sécurité et de l'automobile. Dénommée KL730,...

le 22/08/2023, par Jon Gold / Network World (adaptation Jean Elyan), 533 mots

Volumez repense le stockage cloud en misant sur la performance...

Fondé par des vétérans dans l'industrie du stockage, Volumez promeut un logiciel d'orchestration du stockage qui exploite des ressources Linux pour exécuter des charges de travail exigeantes en utilisant une...

le 23/06/2023, par Serge LEBLAL, 939 mots

Des serveurs Lenovo edge pour l'IA et le traitement des données

Les serveurs Lenovo ThinkEdge offriront une plus grande capacité de traitement là où les données sont générées et permettront aux entreprises d'effectuer de l'inférence en temps réel à la périphérie. Au cours...

le 20/06/2023, par Andy Patrizio, IDG NS (adapté par Jean Elyan), 565 mots

Dernier dossier

Les white-box sont-elles l'avenir de la commutation réseau ?

Et si vous pouviez gérer vos commutateurs de centres de données et vos routeurs de la même façon que vos serveurs et ainsi réduire les coûts des dépenses en capital ? C'est la promesse des white-box qui amènent des systèmes d'exploitation réseau open source fonctionnant sur du matériel courant.Pour en avoir le coeur net, nous avons testé Cumulus...

Dernier entretien

Céline Polo

DRH du groupe iliad

"Nous recrutons dans des métiers en tension, en particulier sur l'infrastructure réseau, pour lesquels il y a...