HPE mise sur les puces Qualcomm pour son serveur Edgeline EL8000

le 09/08/2022, par Andy Patrizio, IDG NS (adapté par Jean Elyan), Infrastructure, 540 mots

Imprimer

La puce Cloud AI100 épaule le système edge HPE Edgeline EL8000, capable de fournir du calcul, du stockage et de la gestion dans un seul dispositif.

HPE mise sur les puces Qualcomm pour son serveur Edgeline EL8000

Plus tard ce mois-ci, HP Enterprise livrera ce qui pourrait bien être le premier serveur spécifiquement destiné à l'inférence de l'IA pour l'apprentissage machine. Le processus d'apprentissage machine comporte deux étapes : une étape d'entrainement et une étape d'inférence. L'apprentissage consiste à utiliser les puissants GPU de Nvidia et d'AMD ou d'autres puces hautes performances pour « apprendre » au système d'IA ce qu'il doit rechercher, par exemple la reconnaissance d'images. L'inférence répond si le sujet correspond aux modèles entrainés. Mais un GPU est surdimensionné pour cette tâche, et un processeur beaucoup moins puissant peut suffire. Si le EL8000 est équipé d'un processeur centrale de type Intel Xeon Scalable, il accueille également les puces Cloud AI100 de Qualcomm, qui répondent tout à fait aux besoins de l'intelligence artificielle en périphérie. Elle comporte jusqu'à 16 « coeurs d'IA » et prend en charge les formats de données FP16, INT8, INT16, FP32, tous utilisés pour l'inférence. Il ne s'agit pas de processeurs ARM personnalisés, mais de SoC entièrement nouveaux, spécialement conçus pour l'inférence.

Les charges de travail d'inférence se situent souvent à plus grande échelle et nécessitent généralement une faible latence et un débit élevé pour fournir des résultats en temps réel. Au format 5U (8,4 pouces), ce serveur embarque jusqu'à quatre lames (blades) indépendantes (ProLiant e910 et e920 1U ) regroupées en cluster à l'aide de commutateurs intégrés au châssis à double redondance. Son petit frère, le HPE Edgeline EL8000t, est un système 2U. Il prend en charge deux blades (ProLiant e910 et e920 2U) indépendants.

Deux formats pour la puce AI100 de Qualcomm

Outre ses performances, la puce Cloud AI100 consomme peu d'énergie. Elle est disponible en deux facteurs de forme : soit en carte PCI Express, soit en deux puces M.2 montées sur la carte mère. La carte PCIe affiche une enveloppe thermique de 75 watts, tandis que les deux unités M.2 consomment 15 ou 25 watts. Un processeur courant consomme plus de 200 watts, et un GPU plus de 400 watts. Qualcomm affirme que sa puce Cloud AI 100 prend en charge les principaux formats de modèles standard du secteur, notamment ONNX, TensorFlow, PyTorch et Caffe. Ces modèles peuvent être importés et préparés à partir de modèles pré-entraînés que l'on peut compiler et optimiser pour le déploiement. Qualcomm dispose des outils pour le portage et la préparation des modèles, y compris la prise en charge des opérations personnalisées.

Selon Qualcomm, la puce Cloud AI100 cible le secteur de la fabrication et de l'industrie, et les secteurs ayant des besoins d'IA à la périphérie. C'est le cas par exemple de la vision par ordinateur et du traitement du langage naturel (NLP). Pour la vision par ordinateur, il peut s'agir du contrôle et de l'assurance qualité dans la fabrication, de la détection d'objets et de la vidéosurveillance, ainsi que de la prévention et de la détection des pertes. Pour le traitement du langage naturel, cela inclut la génération de codes de programmation, les opérations d'assistants intelligents et la traduction de langues. Les serveurs Edgeline seront disponibles à l'achat ou en location par l'intermédiaire de HPE GreenLake dans le courant du mois.

Kneron vise l'ermbarqué avec sa puce KL730 taillée pour l'IA

Axée sur l'image, la puce d'intelligence artificielle KL730 de Kneron devrait permettre de nombreuses améliorations dans les domaines de l'edge computing, de la sécurité et de l'automobile. Dénommée KL730,...

le 22/08/2023, par Jon Gold / Network World (adaptation Jean Elyan), 533 mots

Volumez repense le stockage cloud en misant sur la performance...

Fondé par des vétérans dans l'industrie du stockage, Volumez promeut un logiciel d'orchestration du stockage qui exploite des ressources Linux pour exécuter des charges de travail exigeantes en utilisant une...

le 23/06/2023, par Serge LEBLAL, 939 mots

Des serveurs Lenovo edge pour l'IA et le traitement des données

Les serveurs Lenovo ThinkEdge offriront une plus grande capacité de traitement là où les données sont générées et permettront aux entreprises d'effectuer de l'inférence en temps réel à la périphérie. Au cours...

le 20/06/2023, par Andy Patrizio, IDG NS (adapté par Jean Elyan), 565 mots

Dernier dossier

Les white-box sont-elles l'avenir de la commutation réseau ?

Et si vous pouviez gérer vos commutateurs de centres de données et vos routeurs de la même façon que vos serveurs et ainsi réduire les coûts des dépenses en capital ? C'est la promesse des white-box qui amènent des systèmes d'exploitation réseau open source fonctionnant sur du matériel courant.Pour en avoir le coeur net, nous avons testé Cumulus...

Dernier entretien

Céline Polo

DRH du groupe iliad

"Nous recrutons dans des métiers en tension, en particulier sur l'infrastructure réseau, pour lesquels il y a...