Vue normale

À partir d’avant-hierFlux principal

ActuIA
AMD dévoile les premiers résultats des GPU Instinct MI300X sur les benchmarks MLPerf Inference v4.1
En juin 2023, Lisa Su, la CEO d’AMD, dévoilait le GPU Instinct MI300X, conçu pour l’IA générative et le HPC. Ce processeur graphique de nouvelle génération a démontré des performances impressionnantes lors des benchmarks MLPerf Inference v4.1, confirmant sa capacité à rivaliser avec les solutions de pointe de l’industrie, notamment le NVIDIA H100. Ces résultats marquent une avancée significative pour AMD, mettant en lumière la robustesse et la polyvalence de sa plateforme d’inférence full-stack.

AMD dévoile les premiers résultats des GPU Instinct MI300X sur les benchmarks MLPerf Inference v4.1

Par : Thomas Calvi

29 août 2024 à 09:30

En juin 2023, Lisa Su, la CEO d’AMD, dévoilait le GPU Instinct MI300X, conçu pour l’IA générative et le HPC. Ce processeur graphique de nouvelle génération a démontré des performances impressionnantes lors des benchmarks MLPerf Inference v4.1, confirmant sa capacité à rivaliser avec les solutions de pointe de l’industrie, notamment le NVIDIA H100. Ces résultats marquent une avancée significative pour AMD, mettant en lumière la robustesse et la polyvalence de sa plateforme d’inférence full-stack.

L’importance des benchmarks MLPerf

Les benchmarks MLPerf, développés par MLCommons, sont essentiels pour évaluer la performance des matériels et logiciels d’intelligence artificielle (IA). Alors que les modèles de langage deviennent de plus en plus complexes, la nécessité d’une puissance de calcul efficace et d’une optimisation logicielle rigoureuse devient primordiale. Pour les entreprises, performer dans ces benchmarks fournit des preuves tangibles de l’efficacité de leurs solutions d’IA dans des scénarios d’inférence et d’entraînement.

Performances de l’AMD Instinct MI300X avec LLaMA2-70B

La soumission du GPU AMD Instinct MI300X au benchmark MLPerf Inference v4.1 a utilisé le modèle de langage LLaMA2-70B, reconnu pour ses performances élevées et sa polyvalence dans des applications réelles comme le traitement du langage naturel. Quatre tests ont été réalisés avec le GPU fonctionnant sur un système Supermicro AS-8125GS-TNMR2 dans deux scénarios distincts

deux dans le scénario hors ligne, destiné à maximiser le débit de traitement en jetons par seconde ;
les deux autres dans le scénario de serveur, visant à simuler des requêtes en temps réel avec des contraintes de latence strictes.

Les tests ont été effectués à l’aide de processeurs EPYC « Genoa » de 4ème génération et des processeurs EPYC « Turin » de 5ème génération.

Grâce à sa mémoire de 192 Go, le MI300X a pu exécuter l’ensemble du modèle LLaMA2-70B sur un seul GPU, évitant ainsi la surcharge réseau liée à la distribution du modèle sur plusieurs unités de traitement. Grâce à l’optimisation logicielle ROCm, le MI300X peut évoluer de manière quasi linéaire de 1 à 8 GPU, offrant une flexibilité et une performance accrues pour les charges de travail intensives.

Optimisations et Innovations

Instinct MI300X, compte 153 milliards de transistors, 192 Go de mémoire HBM3 à large bande passante et 12 chiplets. Le GPU dispose également d’une bande passante mémoire de 5,2 TB/s et de 896 Go/s de bande passante Infinity Fabric.

La clé du succès du MI300X réside dans plusieurs facteurs :

Grande capacité mémoire : Avec 192 Go de mémoire HBM3, le GPU peut traiter des modèles de grande taille sans avoir besoin de les distribuer entre plusieurs unités, ce qui optimise le débit d’inférence ;
Support du FP8 : AMD a intégré le format numérique FP8 dans sa pile logicielle ROCm, permettant une quantification précise des modèles sans perte significative de performance ;
Optimisations logicielles : L’équipe d’AMD a travaillé sur l’optimisation du noyau, l’amélioration des algorithmes de planification dans vLLM, et l’amélioration de la gestion du cache KV, tout cela contribuant à une performance plus fluide et plus rapide.

Comparaison avec NVIDIA H100

La combinaison des GPU AMD Instinct MI300X et des processeurs AMD EPYC de 4ème génération montre une synergie efficace, optimisant les performances pour les charges de travail d’IA. Les performances de cette configuration sont très proches de celles du NVIDIA DGX H100, avec une différence de seulement 2 à 3 % dans les scénarios de serveur et hors ligne, en utilisant une précision FP8.

Dans certains cas, le MI300X a même dépassé le H100, notamment grâce à l’optimisation du traitement des LLMs. Cette réussite positionne AMD comme un concurrent sérieux sur le marché des accélérateurs d’IA, où NVIDIA domine.

La société déclare sur LinkedIn :

“De sa mémoire GPU massive, qui s’adapte à l’ensemble du modèle LLaMA2-70B sur un seul GPU avec de l’espace à revendre, à la prise en charge avancée de FP8 et aux optimisations logicielles de pointe, nous avons repoussé les limites des performances de l’IA. Exceller dans MLPerf Inference v4.1 est une étape importante pour AMD, soulignant notre engagement en faveur de la transparence et de la fourniture de données standardisées qui permettent aux entreprises de prendre des décisions éclairées”.

AMD prévoit de lancer les prochaines itérations de la série AMD Instinct, avec entre autres avancées, de la mémoire supplémentaire, la prise en charge de types de données de faible précision et une puissance de calcul accrue, dans les prochains mois. Les futures versions de ROCm apporteront des améliorations logicielles, notamment des améliorations du noyau et une prise en charge avancée de la quantification.

AMD dévoile les premiers résultats des GPU Instinct MI300X sur les benchmarks MLPerf Inference v4.1

ActuIA
Nouvelle extension pour Raspberry Pi 5 : lancement du M.2 HAT+ pour des performances améliorées
Initié par des professeurs du département informatique de l’Université de Cambridge, le Raspberry Pi, un nano-ordinateur monocarte à processeur ARM de la taille d’une carte de crédit, a fait son apparition en 2012. Raspberry Pi annonce le lancement de M.2 HAT+, un nouvel accessoire permettant de connecter des périphériques M.2 tels que des disques NVMe et des accélérateurs d’IA à l’interface PCIe 2.0 du Raspberry Pi 5, lancé en septembre 2023. La “Fondation Raspberry Pi” a été créée en 2009, ave

Nouvelle extension pour Raspberry Pi 5 : lancement du M.2 HAT+ pour des performances améliorées

ActuIA

Par : Marie-Claude Benoit

23 mai 2024 à 08:30

Initié par des professeurs du département informatique de l’Université de Cambridge, le Raspberry Pi, un nano-ordinateur monocarte à processeur ARM de la taille d’une carte de crédit, a fait son apparition en 2012. Raspberry Pi annonce le lancement de M.2 HAT+, un nouvel accessoire permettant de connecter des périphériques M.2 tels que des disques NVMe et des accélérateurs d’IA à l’interface PCIe 2.0 du Raspberry Pi 5, lancé en septembre 2023.

La “Fondation Raspberry Pi” a été créée en 2009, avec le soutien du laboratoire d’informatique de l’Université de Cambridge et de l’entreprise Broadcom, afin de promouvoir l’enseignement de l’informatique dans les écoles et les pays en développement.

Le Raspberry Pi Model B, lancé en février 2012, a été conçu dans ce but spécifique. Depuis lors, la famille des Raspberry Pi s’est élargie, offrant une variété de modèles avec des fonctionnalités et des capacités différentes. Ces nano-ordinateurs monocartes sont devenus populaires non seulement dans l’éducation, mais aussi dans le domaine du bricolage, de l’industrie légère et de la recherche. Leur faible coût, leur flexibilité et leur communauté active ont contribué à leur succès continu.

Le M.2 HAT+ représente une évolution significative dans l’écosystème Raspberry Pi. Il offre un transfert de données rapide, jusqu’à 500 Mo/s, vers et depuis les disques NVMe (M-Key) aux formats 2230 ou 2242 et supporte différents appareils et composants comme des cartes d’extension, des dispositifs de stockage rapides, des cartes réseau supplémentaires…

Il peut fournir jusqu’à 3 A aux périphériques M.2 connectés.

Conçu spécifiquement pour le Raspberry Pi 5, le M.2 Hat+ se fixe au dispositif à l’aide de vis et d’entretoises, comme illustré dans la vidéo ci-dessous, offrant une connexion sécurisée et stable .

Grâce au M.2 HAT+, les utilisateurs du Raspberry Pi 5 peuvent désormais étendre les capacités de leur dispositif en ajoutant des périphériques de stockage haute performance et des accélérateurs d’IA. Cette nouvelle flexibilité ouvre la voie à une multitude de nouveaux projets et applications, allant de l’informatique embarquée à la domotique en passant par l’IoT.

Il est disponible en France aux alentours de 13-14 euros.