ActuIA
AMD et le CEA : un partenariat stratégique pour façonner l’avenir du calcul en IA
AMD (Advanced Micro Devices), acteur majeur des semi-conducteurs et concurrent de NVIDIA sur le marché des GPUs et des puces IA, a annoncé hier la signature d’une lettre d’intention avec le Commissariat à l’énergie atomique et aux énergies alternatives (CEA). Ce partenariat avec l’un des principaux organismes de recherche scientifique français vise à repousser les limites du calcul haute performance et à optimiser l’efficacité énergétique des infrastructures IA, répondant ainsi aux besoins crois

AMD et le CEA : un partenariat stratégique pour façonner l’avenir du calcul en IA

Par : Pierre-yves Gerlat

12 février 2025 à 10:00

AMD (Advanced Micro Devices), acteur majeur des semi-conducteurs et concurrent de NVIDIA sur le marché des GPUs et des puces IA, a annoncé hier la signature d’une lettre d’intention avec le Commissariat à l’énergie atomique et aux énergies alternatives (CEA). Ce partenariat avec l’un des principaux organismes de recherche scientifique français vise à repousser les limites du calcul haute performance et à optimiser l’efficacité énergétique des infrastructures IA, répondant ainsi aux besoins croissants de secteurs stratégiques comme l’énergie et la médecine où les besoins en calcul sont particulièrement élevés.

Le CEA se concentre sur quatre principaux domaines : les énergies bas carbone, le numérique, les technologies pour la médecine du futur, ainsi que la défense et la sécurité.

En mettant en synergie l’expertise du CEA en matière de recherche et d’architecture informatique et le savoir-faire d’AMD dans le domaine des semi-conducteurs et du HPC, les deux partenaires travailleront au développement des technologies avancées, composants et architectures de système de prochaine génération.

L’un des principaux défis que vise à relever ce partenariat est celui de l’efficacité énergétique. L’essor des modèles d’IA toujours plus complexes et gourmands en calcul nécessite des solutions capables de concilier puissance de traitement et sobriété énergétique.

Ralph Witting, Corporate Fellow et responsable de la recherche chez AMD, souligne :

“Le calcul IA continue de stimuler l’innovation dans tous les secteurs de l’industrie, et une collaboration internationale est critique pour repousser les limites du possible. Avec ce partenariat avec le CEA et les ingénieurs français de premier plan, nous visons à rapprocher la recherche de pointe sur l’IA des applications du monde réel en faisant progresser les architectures de systèmes répondant aux exigences des charges de travail de l’IA de demain.”

Vers une dynamique de coopération internationale

Au-delà des avancées technologiques, ce partenariat s’inscrit dans une volonté de renforcer les liens entre les acteurs industriels et académiques américains et européens. En prévoyant l’organisation d’un symposium cette année sur le calcul IA, AMD et le CEA ambitionnent de réunir les parties prenantes européennes du secteur, les fournisseurs mondiaux de technologies, les start-ups, les centres de calcul intensifs, les universités et les responsables politiques.

Julie Galland, Directrice de la recherche technologique du CEA, affirme :

“Le CEA est engagé à stimuler l’innovation dans le domaine du calcul IA en faisant progresser les technologies de nouvelle génération ouvrant la voie à des architectures de rupture qui concilient performance et efficacité énergétique. Notre collaboration avec AMD représente une étape importante dans la promotion de la coopération internationale dans l’informatique de haute performance, en réunissant une expertise de classe mondiale pour adresser les besoins grandissant de charge de travail IA.”

Un datacenter de pointe à Grenoble

AMD a par ailleurs annoncé que ses derniers GPUs Instinct alimenteront l’un des centres de données dédiés à l’IA de la société DataOne. Situé à Grenoble, il devrait être opérationnel dans quelques mois. Il pourrait faire partie des investissements des Emirats arabes unis annoncés par Emmanuel Macron puisque G42, basé à Abu Dhabi, est impliqué dans le projet via l’une des sociétés de son portefeuille, Core42.

Lisa Su, présidente et directrice générale d’AMD, commente :

“Notre collaboration stratégique avec G42 contribuera à dynamiser l’écosystème français de l’IA, en fournissant la capacité de calcul nécessaire pour permettre aux start-ups locales et aux pionniers de l’IA de bénéficier d’une innovation de pointe et de renforcer l’économie française.”

ActuIA
Allemagne : Hunter, le supercalculateur du HLRS de Stuttgart, entre en service
La semaine dernière, le Centre de calcul haute performance de l’Université de Stuttgart (HLRS) a inauguré Hunter, son tout dernier supercalculateur. Conçu et fabriqué par Hewlett Packard Enterprise (HPE), il est alimenté, à l’instar d’El Capitan, le supercalculateur de plus de deux exaflops du département de l’Énergie des États-Unis, par l’APU Instinct MI300A d’AMD. Combinant performance et durabilité énergétique, Hunter marque une étape importante dans le paysage du calcul haute performance (HP

Allemagne : Hunter, le supercalculateur du HLRS de Stuttgart, entre en service

ActuIA

Par : Marie-Claude Benoit

27 janvier 2025 à 14:00

La semaine dernière, le Centre de calcul haute performance de l’Université de Stuttgart (HLRS) a inauguré Hunter, son tout dernier supercalculateur. Conçu et fabriqué par Hewlett Packard Enterprise (HPE), il est alimenté, à l’instar d’El Capitan, le supercalculateur de plus de deux exaflops du département de l’Énergie des États-Unis, par l’APU Instinct MI300A d’AMD. Combinant performance et durabilité énergétique, Hunter marque une étape importante dans le paysage du calcul haute performance (HPC) en Allemagne.

Hunter repose sur une architecture innovante, exploitant les unités de traitement accéléré (APU ou Accelerated Processing Unit) AMD Instinct MI300A qui intègrent des cœurs de processeur, des GPU et une mémoire à large bande passante dans un seul boîtier. Avec une capacité de calcul maximale théorique de 48,1 pétaflops, la vitesse de Hunter est presque le double de celle de son prédécesseur, Hawk (26 pétaflops), tout en réduisant sa consommation d’énergie d’environ 80 %. L’intégration de l’architecture HPE Cray Supercomputing EX4000, dotée de 188 nœuds interconnectés via la technologie HPE Slingshot, garantit des performances optimales pour les charges de travail les plus exigeantes.

Un engagement fort en faveur de la durabilité

Conçu avec une approche centrée sur l’efficacité énergétique, Hunter utilise un système de refroidissement liquide direct 100 % sans ventilateur, développé par HPE pour maximiser l’efficacité énergétique et la rentabilité des déploiements d’IA à grande échelle. En collaboration avec HPE, HLRS a également mis en place un plafonnement dynamique de l’alimentation, optimisant la répartition de la puissance en fonction des besoins des applications en temps réel. Ces efforts s’inscrivent dans une stratégie globale de développement durable, visant à rendre le calcul intensif plus respectueux de l’environnement.

Des applications variées pour la science et l’industrie

Hunter est destiné à répondre aux besoins de divers secteurs, notamment l’ingénierie, la modélisation climatique, la recherche biomédicale et la science des matériaux. Les entreprises et les agences du secteur public bénéficieront ainsi d’un accès sécurisé aux ressources de calcul haute performance et d’IA, permettant de développer des produits et des services innovants.

La start-up Seedbox.ai basée à Stuttgart exploite déjà Hunter pour entraîner ses LLMs KafkaLM, contribuant à l’émergence de solutions IA européennes. En outre, le supercalculateur jouera un rôle clé dans le projet HammerHAI, une initiative allemande visant à démocratiser l’adoption de l’intelligence artificielle en Europe.

Financement et avenir du calcul haute performance

Le coût total du projet Hunter s’élève à 15 millions d’euros, financés à parts égales par le ministère des Sciences, de la Recherche et des Arts du Bade-Wurtemberg et le ministère fédéral allemand de l’Éducation et de la Recherche, sous l’égide du Centre Gauss pour le calcul intensif, l’alliance des trois centres nationaux de calcul intensif de l’Allemagne, dont le HLRS est le membre-fondateur.

Hunter prépare le terrain pour son successeur, le supercalculateur de classe exascale Herder, qui sera également fabriqué par HPE. Avec une vitesse de pointe de plusieurs centaines de pétaflops, Herder permettra d’étendre considérablement les capacités HPC de l’Allemagne.

Hunter, le supercalculateur du HLRS de Stuttgart, entre en service

ActuIA
IA open source : tout juste dévoilé, Reflection 70B au cœur des controverses
Le 5 septembre dernier, Matt Shumer, PDG d’Hyperside (OthersideAI), a dévoilé Reflection 70B sur X, le présentant comme le LLM open source le plus performant au monde. Basé sur le modèle de langage Llama 3.1 70B publié par Meta en juillet dernier, ce nouveau LLM utilise un mécanisme innovant d’autocorrection, le reflection-tuning. Si cette annonce a été accueillie avec enthousiasme par la communauté de l’IA, les performances impressionnantes annoncées ont vite été remises en cause par une partie

IA open source : tout juste dévoilé, Reflection 70B au cœur des controverses

ActuIA

Par : Marie-Claude Benoit

11 septembre 2024 à 09:30

Le 5 septembre dernier, Matt Shumer, PDG d’Hyperside (OthersideAI), a dévoilé Reflection 70B sur X, le présentant comme le LLM open source le plus performant au monde. Basé sur le modèle de langage Llama 3.1 70B publié par Meta en juillet dernier, ce nouveau LLM utilise un mécanisme innovant d’autocorrection, le reflection-tuning. Si cette annonce a été accueillie avec enthousiasme par la communauté de l’IA, les performances impressionnantes annoncées ont vite été remises en cause par une partie d’entre elle.

Matt Shumer a expliqué que le modèle est capable de s’autocorriger en temps réel grâce à un processus de raisonnement étape par étape, imitant un type de métacognition, c’est-à-dire la capacité à “penser sa propre pensée”. Le reflection-tuning, d’où le nom du modèle désormais présenté comme “Reflection Llama-3.1-70B” sur Hugging Face, permet à celui-ci de repérer et corriger ses propres erreurs logiques avant de produire une réponse finale. Cette approche permet d’obtenir des réponses plus précises et de surmonter un défi majeur rencontré par les LLM : les hallucinations.

Matt Shumer souligne sur X l’importance du rôle de Glaive, une start-up spécialisée dans la génération de données synthétiques personnalisées, qui a permis au modèle de s’entraîner rapidement sur des ensembles de données de haute qualité, augmentant la précision des résultats tout en raccourcissant les cycles de développement.

Les performances annoncées

Lors de son annonce, Matt Shumer a vanté les performances de Reflection 70B sur plusieurs benchmarks, affirmant qu’il surpassait d’autres LLMs, y compris certains des modèles propriétaires les plus performants. Parmi ces tests figure le MMLU (Massive Multitask Language Understanding), où le modèle se serait distingué par sa polyvalence, ainsi que HumanEval, qui mesure la capacité des modèles à résoudre des problèmes de programmation.

Il a partagé les résultats sur Hugging Face .

Le terrain de jeu Reflection qui permet d’essayer le modèle, indique qu’en raison de la forte demande, la démo est temporairement en panne.

La désillusion

Toutefois, cette révolution annoncée n’a pas tardé à être remise en question. Dès le lendemain du lancement de Reflection 70B, des tests indépendants ont révélé que le modèle n’était pas à la hauteur des attentes. Là où Mat Shumer et son équipe avaient promis une capacité de correction automatique exceptionnelle, le modèle a rapidement montré des faiblesses dans des tâches de base telles que le comptage et le raisonnement logique. Les résultats n’étaient ni constants ni fiables, et Reflection 70B échouait là où d’autres modèles LLM comme GPT-4o et Claude 3,5 Sonnet excellent.

Selon l’évaluation d‘Artificial Analysis, une organisation dédiée à l’analyse indépendante des modèles d’IA et des fournisseurs d’hébergement, du score MMLU de Reflection Llama 3.170B publiée sur X, le modèle obtient le même score que Llama 3 70B et un score nettement inférieur à celui du Llama 3.1 70B.

Pour certains, Reflection 70B pourrait en fait être Llama 3 avec un réglage LoRA (Low-Rank Adaptation) appliqué, plutôt qu’un affinage de Llama 3.1, pour d’autres le modèle de Shumer n’est pas un modèle original, mais un simple wrapper de Claude 3,5 Sonnet d’Anthropic. En d’autres termes, Reflection 70B ne serait pas le produit d’une avancée technologique inédite, mais plutôt une façade, un reconditionnement d’une technologie déjà disponible.

HyperWrite a répondu aux critiques, admettant que les poids du modèle avaient été corrompus lors du téléchargement sur Hugging Face, ce qui a pu entraîner des performances de qualité inférieure. Pour Matt Shumer, cette corruption des poids est la cause des résultats incohérents observés par des évaluateurs tiers.

Il a publié sur Hugging Face la mise à jour suivante :

“Il y a eu un problème avec le modèle lorsque nous l’avons téléchargé pour la première fois. Si vous l’avez essayé et que vous n’avez pas obtenu de bons résultats, veuillez réessayer, nous pensons avoir résolu le problème”.

ajoutant :

“De plus, nous savons à l’heure actuelle que le modèle est divisé en une tonne de fichiers. Nous le condenserons bientôt pour rendre le modèle plus facile à télécharger et à utiliser !”

Cependant, malgré cette mise à jour, beaucoup de scepticisme persiste. La communauté s’interroge sur l’ampleur réelle du problème technique initial. La mention explicite de Glaive dans le post Hugging Face, avec la recommandation de “l’utiliser” pour ceux qui souhaitent entraîner un modèle, est perçue par certains comme une tentative de promouvoir la start-up dans laquelle Matt Shumer a investi.

L’ensemble de données et un rapport détaillant l’entraînement du modèle devraient être publiés dans les prochains jours et apporter plus d’éclaircissements. Ces accusations doivent être vérifiées par des experts en IA avant de jeter l’opprobre sur Matt Shumer et Hyperside.

Un modèle beaucoup plus grand, Reflection 405B, censé surclasser les modèles open sources actuels, devrait être présenté très prochainement. Mais après les controverses autour de Reflection 70B, la communauté attend désormais plus de transparence et des preuves concrètes avant d’accorder sa confiance.

Pour les acteurs de l’IA, cette affaire est un rappel que l’innovation doit toujours être accompagnée de transparence et d’éthique, et qu’il vaut mieux patienter quelque temps pour obtenir des résultats fiables et vérifiables plutôt que de se précipiter vers des annonces spectaculaires.

IA open source tout juste dévoilé, Reflection 70B au cœur des controverses

ActuIA
Vertiv renforce l’infrastructure de data centers de l’Université de Pise pour le HPC
Vertiv, une société mondiale spécialisée dans les solutions d’infrastructure critique et de services pour les centres de données, les réseaux de communication et d’autres environnements critiques, annonce avoir été choisie par l’Université de Pise pour agrandir l’infrastructure existante de data centers et fournir les nouveaux équipements d’alimentation et de refroidissement liquide nécessaires afin de répondre aux nouvelles exigences des systèmes de calcul haute performance et maintenir une fle

Vertiv renforce l’infrastructure de data centers de l’Université de Pise pour le HPC

ActuIA

Par : Pierre-yves Gerlat

29 mars 2024 à 12:00

Vertiv, une société mondiale spécialisée dans les solutions d’infrastructure critique et de services pour les centres de données, les réseaux de communication et d’autres environnements critiques, annonce avoir été choisie par l’Université de Pise pour agrandir l’infrastructure existante de data centers et fournir les nouveaux équipements d’alimentation et de refroidissement liquide nécessaires afin de répondre aux nouvelles exigences des systèmes de calcul haute performance et maintenir une flexibilité opérationnelle élevée.

L’université de Pise, fondée en 1343, est l’une des plus anciennes et des plus prestigieuses universités d’Italie et d’Europe. Elle est composée de 20 départements, dont les sciences humaines, les sciences et l’informatique, et compte environ 50 000 étudiants inscrits dans différents cursus de formation. En 2016, elle disposait de trois data centers pour soutenir ses activités d’enseignement et de recherche mais pour optimiser son infrastructure afin d’ offrir plus d’efficacité et d’agilité, elle s’est lancée dans un projet de développement d’un nouveau data center : “The Green Data Center”. Elle en a confié la fourniture de l’infrastructure critique d’alimentation et de refroidissement à Vertiv, une société basée à Westerville, dans l’Ohio (États-Unis), présente dans plus de 130 pays, dont la France.

Un déploiement réussi qui a amené l’université à se tourner de nouveau vers Vertiv pour agrandir ce data center afin de répondre aux exigences évolutives du HPC.

Maurizio Davini, CTO de l’Université de Pise, explique :

“Le principal objectif de notre projet, connu sous le nom ‘The Hybrid Green Data Centre Expansion‘, était d’utiliser l’aile disponible du bâtiment, tout en conservant intacts le design et l’interface utilisateur d’origine. Nous devions également intégrer de nouveaux éléments technologiques permettant de répondre aux exigences croissantes du calcul haute performance, tout en offrant une excellente flexibilité opérationnelle. Ces exigences ont été pleinement satisfaites par Vertiv, ce qui nous a permis de maîtriser les coûts énergétiques pour une gestion efficace de notre nouveau data center”.

Ces objectifs ont été atteints en adoptant les systèmes de refroidissement liquide Vertiv Liebert XDU et en créant des allées hybrides sur mesure, qui comportent à la fois des unités de refroidissement à air et des équipements de refroidissement liquide. De plus, les contraintes d’espace ont conduit à la conception sur mesure d’un module d’alimentation externe Vertiv. L’infrastructure hydraulique a été étendue, permettant aux unités de refroidissement précédemment livrées de fournir de l’eau refroidie à la nouvelle infrastructure du centre de données.

L’adoption du refroidissement hybride, une technologie de pointe de gestion thermique qui optimise les conditions environnementales externes pour réduire la consommation d’énergie et les coûts de maintenance du système, alors que le data center était refroidi par air, apporte à la nouvelle infrastructure une meilleure efficacité énergétique.

Vertiv a également fourni des services de conseil, de conception, d’installation et de mise en service, y compris l’intégration du logiciel de surveillance Vertiv Environet Alert, qui permet au client de surveiller à distance l’ensemble de l’infrastructure.

Giordano Albertazzi, PDG de Vertiv, conclut :

“L’adoption croissante d’applications à haute densité et d’IA exige des stratégies d’infrastructure innovantes. Les solutions de Vertiv, y compris le refroidissement liquide pour les applications directes sur puce et les systèmes d’alimentation à haute densité, fourniront à l’Université de Pise la capacité dont elle a besoin pour soutenir une nouvelle génération d’informatique et les futures générations de recherche étudiante”.

Vue normale

Vers une dynamique de coopération internationale

Un datacenter de pointe à Grenoble

Un engagement fort en faveur de la durabilité

Des applications variées pour la science et l’industrie

Financement et avenir du calcul haute performance

Les performances annoncées

La désillusion