Énergie, infrastructure et calcul, quel équilibre ?
jeudi 27 mars 2025 -
08:30
lundi 24 mars 2025
mardi 25 mars 2025
mercredi 26 mars 2025
jeudi 27 mars 2025
09:00
Calculs, données, IA et transition écologique, enjeux : usages, impacts
-
Michel Robert
Calculs, données, IA et transition écologique, enjeux : usages, impacts
Michel Robert
09:00 - 09:45
Room: CINES, 950 rue de Saint-Priest
Le but de l’exposé est d’expliquer les enjeux du monde numérique (infrastructures de calcul, semiconducteurs, data centers, IA…), et ses impacts, de discerner les limites des technologies et des applications actuelles énergivores (bitcoin, LLM,…) ,de mettre en garde contre les dérives actuelles liées à nos usages, et d'ouvrir des perspectives pour un monde numérique plus sobre, plus responsable. Dans ce contexte et en se focalisant sur le périmètre des besoins et attentes en calcul intensif des communautés scientifiques, le cas des supercalculateurs et du CINES seront évoqués.
09:45
Sobriété énergétique au mésocentre CALMIP
-
Nicolas Renon
Sobriété énergétique au mésocentre CALMIP
Nicolas Renon
09:45 - 09:55
Room: CINES, 950 rue de Saint-Priest
Depuis 2014 le Mésocentre CALMIP est hébergé à l'Espace Clément Ader (Data Center Régional Ouest) au sein duquel il mutualise les infrastructures de refroidissement avec Méto-France. En 2020 afin de réduire son empreinte énergétique et les couts des fluides associés au Supercalculateur Olympe, CALMIP bascule sur un système de refroidissement à eau Chaude avec tour adiabatique. Enfin en 2023 le mésocentre met en production un système d'économie d'énergie sur le Supercalculateur Olympe tout en garantissant le même niveau de service à ses utilisateurs. Dans cette présentation nous détaillerons se dernier point et la perspective de le faire perdurer sur le futur système remplaçant d'Olympe dont l'installation est prévue à l’automne 2025.
09:55
GRICAD, une approche intégrée de l’économie d’énergie
-
Bruno Bzeznik
(
Université Grenoble Alpes
)
GRICAD, une approche intégrée de l’économie d’énergie
Bruno Bzeznik
(
Université Grenoble Alpes
)
09:55 - 10:05
Room: CINES, 950 rue de Saint-Priest
GRICAD est une UAR qui fourni des services de calcul et de stockage aux chercheurs du bassin Grenoblois. Elle héberge le mesocentre de calcul de l'Université Grenoble-Alpes (anciennement "CIMENT") Depuis le début des années 2000, l'énergie et les impacts environnementaux des infrastructures de calcul et de stockage intensifs sont pris en compte dans les préocupations des ingénieurs de CIMENT et de GRICAD. Cela donne aujourd'hui entre autres: des datacentres économes en énergie, des engagements organisationnels, de la fourniture de ressources adaptées aux usages, une sensibilisation à la sobriété, des tableaux de bord et une culture du capital humain.
10:05
IDRIS (TBA)
-
Pierre-François Lavallée
IDRIS (TBA)
Pierre-François Lavallée
10:05 - 10:15
Room: CINES, 950 rue de Saint-Priest
10:15
CINES (TBA)
-
Gabriel Hautreux
CINES (TBA)
Gabriel Hautreux
10:15 - 10:25
Room: CINES, 950 rue de Saint-Priest
10:25
Pause café
Pause café
10:25 - 10:55
Room: CINES, 950 rue de Saint-Priest
10:55
Table ronde
-
Bruno Bzeznik
(
Université Grenoble Alpes
)
Nicolas Renon
Gabriel Hauterux
Pierre-François Lavallée
Table ronde
Bruno Bzeznik
(
Université Grenoble Alpes
)
Nicolas Renon
Gabriel Hauterux
Pierre-François Lavallée
10:55 - 12:30
Room: CINES, 950 rue de Saint-Priest
12:30
Déjeuner
Déjeuner
12:30 - 13:30
Room: CINES, 950 rue de Saint-Priest
13:30
Visite du CINES
Visite du CINES
13:30 - 14:00
Room: CINES, 950 rue de Saint-Priest
14:00
CEEMS: A Resource Manager Agnostic Application Energy & Performance Monitoring Stack
-
Mahendra Paipuri
(
CNRS
)
CEEMS: A Resource Manager Agnostic Application Energy & Performance Monitoring Stack
Mahendra Paipuri
(
CNRS
)
14:00 - 14:45
Room: CINES, 950 rue de Saint-Priest
With the rapid acceleration of ML/AI research in the last couple of years, the energy consumption of the Information and Communication Technology (ICT) domain has rapidly increased. As a major part of this energy consumption is due to users’ workloads, it is evident that users need to be aware of the energy footprint of their applications. Compute Energy & Emissions Monitoring Stack (CEEMS) [1] has been designed to address this issue. CEEMS can report energy consumption and equivalent emissions of user workloads in real time for SLURM (HPC) and Openstack (Cloud) platforms alike. Besides CPU energy usage, it supports reporting energy usage and performance metrics of workloads on NVIDIA and AMD GPU accelerators. It supports variety of energy sources like BMC (IPMI/Redfish), RAPL, Cray PMC, etc. In addition to energy consumption of individual workloads, CEEMS offers cluster level metrics for Data Center (DC) operators to monitor the overall energy consumption of the cluster, usage of cluster by individual users and projects, etc. Although CEEMS has been developed with energy estimation of individual workloads as primary objective, it has been extended to report important performance metrics. It leverages the Linux perf subsystem and eBPF [2] to monitor the performance metrics of the applications which can help the end users to identify the bottlenecks in their workflows rapidly and consequently optimize them to reduce the energy and carbon footprint. CEEMS has been built around the prominent open-source tools in the observability eco-system like Prometheus and Grafana. It has been designed to be extensible and it allows the DC operators to easily customize the energy estimation rules of user workloads based on the underlying hardware. CEEMS also integrates with Grafana Alloy and Pyroscope to be able to continuously profile the user workloads on SLURM and Kubernetes platforms which proved to be an effective solution in optimizing the workloads. Finally, the talk will conclude by showing a quick demonstration of CEEMS monitoring more than 2000 nodes on the Jean-Zay supercomputing platform that have a daily job churn rate of around 20k jobs. [1]: https://github.com/mahendrapaipuri/ceems [2]: https://ebpf.io/
14:45
Monitoring énergétique dans l'infrastructure de recherche Slices-FR/Grid'5000 avec Kwollect
-
Simon Delamare
(
CNRS
)
Monitoring énergétique dans l'infrastructure de recherche Slices-FR/Grid'5000 avec Kwollect
Simon Delamare
(
CNRS
)
14:45 - 15:30
Room: CINES, 950 rue de Saint-Priest
La plateforme Grid'5000, aujourd'hui devenue Slices-FR, est utilisée par la communauté de la recherche en informatique pour la réalisation d'expériences dans tous les domaines de l'informatique distribuée (HPC, réseau, etc.). Depuis de nombreuses années, certaines des ressources matérielles accessibles aux utilisateurs disposent de capteurs externes permettant de mesurer précisément la consommation des infrastructures informatiques et ainsi d'appuyer le travail de recherche autour de la thématique "Green IT", qui n'a fait que croître ces dernières années. La session présentera les dispositifs matériels disponibles dans Slices-FR/Grid'5000 pour le monitoring énergétique ainsi que le logiciel Kwollect, qui permet la mise à disposition des métriques de monitoring aux utilisateurs de la plateforme. Une démonstration de l'utilisation de ces outils, ainsi qu'une illustration des travaux menés sur Slices-FR/Grid'5000 avec ceux-ci, sera également proposée.
15:30
Alumet : une approche ouverte et modulaire de la mesure distribuée
-
Guillaume Raffin
(
LIG, INRIA, UGA, BULL SAS
)
Alumet : une approche ouverte et modulaire de la mesure distribuée
Guillaume Raffin
(
LIG, INRIA, UGA, BULL SAS
)
15:30 - 16:15
Room: CINES, 950 rue de Saint-Priest
Alors que la consommation de ressources de l'informatique, et en particulier des datacentres, est de plus en plus discutée, l'industrie comme la recherche académique ont besoin d'outils pour mesurer leurs plateformes. Le LIG et l'entreprise Bull s'associent pour créer Alumet (Adaptive, Lightweight, Unified Metrics). Contrairement aux autres outils qui sont développés dans le but de répondre à un cas d'utilisation bien précis, Alumet repart du problème de base et propose un framework de mesure modulaire et générique. L'outil de mesure final donne plus de contrôle à l'utilisateur/admin, tout en restant simple à utiliser. De plus, les choix techniques de l'implémentation (async Rust, serde-based protocol, ...) permettent d'être plus efficaces que les autres outils. L'idée est de créer un outil technique, certes puissant et efficace, mais qui reste ouvert, transparent, et contrôlable. Cette session présentera le principe du projet Alumet, son architecture de base, quelques résultats expérimentaux et une rapide démonstration (selon le temps disponible). Elle sera l'occasion d'échanger autour du futur du projet et de la vision du monitoring dans les centres de calcul.
16:15
Gestion/optimisation de l'énergie sur Adastra
-
Gabriel Hautreux
Gestion/optimisation de l'énergie sur Adastra
Gabriel Hautreux
16:15 - 16:45
Room: CINES, 950 rue de Saint-Priest