Colmet energy
Jump to navigation
Jump to search
Objectif
La mesure de la consommation d'énergie ainsi que l'indication du niveau de performances des applications s'exécutant sur les supercalculateurs (cluster) sont des éléments essentiels pour la bonne marche d'un centre de calcul. Le logiciel Colmet est un outil de monitoring pour cluster, nous souhaitons l'étendre dans ces 2 directions (mesure de consommation d'énergie avec RAPL et indication de performances avec PAPI).
Les contraintes technologigues
Développement sous Linux, Colmet (en Python), RAPL, PAPI, suivant l'avancement du projet pour des tests pousés utilisation de la plateforme Grid'5000
Plan de travail
Etudier Colmet, RAPL et PAPI Etudier le code Media:monitoring.zip Proposer un couplage Colmet / Monitoring
Conseils et indications
- Découper le projet en plusieurs étapes le plus indépendantes possibles.
- Test Colmet et le code de monitoring
- Proposer une intégration dans une Colmet
- Ecrire une documentation
- Proposer des évolutions du code
- Note 1: On utilisera le code fournir en C pour étendre l'outil Colmet (on utilisera notamment les fonctions contenues dans rapl.c et counter_individuals.c)
- Note 2: Une extension au support des cgroups sera developpée pour les compteurs individuels (cf https://stackoverflow.com/questions/52892668/using-perf-event-open-to-monitor-docker-containers )