Colmet energy

From air
Jump to: navigation, search

Objectif

La mesure de la consommation d'énergie ainsi que l'indication du niveau de performances des applications s'exécutant sur les supercalculateurs (cluster) sont des éléments essentiels pour la bonne marche d'un centre de calcul. Le logiciel Colmet est un outil de monitoring pour cluster, nous souhaitons l'étendre dans ces 2 directions (mesure de consommation d'énergie avec RAPL et indication de performances avec PAPI).

Les contraintes technologigues

Développement sous Linux, Colmet (en Python), RAPL, PAPI, suivant l'avancement du projet pour des tests pousés utilisation de la plateforme Grid'5000

Plan de travail

Etudier Colmet, RAPL et PAPI Etudier le code Media:monitoring.zip Proposer un couplage Colmet / Monitoring

Conseils et indications

  • Découper le projet en plusieurs étapes le plus indépendantes possibles.
  • Test Colmet et le code de monitoring
  • Proposer une intégration dans une Colmet
  • Ecrire une documentation
  • Proposer des évolutions du code
  • Note 1: On utilisera le code fournir en C pour étendre l'outil Colmet (on utilisera notamment les fonctions contenues dans rapl.c et counter_individuals.c)
  • Note 2: Une extension au support des cgroups sera developpée pour les compteurs individuels (cf https://stackoverflow.com/questions/52892668/using-perf-event-open-to-monitor-docker-containers )

Autres