Difference between revisions of "Colmet energy"

From air
Jump to navigation Jump to search
 
(One intermediate revision by the same user not shown)
Line 6: Line 6:
 
=Plan de travail=
 
=Plan de travail=
 
Etudier Colmet, RAPL et PAPI
 
Etudier Colmet, RAPL et PAPI
Etudier le code [[File:monitoring.zip]]
+
Etudier le code [[Media:monitoring.zip]]
 
Proposer un couplage Colmet / Monitoring
 
Proposer un couplage Colmet / Monitoring
   
Line 14: Line 14:
 
* Proposer une intégration dans une Colmet
 
* Proposer une intégration dans une Colmet
 
* Ecrire une documentation
 
* Ecrire une documentation
* Proposer des évolutions du code
+
* Proposer des évolutions du code
  +
* Note 1: On utilisera le code fournir en C pour étendre l'outil Colmet (on utilisera notamment les fonctions contenues dans rapl.c et counter_individuals.c)
  +
* Note 2: Une extension au support des cgroups sera developpée pour les compteurs individuels (cf https://stackoverflow.com/questions/52892668/using-perf-event-open-to-monitor-docker-containers )
   
 
=Autres=
 
=Autres=

Latest revision as of 18:08, 5 February 2019

Objectif

La mesure de la consommation d'énergie ainsi que l'indication du niveau de performances des applications s'exécutant sur les supercalculateurs (cluster) sont des éléments essentiels pour la bonne marche d'un centre de calcul. Le logiciel Colmet est un outil de monitoring pour cluster, nous souhaitons l'étendre dans ces 2 directions (mesure de consommation d'énergie avec RAPL et indication de performances avec PAPI).

Les contraintes technologigues

Développement sous Linux, Colmet (en Python), RAPL, PAPI, suivant l'avancement du projet pour des tests pousés utilisation de la plateforme Grid'5000

Plan de travail

Etudier Colmet, RAPL et PAPI Etudier le code Media:monitoring.zip Proposer un couplage Colmet / Monitoring

Conseils et indications

  • Découper le projet en plusieurs étapes le plus indépendantes possibles.
  • Test Colmet et le code de monitoring
  • Proposer une intégration dans une Colmet
  • Ecrire une documentation
  • Proposer des évolutions du code
  • Note 1: On utilisera le code fournir en C pour étendre l'outil Colmet (on utilisera notamment les fonctions contenues dans rapl.c et counter_individuals.c)
  • Note 2: Une extension au support des cgroups sera developpée pour les compteurs individuels (cf https://stackoverflow.com/questions/52892668/using-perf-event-open-to-monitor-docker-containers )

Autres