Difference between revisions of "VT2016 OpenTSDB"

From air
Jump to navigation Jump to search
Line 53: Line 53:
 
== Fonctionnement ==
 
== Fonctionnement ==
   
[[Image:NOUGUIER-tsdb-architecture.png|800px|left cetnter|Architecture]]
+
[[Image:NOUGUIER-tsdb-architecture.png|400px|left cetnter|Architecture]]
   
 
= Démonstration =
 
= Démonstration =

Revision as of 12:49, 1 November 2016

Présentation

  • Sujet : OpenTSDB
  • Auteur : Thibaut NOUGUIER
  • Enseignants : Didier DONSEZ, Georges-Pierre BONNEAU

Mot clés

Base de données de séries chronologique, Time Series Daemon, HBase.

Résumé

OpenTSDB est une base de données de séries chronologique. Chaque cluster communique ses informations à son Time Series Daemon (TSD) qui par la suite les enregistre dans HBase. Les TSDs sont aussi capables de récupérer les données stockées pour permettrent leur visualisation par un utilisateur. Il est aussi possible de mettre en place des routines (alertes, messages, ...), dans le but d'informer l'utilisateur lorsque cela est nécessaire.

Abstract

OpenTSDB is a time series database. Each cluster sends his data to his own Time Series Daemon (TSD), and then it store it into HBase. TSDs are able to get stored data in order to show it to an user. It is also possible to create routines (alerts, messages, ...) in order to inform users of anything.

Synthèse

Contexte

De nos jours, le stockage en continue d'importante quantité de données est habituel, cependant il est difficile de le faire via des bases de données relationnelles classiques.

Objectifs

Les bases de données de séries chronologiques ont principalement deux objectifs :

  • Le stockage de données horodatées de source et de nature diverses (températures, humidité, ...).
  • La visualisation de celles-ci sous forme de graphique.

Problèmatique

  • Stockage de point : nom + timestamp + valeur + tags.
  • Stockage de masse de l'odre de la dizaine de millions par an.
  • Fonctionnalités mathématiques telles que : comptages, moyennes, interpolations, lissages, maximums, minimums...

Historique

RRD Tool

  • Elle est la première base de données de séries chronologiques.
  • Il est difficile de l'exploiter au quotidien (sauvegarde, export, scalabilité).
  • La précision des données se fait au détriment de la taille de la base.

Les bases de données suivantes ont toutes ces points communs :

  • Une architecture industrielle et scalable.
  • Une API permettant le stockage et requetage des données.
  • Des fonctions mathématiques intégrées.

Whisper

  • Elle est vue comme la transition entre RRD Tool et les TSDB suivantes.
  • Elle est difficilement utilisable sans le projet Graphite.

KairosDB

  • Elle est très similaire à OpenTSDB si ce n'est qu'elle peut s'utiliser avec H2 ou Cassandra en plus d'HBase.

InfluxDB

  • Elle est capable de stocker des événements en plus des points.
  • Elle est basée sur LevelDB, la librairie clé / valeur écrite pour être rapide par Google.

Fonctionnement

Architecture

Démonstration

Bibliographie