Revision as of 15:14, 24 October 2015

Contexte

Enseignants :

Georges-Pierre Bonneau, Didier Donsez (VT2015)

Sujet :

Présentation de NewSQL

Auteur :

Vincent MESNIER

Date :

23 Octobre 2015

Mots clés

SQL,Base de donnée, SGBD, BigData, ACID, , Architecture distribuée, OLTP

Résumé

Pendant des décennies, les systèmes de gestion de base de données relationnelles (SGBDR) ont été la meilleur solution pour stocker et récupérer des données. Mais en raison de la croissance rapide du volume de données et des évolutions de la demande, des grands groupes comme Google ou Facebook ont développé de nouvelle technologie comme NoSQL ou NewSQL pour gérer leur donnée . Cette croissance est plus rapide que la croissance de la capacité de stockage, ce qui conduit à l'émergence de systèmes de gestion d'information où les données sont stockées de manière distribuée, mais accessibles et analysée comme si elle réside sur une seule machine. Outre la résolution du problème de la taille des données, ces solutions doivent également répondre aux exigences de performance massives pour assurer la rapidité du traitement des données (pour des application OLTP par exemple)

Il y a donc deux nouvelle catégorie qui servent d'alternative aux système classique SGBDR (NoSQL, NewSQL). Concernant NewSQL, ce n'est pas vraiment un nouveaux format mais une nouvelle approche dans la mise en oeuvre d'une base de données. Dans cette présentation, nous nous focaliserons sur le NewSQL, son fonctionnement et pourquoi a t'il été mis en oeuvre.

Abstract

Synthése

Présentation générale de NewSQL

NewSQL est une catégorie de SGBD relationnelle moderne qui cherche à fournir :

La même puissance évolutive (c'est à dire le faite de s'adapter à un changement d'ordre de grandeur, par exemple une forte demande) que le système NoSQL pour les applications concernant les traitement transactionnel en ligne ( type d'application qui sert a modifier des informations en temps réel, par exemple des applications bancaire)
maintient les propriété ACID d'un système de gestion de base de donnée traditionnel (atomicité, cohérence, isolation et durabilité).
Elle tire aussi partie des évolutions du matériel et des nouvelle architectures distribuées.

Une définition faites par un groupe de recherche (451 group's) dit que NewSQL est "un SGBD qui offre l'évolutivité et la flexibilité promise par NoSQL, tout en conservant le support pour les requêtes SQL et les propriétés ACID" NewSQL provient d'un modèle relationnel (contrairement à NoSQL qui est non-relationnel) orienté colonne et utilise totalement ou en partie le langage SQL. Les grandes applications visée par ce système sont caractérisé par un grand nombre de transactions, répétitives et utilisant un petit sous ensemble de donnée

NewSQL est tiré du monde NoSQL mais reste différent. Comme NoSQL elle tire partie des architectures distribuées, des progrès du matériel lors de ces dernières années. Mais contrairement à NoSQL elle permet de conserver le modèle relationnel au coeur du système. Ce schéma montre que NewSQL est né de la rencontre de 3 types d’architecture : relationnelle, NoSQL et grille de données (ou cache distribué) :

Architecture base de données

En effet, NewSQL se positionne comme 1 stockage distribué (les ressources ne sont pas toutes sur la même machine) conçue dans le prolongement de NoSQL. De plus, la plupart des solutions NewSQL proposent un stockage en mémoire (cache distribué sur plusieurs machine). Ce système est utilisé quand une faible latence est critique.

Architecture base de données

L’architecture NewSQL n’est donc pas totalement nouvelle mais reprend de ces expériences antérieures plusieurs caractéristiques tout en faisant des choix qui lui sont propres.

Le choix d’une interface SQL et d’un schéma relationnel. C’est un argument majeur par rapport aux autres solutions.
Un schéma relationnel avec des limitations pour faciliter la distribution des données et des traitements
Utiliser la distribution et la réplication des données pour assurer la scalabilité et la résilience des données.

@@ Line 36: / Line 36: @@
 En effet, NewSQL se positionne comme 1 stockage distribué (les ressources ne sont pas toutes sur la même machine) conçue dans le prolongement de NoSQL. De plus, la plupart des solutions NewSQL proposent un stockage en mémoire (cache distribué sur plusieurs machine). Ce système est utilisé quand une faible latence est critique.
 [[Image:distrib_NewSQL.png|center|thumb|300px| Architecture base de données]]
+L’architecture NewSQL n’est donc pas totalement nouvelle mais reprend de ces expériences antérieures plusieurs caractéristiques tout en faisant des choix qui lui sont propres.
+*Le choix d’une interface SQL et d’un schéma relationnel. C’est un argument majeur par rapport aux autres solutions.
+*Un schéma relationnel avec des limitations pour faciliter la distribution des données et des traitements
+*Utiliser la distribution et la réplication des données pour assurer la scalabilité et la résilience des données.
+==Caractéristiques==

Difference between revisions of "NewSQL"