EA2013-Visual Data Analytics

Présentation

 * Titre : Visual Data Analytics
 * Auteur : Mame Daba DIOUF 
 * Enseignants : Georges-Pierre Bonneau, Didier Donsez (EA2013)
 * Télécharger : [[File:Visual_Data_Analytics_DIOUF.pdf]]

Résumé
Visual Data Analytics ou analyse visuelle de données est la combinaison de techniques d'analyse automatisées avec des visualisations interactives pour une compréhension efficace, de raisonnement et de décision sur la base d'ensemble de données très volumineux et complexes. Cette analyse s'inscrit dans un contexte de Big Data où la surcharge d'information constitue un danger dans le sens où les données peuvent être présentées ou traitées de manière inappropriée. De nombreux outils existent dans le but de prendre en main ces ensembles de données pour permettre la prise de décision dans plusieurs domaines.

Mots-clé
données, analyse, visualisation, compréhension, décision, Big Data.

Abstract
Visual Data Analytics is the combination of automated with interactive visualizations for effective understanding, reasoning and decision on the overall basis of very large and complex data analysis techniques. This analysis is in the context of Big Data where information overload is a danger in the sense that the data can be displayed or processed improperly. Many tools exist to take control of these data sets to enable decision-making in several areas.

Keywords
data, analysis, visualization, understanding, decision, Big Data.

Motivations
Aujourd'hui, les données sont produites à une vitesse exponentielle et la capacité à les collecter et à les stocker augmente à un rythme plus rapide que la capacité à les analyser: elles sont générées plus vite qu'elles ne peuvent être digérées. Au cours des dernières décennies, un grand nombre de méthodes automatiques d'analyse de données ont été développées. Cependant la nature complexe de nombreux problèmes rend indispensable le fait d'inclure l'intelligence humaine à un stade précoce dans le processus d'analyse des données.

Les méthodes Visual Analytics permettent aux décideurs de combiner leur flexibilité humaine, la créativité et les connaissances de base de stockage et de transformation des capacités des ordinateurs d'aujourd'hui pour mieux comprendre les problèmes de demain.

Définitions
Visual Data Analytics est la science de raisonnement analytique basée sur des interfaces visuelle interactives.

Le domaine de l'analyse visuelle de données se concentre sur le traitement des volumes massifs, hétérogènes et dynamiques d'informations (Big Data) grâce à l'intégration du jugement humain au moyen de représentations visuelles et des techniques d'interaction dans le processus d'analyse.

C'est un ensemble d'outils et de techniques qui permettent de :
 * synthétiser les informations à partir de données massives, dynamiques, ambiguës et souvent contradictoires
 * détecter l’attendu et découvrir l’inattendu
 * fournir des évaluations compréhensibles et en temps opportun
 * communiquer efficacement les évaluations.

Domaines d'application

 * Ingénierie: pour une amélioration de l'environnement de production.


 * Sécurité: pour le déclenchement d'alertes en cas de détection de situations alarmantes.


 * Finance: pour l'analyse des fils d’actualité, des données commerciales en temps réel et les indicateurs économiques fondamentaux.


 * Environnement: pour expliquer les changements dans les populations animales ou dans les processus météorologiques et climatiques.


 * Socio-économiques: influes les décisions politiques, les effets économiques, culturels et démographiques.

Processus d'analyse et algorithme


Le processus de Visual Data Analytics combine des méthodes d'analyse automatique et visuelle avec un couplage étroit à travers l'interaction humaine dans le but d'acquérir des connaissances à partir d'un ensemble de données. La première étape consiste à pré-traiter et transformer les données pour calculer les différentes représentations. Les tâches de pré-traitement comprennent le nettoyage des données, la normalisation, le regroupement ou l'intégration de sources de données hétérogènes.

Après la transformation, l'analyste peut choisir entre l'application de méthodes d'analyse visuelle ou automatique. Si une analyse automatique est utilisée d'abord, les méthodes d'extraction de données sont appliquées pour générer des modèles de données d'origine. Une fois qu'un modèle est créé, l'analyste doit l'évaluer et l'affiner en modifiant les paramètres ou en sélectionnant d'autres algorithmes d'analyse.

Si une exploration visuelle est effectuée en premier, l'utilisateur doit confirmer les hypothèses générées par une analyse automatisée. L'interaction de l'utilisateur avec la visualisation est nécessaire pour révéler des informations utiles.



Outils
Google Analytics
 * Google Analytics (2005) est un logiciel d’analyse d’audience Internet et du comportement des internautes et permet la création de rapports.
 * SAS Visual Analytics (2012) est un outil destiné aux entreprises et qui permet d'améliorer les performances, de limiter les risques et de faciliter les prises de décision. SAS
 * Tableau
 * SpotFire
 * QlikView

Démonstration

 * 1) Google Analytics

(function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function{ (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date;a=s.createElement(o),  m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)  })(window,document,'script','//www.google-analytics.com/analytics.js','ga');
 * Site web utilisé: xuf-en.weebly.com
 * Code de suivi (collé dans le code de chaque page dont nous souhaitons effectuer le suivi):

ga('create', 'UA-45058591-1', 'weebly.com'); ga('send', 'pageview');



Références

 * Visual-analytics
 * Essential features that visual analysis tools should have
 * Wiki Visual Analytics
 * Thomas J.J., Cook K.A.: Illuminating the Path. IEEE Computer Society Press,Los Alamitos (2005)