EA2013-Visual Data Analytics

From air
Jump to navigation Jump to search

Présentation

Résumé

Visual Data Analytics ou analyse visuelle de données est la combinaison de techniques d'analyse automatisées avec des visualisations interactives pour une compréhension efficace, de raisonnement et de décision sur la base d'ensemble de données très volumineux et complexes. Cette analyse s'inscrit dans un contexte de Big Data où la surcharge d'information constitue un danger dans le sens où les données peuvent être présentées ou traitées de manière inappropriée. De nombreux outils existent dans le but de prendre en main ces ensembles de données pour permettre la prise de décision dans plusieurs domaines.

Mots-clé

données, analyse, visualisation, compréhension, décision, Big Data.

Abstract

Visual Data Analytics is the combination of automated with interactive visualizations for effective understanding, reasoning and decision on the overall basis of very large and complex data analysis techniques. This analysis is in the context of Big Data where information overload is a danger in the sense that the data can be displayed or processed improperly. Many tools exist to take control of these data sets to enable decision-making in several areas.

Keywords

data, analysis, visualization, understanding, decision, Big Data.

Synthèse

Motivations

Aujourd'hui, les données sont produites à une vitesse exponentielle et la capacité à les collecter et à les stocker augmente à un rythme plus rapide que la capacité à les analyser: elles sont générées plus vite qu'elles ne peuvent être digérées. Au cours des dernières décennies, un grand nombre de méthodes automatiques d'analyse de données ont été développées. Cependant la nature complexe de nombreux problèmes rend indispensable le fait d'inclure l'intelligence humaine à un stade précoce dans le processus d'analyse des données.

Les méthodes Visual Analytics permettent aux décideurs de combiner leur flexibilité humaine, la créativité et les connaissances de base de stockage et de transformation des capacités des ordinateurs d'aujourd'hui pour mieux comprendre les problèmes de demain.

Définitions

Visual Data Analytics est la science de raisonnement analytique basée sur des interfaces visuelle interactives.

Le domaine de l'analyse visuelle de données se concentre sur le traitement des volumes massifs, hétérogènes et dynamiques d'informations (Big Data) grâce à l'intégration du jugement humain au moyen de représentations visuelles et des techniques d'interaction dans le processus d'analyse.

C'est un ensemble d'outils et de techniques qui permettent de :

  • synthétiser les informations à partir de données massives, dynamiques, ambiguës et souvent contradictoires
  • détecter l’attendu et découvrir l’inattendu
  • fournir des évaluations compréhensibles et en temps opportun
  • communiquer efficacement les évaluations.

Domaines d'application

  • Ingénierie: pour une amélioration de l'environnement de production.
  • Sécurité: pour le déclenchement d'alertes en cas de détection de situations alarmantes.
  • Finance: pour l'analyse des fils d’actualité, des données commerciales en temps réel et les indicateurs économiques fondamentaux.
  • Environnement: pour expliquer les changements dans les populations animales ou dans les processus météorologiques et climatiques.
  • Socio-économiques: influes les décisions politiques, les effets économiques, culturels et démographiques.


Processus d'analyse et algorithme

Processus d'analyse visuelle de données
Processus d'analyse visuelle de données

Le processus de Visual Data Analytics combine des méthodes d'analyse automatique et visuelle avec un couplage étroit à travers l'interaction humaine dans le but d'acquérir des connaissances à partir d'un ensemble de données. La première étape consiste à pré-traiter et transformer les données pour calculer les différentes représentations. Les tâches de pré-traitement comprennent le nettoyage des données, la normalisation, le regroupement ou l'intégration de sources de données hétérogènes.

Après la transformation, l'analyste peut choisir entre l'application de méthodes d'analyse visuelle ou automatique. Si une analyse automatique est utilisée d'abord, les méthodes d'extraction de données sont appliquées pour générer des modèles de données d'origine. Une fois qu'un modèle est créé, l'analyste doit l'évaluer et l'affiner en modifiant les paramètres ou en sélectionnant d'autres algorithmes d'analyse.

Si une exploration visuelle est effectuée en premier, l'utilisateur doit confirmer les hypothèses générées par une analyse automatisée. L'interaction de l'utilisateur avec la visualisation est nécessaire pour révéler des informations utiles.

Algorithme d'analyse visuelle de données
Algorithme d'analyse visuelle de données













Outils

  • Google Analytics (2005) est un logiciel d’analyse d’audience Internet et du comportement des internautes et permet la création de rapports.

Google Analytics

  • SAS Visual Analytics (2012) est un outil destiné aux entreprises et qui permet d'améliorer les performances, de limiter les risques et de faciliter les prises de décision. SAS
  • Tableau
  • SpotFire
  • QlikView

Démonstration

  1. Google Analytics
  • Site web utilisé: xuf-en.weebly.com
  • Code de suivi (collé dans le code de chaque page dont nous souhaitons effectuer le suivi):
 <script>
 (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
 (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
 m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
 })(window,document,'script','//www.google-analytics.com/analytics.js','ga');
 ga('create', 'UA-45058591-1', 'weebly.com');
 ga('send', 'pageview');
</script>
Vue d'ensemble de l'audience
Vue d'ensemble de l'audience
Systèmes d'exploitations des visiteurs
Systèmes d'exploitations des visiteurs
Fournisseurs de services des visiteurs
Fournisseurs de services des visiteurs


























Références