EA2012-Open Data

Présentation
Enseignants: Georges-Pierre Bonneau, Didier Donsez

Auteur: [Rolly Ngouala ]

Liens vers la présentation powerPoint

Historique
La notion d'OPEN DATA, trouve son origine du 18ieme siecle en Suède. Ci dessous une liste non exhaustive de l'évolution

- Suède 1776, Anders Chydenius

- Etats-Unis 1966, Freedom of Information Act.

- Lyndon Baines Johnson

- France 1978 Commission d'accès aux documents administratifs (CADA) ….

Jusqu'à lors les données étaient orientées consultation, il n'y avait que de reutilisisable ...

- 2009, naissance de data.gov

- 2010 Royaume-Uni

Intérêt & Cadre d’application
'INTERET Pour les entités'

Transparence, participation, collaboration: besoin de transparence, d'un état, d'une entreprise.

Recherche: l'accessibilité des informations, stimule les secteurs scientifiques, archeologiques.

Développement accru.

Diversités Solutions

'INTERET POUR NOUS'

se saisir de problématiques qui nous touchent, proposer une analyse, une qualité d'audit, des solutions auxquelles les décideurs peuvent ne pas avoir pensé.

Mixer les données: Combinaison SNCF, Transilien !

Concurrence accrue ==> diversité du choix, chute des tarifs.

Business création, innovation, ==> Emploi

Cadre juridique
La mise à disposition des données s'accompagne d'une législation qui vise à fixer les conditions d'accès,la diffusion, la réutilisabilité, et surtout de proteger les parties. Ainsi à l'instar des licences web, on trouve quelques licences autour de l'OPEN DATA.

- ODC-by : Elle autorise l'utilisation, la copie,la redistribution, la modification, la réalisation de travaux dérivés, sous réserve d’indiquer l’auteur original. La plupart des collectivités utilise cette licence.

- Licence Ouverte ETALAB : C'est une licence française promulguée par ETALAB. http://www.etalab.gouv.fr/pages/Licence_ouverte_Open_licence-5899923.html

- Licence RATP : Licence propre aux données de la RATP http://data.ratp.fr/

Accès & Déploiement des données
Pour une exploitation et déploiement facilent, standard,des normes ont été fixées. Ces normes s'articulent autour du formatage des ressources mises en ligne, de l'interopérabilité de ses ressources, des protocoles de mise en ligne efficaces et rapides.

 a) Déploiement

SPARQL : C'est à la fois un language de requètage et protocle CRUD(Create, Read, Update, Delete). Pour plus d'information http://en.wikipedia.org/wiki/SPARQL

ODATA : Protocole de partage de données basé sur Atom PUB, et developpé par Microsoft.

 b) Accès aux données

'L'interopérabilité' En vue de leur exploitation, les données doivent-être interoperables. On entend par interopérabilité la capacité que possède un produit ou un système, dont les interfaces sont intégralement connues, à fonctionner avec d'autres produits ou systèmes existants ou futurs et ce sans restriction d'accès ou de mise en œuvre.

'Formattage des données' A l'heure actuelle, la majorité des données sont aux formats XML, CSV, XLS. Ces formats peuvent ensuite être convertis vers d'autres comme le JSON, le RDF, ou XML.