EA2012-Open Data

From air
Revision as of 22:38, 24 December 2012 by Rngoulla (talk | contribs)
Jump to: navigation, search

Présentation

Enseignants: Georges-Pierre Bonneau, Didier Donsez

Auteur: [Rolly Ngouala <ngoualar@e.ujf-grenoble.fr>]

Liens vers la présentation powerPoint


                                                                                                Opendata.png

Abstract

Open Data, it's a new trend which want data be available for free to everyone in needs. This suppose data, should be available in a standard format in order to be easily used. In a second hand, that requires a legal framework. In this scope, we are going to see, the timeline of Open Data, and then some format in which data are available.


Keywords : Open DATA, JSON, XML, RDF, OData, SPARQL, ODC-BY, Licence ouverte

Historique

La notion d'OPEN DATA, trouve son origine du 18ieme siecle en Suède . Ci dessous une liste non exhaustive de l'évolution

- Suède 1776, Anders Chydenius http://razor.occams.info/pubdocs/2011-04-30%20TCamp%20Open%20Data%20slides.pdf

- Etats-Unis 1966, Freedom of Information Act. Pour des raisons de transparence du pouvoir executif, Lyndon Baines Johnson promulgue et signe la loi FOIA, qui oblige les agences fédérales à fournir leur documents sur demande.

http://uspolitics.about.com/od/usgovernment/a/foia.htm


- France 1978 Commission d'accès aux documents administratifs (CADA) http://www.cada.fr/

Jusqu'à lors les données étaient orientées consultation, centralisées en un seul point, avec un acces réduit.

Avec la venue d'internet,cette tendance, s'est étendue sur la toile; Cela a permis de décentraliser les centres d'informations. Dès lors une donnée est accessible en permanence, en tout temps, quelque soit le lieu dans lequel on se trouve.

- 2009, naissance de data.gov. Ce projet nait aux Etats-Unis toujours dans un souci, de transparence. Il s'entend ensuite dans d'autres pays. C'est dans ce même souci de transparence qu'en Janvier 2010 le Royaume-Uni lance son site http://data.gov.uk/ . La France lance le lien en 2011.

Intérêt & Cadre d’application

'INTERET Pour les entités'

Transparence, participation, collaboration: besoin de transparence, d'un état, d'une entreprise.

Recherche: l'accessibilité des informations, stimule les secteurs scientifiques, archeologiques.

Développement accru.

Diversités Solutions


'INTERET POUR NOUS'


se saisir de problématiques qui nous touchent, proposer une analyse, une qualité d'audit, des solutions auxquelles les décideurs peuvent ne pas avoir pensé.

Mixer les données: Combinaison SNCF, Transilien !

Concurrence accrue ==> diversité du choix, chute des tarifs.

Business création, innovation, ==> Emploi


Cadre juridique

La mise à disposition des données s'accompagne d'une législation qui vise à fixer les conditions d'accès,la diffusion, la réutilisabilité, et surtout de proteger les parties. Ainsi à l'instar des licences web, on trouve quelques licences autour de l'OPEN DATA.

- ODC-by : Elle autorise l'utilisation, la copie,la redistribution, la modification, la réalisation de travaux dérivés, sous réserve d’indiquer l’auteur original. La plupart des collectivités utilise cette licence. http://opendatacommons.org/licenses/by/1-0/

- Licence Ouverte ETALAB : C'est une licence française promulguée par ETALAB. http://www.etalab.gouv.fr/pages/Licence_ouverte_Open_licence-5899923.html

- Licence RATP : Licence propre aux données de la RATP http://data.ratp.fr/


Accès & Déploiement des données

Pour une exploitation et déploiement facilent, standard,des normes ont été fixées. Ces normes s'articulent autour du formatage des ressources mises en ligne, de l'interopérabilité de ses ressources, des protocoles de mise en ligne efficaces et rapides.


a) Déploiement

SPARQL : C'est à la fois un language de requètage et protocle CRUD(Create, Read, Update, Delete) . Pour plus d'information http://en.wikipedia.org/wiki/SPARQL

Exemple : SPARQL PREFIX rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#

PREFIX foaf: http://xmlns.com/foaf/0.1/

PREFIX dc: <http://purl.org/dc/elements/1.1/> SELECT DISTINCT ?nom ?image ?description WHERE { ?personne rdf:type foaf:Person. ?personne foaf:name ?nom. ?image rdf:type foaf:Image. ?personne foaf:img ?image. ?image dc:description ?description }


ODATA : Protocole de partage de données basé sur Atom PUB, et developpé par Microsoft.


b) Accès aux données

'L'interopérabilité' En vue de leur exploitation, les données doivent-être interoperables. On entend par interopérabilité la capacité que possède un produit ou un système, dont les interfaces sont intégralement connues, à fonctionner avec d'autres produits ou systèmes existants ou futurs et ce sans restriction d'accès ou de mise en œuvre.


'Formattage des données' A l'heure actuelle, la majorité des données sont aux formats XML, CSV, XLS. Ces formats peuvent ensuite être convertis vers d'autres comme le JSON, le RDF, ou XML.


Démo

Bibliographie

http://www.access-info.org/documents/Access_Docs/Thinking/Get_Connected/worlds_first_foia.pdf

http://www.etalab.gouv.fr/pages/Licence_ouverte_Open_licence-5899923.html

http://opendatacommons.org/licenses/odbl/1.0/

http://www.cambridgesemantics.com/fr/semantic-university/sparql-by-example

http://www.microsoft.com/openspecifications/en/us/programs/osp/default.aspx