Open data
L'open data ou donnée ouverte est une donnée numérique d'origine publique ou privée. Elle peut être notamment produite par une collectivité, un service public (éventuellement délégué) ou une entreprise. Elle est diffusée de manière structurée selon une méthode et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière.
L'ouverture des données (open data) représente à la fois un mouvement, une philosophie d'accès à l'information et une pratique de publication de données librement accessibles et exploitables.
Elle s'inscrit dans une tendance qui considère l'information publique comme un bien commun (tel que défini par Elinor Ostrom) dont la diffusion est d'intérêt public et général.
En Europe et dans certains pays, des directives et lois imposent aux collectivités de publier certaines données publiques sous forme numérique.
Éléments de contexte et de définition
L'ouverture des données est une philosophie visant à rendre des données numériques accessibles à tous et à s’affranchir des restrictions sur le droit d'accès et de réutilisation. Ces restrictions peuvent être imposées par l'usage de formats propriétaires ou de licences restrictives, notamment les licences payantes parfois mises en place sur des données publiques. L'ouverture vise à publier les données selon une méthode qui supprime les restrictions limitant notamment leur exploitation et reproduction.
Le statut de donnée ouverte est applicable à tout type de données numériques. À titre d'exemple, on peut citer les données sur le transport, la cartographie, les statistiques, la géographie, la sociologie, l'environnement ou encore le juridique. Par analogie, et sous certaines conditions, cela peut être comparé à des œuvres protégées par le droit d’auteur, des œuvres littéraires, artistiques et scientifiques, œuvres cinématographiques, dessins, photographies, cartes, sites internet...
La publication de données ouvertes s'inscrit dans le concept plus général d’Open knowledge[1] par l’Open Knowledge Foundation qui le définit comme étant une connaissance, c'est-à-dire une œuvre, notamment musicale, cinématographique ou des données écrites tel qu'un article scientifique, une donnée géographique, gouvernementale ou administrative. Le terme ouvert est défini comme la liberté d’utiliser, de réutiliser, de redistribuer librement l’œuvre originale.
Les données ouvertes s'inscrivent aussi dans une démarche plus vaste de transparence et de participation des citoyens que l’on retrouve dans toutes les politiques d’ouverture des droits et qui se manifeste parfois par l’acronyme ODOSOS[2] (de l'anglais « open data, open source et open standards, littéralement données ouvertes, logiciel libre et format ouvert), démarche elle-même comprise dans le mouvement plus général de l’innovation ouverte.
Parallèlement les principes de la gratuité et d'une meilleure facilité d'accès ont donc souvent été mis en avant et dans un nombre croissant de pays (ex en 2013 : 26 des 37 pays examinés, dont France, Canada, États-‐Unis, Japon, Russie, Chine Australie, Autriche, Corée du Sud, Israël, Singapour, Danemark, Finlande, Croatiee, Estonie, Pologne, Slovénie, Brésil, Émirats Arabes Unis, Tunisie, Maroc affichait un principe de gratuité [3], mais dans la réalité de ces pays, le périmètre des données ouvertes était parfois étroit ou évitait certains secteurs (ex données d'intérêt environnemental détenues par l'IGN, le BRGM, Météo-France ou le SHOM en France) ou des systèmes de certaines redevances persistaient pour certains usages ou certains niveaux de précision de la donnée…) [3].
Des champs d'application multiples
Des racines dans le monde universitaire
Les données ouvertes peuvent concerner les données du secteur public avec les notions de e-gouvernement ou encore d’e-démocratie. Elles peuvent aussi être des données issues d'instituts de recherche scientifique publics (ou privés bénéficiant de financements publics, ou souhaitant volontairement ouvrir et partager leurs données), souvent parallèlement à une libre diffusion des résultats de recherches ; on parle alors dans ce contexte de « libre accès » ou « libre diffusion », dont la première définition a été donnée par la Déclaration internationale sur le libre accès de Budapest qui s'est tenue le 14 février 2002, connue sous l'acronyme BOAI (Budapest Open Access Initiative)[4].
De là, de nombreuses autres initiatives ont vu le jour ailleurs dans le monde avec par exemple la Déclaration de Berlin de 2003 sur le libre accès à la connaissance en sciences et sciences humaines[5] ; suivi en mars 2005, depuis Southampton, d’une nouvelle Déclaration appelée Berlin III visant à renforcer les mesures adoptées dans le cadre de Berlin I.
Le projet pour le séquençage du génome humain a été permis par un Open data Consortium[6] créé sur proposition de Jim Kent (en) en 2003 et dont les bénéficiaires vont aussi être les pays en voie de développement où les universités et centres de recherche n’ont pas toujours accès aux périodiques scientifiques.
À côté du mouvement de l’open science data, les données ouvertes s'étendent au secteur privé, avec certaines organisations à but non lucratif. À titre d'exemple, Wikipédia et les grands wikis de la même famille placent tout leur contenu sous licence libre CC-by-sa, et le dernier projet de cette famille Wikidata est une base de donnée ouverte de bases de données libres. Certaines entreprises s'orientent vers le « libre » en choisissant des licences plus ou moins ouvertes pour les données et informations qu'elles génèrent, en publiant par exemple des articles, des études, et même des œuvres artistiques.
Les enjeux dépassent donc maintenant le simple droit d'accès aux documents administratifs.
Un mouvement de libération des données publiques en effervescence
Historiquement, ce sont les États-Unis qui ont les premiers lancé un large processus de libération des données publiques (obligation légale pour l'Etat et ses agences) depuis la loi « Freedom of Information Act » de 1966. Mais les facilités offertes par l'Internet lui ont donné un regain d'intérêt de la part du secteur public depuis 2009 [7].
Dans le monde, des mesures en faveur de davantage de transparence vis-à-vis des citoyens se multiplient et les données ouvertes apparaissent comme l'un des moyens de satisfaire leur volonté de participer à la vie de la Communauté et d’exercer leur droit d’être informé en associant un principe des externalités positives au principe de la donnée publique considérée comme bien commun.
En Europe, en 2003, la directive 2003/98/CE du Parlement européen et du Conseil du 17 novembre 2003 sur la réutilisation des informations du secteur public (en anglais, directive) dite PSI (Public Sector Information) va dans le même sens.
Les anglais ont une loi Freedom of Information Act qui date de l'an 2000.
En France, ce mouvement rencontre l'intérêt de nombreuses collectivités (un décideur sur deux de collectivité locale interrogé par MARKESS International en 2012, déclarait envisager l’élaboration d’une stratégie “open data” avant 2014[8]).
La directive PSI est transposée par une ordonnance [9] complétée d'un décret le 30/12/2005[10] pris en l'application de la loi CADA (Commission d'Accès aux Données Administratives) de 1978 [11].
Il peut notamment faciliter la mise en œuvre du droit d'accès des personnes aux documents administratifs, prévu en France par la loi du 17 juillet 1978[12] puis par la directive 2003/98/CE du Conseil de l'Union européenne du 17 novembre 2003 sur la réutilisation des données publiques[13].
Historique
Un fondement ancien à la libération des données publiques
Le droit d'accès aux informations publiques est inscrit dans la Déclaration des Droits de l’Homme et du Citoyen de 1789[14],[15],[16], sous l'article XV qui mentionne que la société a le droit de demander des comptes à tout agent public de son administration. La loi de 1978 sur le droit d'accès à l'information en France n'impose ni de publier des données numériques, ni de publier de manière proactive des informations.
Vague d'ouverture gouvernementale des années 2000 liée à l'émergence des nouvelles technologies
Certains pays ont été pionniers, dont les États-Unis, le Royaume-Uni, l'Australie et le Canada puis la France[17] Puis le mouvement s'est étendu en profitant du développement du Web 2.0, en étant notamment encouragé par deux ONG : l'Open Knowledge Foundation (OKFN) et l'Open Government Partnership (OGP).
États-Unis
Aux États-Unis, l'adoption de la loi sur le libre accès à l'information en 1966, la Freedom of Information Act[18], a été amendée notamment en 2007 par la loi OPEN Government Act[19]. L'ouverture des données publiques est (re)devenu un axe central du gouvernement américain avec [20], l'Open Government Initiative ainsi que [21] qui mentionnent les critères de publication de données ouvertes.
La libération des données se développe de manière formelle au niveau d'un État puis au niveau fédéral avec l’élection de Barack Obama, qui, dès son investiture fait part de son intention de « créer un niveau d’ouverture du gouvernement sans précédent », dans le but de « renforcer la démocratie et promouvoir son efficacité et son effectivité au sein du gouvernement »[22].
En , le projet data.gov est lancé, puis en décembre de la même année la directive du gouvernement ouvert[23] est publiée et pose les trois piliers de la coopération entre l'État et les citoyens qui sont la transparence du gouvernement, la participation et la collaboration. Vivek Kundra, premier responsable fédéral des systèmes d'informations (Chief Information Officer) dans l'administration Obama, observe que « la libération de ces données a donné naissance à une économie des applications […] on assiste à une explosion de ces communautés de développeurs ».
Europe
Le mouvement des données ouvertes est encadré au niveau européen par la directive 2003/98/CE (« Informations du secteur public » (PSI)) du Conseil de l'Union européenne du 17 novembre 2003 sur la réutilisation des données publiques[13] et la directive INSPIRE en 2008.
Royaume-Uni
Au Royaume-Uni, un projet analogue[24] est officiellement lancé en janvier 2010, par Gordon Brown et sous l'impulsion de Tim Berners-Lee. Le projet oblige le gouvernement à publier, entre autres, toute dépense supérieure à 25 000 livres sterling en utilisant les technologies du Web sémantique que Tim Berners-Lee met en œuvre depuis dix ans.
France
En France, un mouvement d'ouverture semble s'amorcer en 1978 avec l'accès libre à la plupart des documents administratifs, renforcé en 1994 par une circulaire sur à la diffusion des données puis en 1997 avec la gratuité pour les données publiques essentielles. En 2002 Legifrance met en ligne gratuitement une grande partie de la donnée juridique disponible[25] (8 ans avant le gouvernement britannique et son site « Acts and statutory »[26] en 2010).
En 2003, une directive communautaire sur les ISP encourage le mouvement alors que des mouvements civiques comme Libertic, Open Street Map France, Regards Citoyens ou Wikimedia France expérimentent et évangélisent sur le thème pendant plusieurs années, avant que les pouvoirs publics n'agissent.
Les collectivités pionnières en France sont des villes : Rennes puis Paris grâce à la délibération prise par le Conseil municipal en date du 8 juin 2010 relative à la diffusion des données publiques et l’adoption d’une résolution[27] puis du portail « Paris Data[28] » (27 janvier 2011) diffusant des données, dont cartographiques (plan parcellaire, éléments de signalétique, notices d'ouvrages en prêt dans les bibliothèques…), qui a rapidement permis de créer par exemple une carte sur l'histoire des noms des rues de Paris[29], une carte électorale interactive[30] ou une carte des 70 espèces d’arbres présentes à Paris[31], utile pour les allergiques ».
En 2011 nait la « mission Etalab » auprès du Premier ministre. Elle est chargée de créer et alimenter le portail de données publiques ouvertes data.gouv.fr[32],[33], en ligne depuis le 5 décembre 2011[34]. Étalab a lancé récemment Dataconnexions, un réseau d'acteurs des données ouvertes afin de dynamiser ce secteur de l'économie numérique[35]. Besançon[36] et d'autres sont en réflexions. En mai 2012, un concours organisé par Dataconnexions a permis de récompenser six acteurs de la communauté des données ouvertes françaises[37].
Depuis le 9 octobre 2013, l'association OpenDataFrance réunit les collectivités engagées dans l'ouverture des données publiques, et en 2014, la France, est classée 3e au classement mondial de l'Open Data Index[38].
Autres pays
Kenya
Le Kenya, le 8 juillet 2011, met en ligne sa «Kenya Open Data Initiative», permettant l'accès à 160 bases de données[39].
Canada
Au Canada, le ministre Stockwell Day, Président du Conseil du Trésor a annoncé le 17 mars 2011 le lancement d'un projet pilote de 12 mois pour le site fédéral de données ouvertes http://data.gc.ca/[40]. Le 11 avril 2012, le ministre Tony Clement, nouveau président du Conseil du Trésor, a annoncé le Plan d'action du Canada pour un gouvernement ouvert. Ce plan de 3 ans inclut :
- L'accroissement du nombre d'ensembles de données disponibles et la mise en place d'un cadre de recommandation pour les nouvelles générations de plateformes ;
- Un nouveau design et une réorganisation du portail national data.gc.ca, de façon à améliorer le niveau de standardisation des données, dans les seconde et troisième années[41].
En plus du site principal http://data.gc.ca/, l'initiative fédérale comprend :
- GeoGratis du Ministère des Ressources naturelles (données géospatiales) ;
- Données environnementales du ministère Environnement Canada
Critères d'évaluation du degré d'ouverture des données
Les dix critères d'une donnée ouverte
En 2010, la Sunlight Fundation établit une liste de 10 critères [42] caractérisant une donnée ouverte. Pour qu'une donnée soit dite "ouverte", elle doit être :
- Complète
- Primaire
- Opportune
- Accessible
- Exploitable
- Non-Discriminatoire
- Non-Propriétaire
- Libre de droits
- Permanente
- Gratuite
Échelle de qualité des données ouvertes de Tim Berners-Lee
En 2010, Tim Berners-Lee a proposé une échelle de qualité des données ouvertes (de 1 à 5 étoiles[43]).
★ | Données non filtrées (éventuellement dégradées) par exemple mises en ligne avec n'importe quel format[44] |
★ ★ | Données disponibles de manière structurée (ex : données tabulaires en CSV, XML, Excel, RDF)[45] |
★ ★ ★ | Données librement exploitables - juridiquement (Cf. licences), - techniquement (dans des formats non-propriétaires, pas sous Excel notamment) [46] |
★ ★ ★ ★ | Données identifiées par des URL (avec date de mise à jour) afin que l'on puisse « pointer » un lien vers elles (et la retrouver éventuellement mise à jour)[47] |
★ ★ ★ ★ ★ | Données liées à d'autres données, pour les contextualiser et enrichir[48] |
Cette échelle concerne les données numériques de base, mais ses critères peuvent être adaptés à des données agrégées ou des informations publiques plus complexes (photos, vidéo, rapports, études, etc. qui devront aussi être mis en ligne, idéalement avec une métadonnée de qualité et pouvant aussi intégrer de l'hypertexte dans le cas des rapports et études, voire de certaines vidéos)
L'objectif premier était de mettre en ligne des données produites par l'État ou d'autres sans attendre la mise en œuvre d'une communauté d’intérêts privées (cf débat présenté plus bas sur le paradoxe de la poule ou de l’œuf) qui pouvait ralentir la mise à disposition des données sur le réseau, et donc indirectement freiner l’émergence de ruptures technologiques au sein du mouvement Web sémantique dont Tim Berners-Lee est l'un des promoteurs.
Les données ouvertes dans le Web des données
Les principaux problèmes de l'exploitation des données ouvertes sont d'ordre technique car les données en masse ne peuvent pas être traitées humainement. Le concept de Web des données appliqué aux données ouvertes met en œuvre 3 mécanismes :
- Permettre l'existence de la donnée sur le réseau à travers une URI unique (cela inclut les URL).
- Diminuer le coût de transformation de la donnée en apportant des formats standards lisibles par les machines (comme avec RDF, RDFa ou les microdonnées dans le HTML5).
- Améliorer la qualité de la donnée pour éviter qu'un traitement de mise à disposition ne puisse les altérer. Un entrepôt de données même avec des erreurs est préférable qu'un entrepôt biaisé. Ainsi, des mécanismes pour la fréquence et l’automatisation des mises à jour de la donnée par les producteurs des données est possible avec un service SPARQL sur ces données.
Les données ouvertes ne sont contrôlables par leurs producteurs (contrôle des mises à jours) et réellement exploitables par d'autres qu'à la condition d'utiliser ces 3 mécanismes.
Bénéfices
Publics et sociaux
En Grande-Bretagne, le croisement des données ouvertes a permis une diminution de 30 % de la facture de consommation d'énergie dans les bâtiments publics en seulement deux mois[49].
Mais certaines applications de réalité augmentée dérangent : par exemple, BeenVerified.com indique les adresses des délinquants sexuels répertoriés et Whoslobbying croise les agendas des ministres aux rendez-vous qu'ils ont avec les milieux d'affaires[50].
De plus, des voix s’élèvent pour rendre transparents les échanges économiques et financiers pour :
- Éviter les problèmes systémiques qui plongent de nombreux pays dans une crise économique permanente[réf. nécessaire].
- Éviter les délocalisations abusives d'entreprises qui maquillent leurs comptes pour justifier leurs plans sociaux[réf. nécessaire].
Cependant, l'ouverture des données est souvent uniquement associée à l'idée de réduction des coûts. Les innovations de rupture par l'émergence d'usages inattendus sur ces données vont permettre, à titre d'illustration, la publication de données ouvertes sur les hôpitaux, permettant d'améliorer la qualité de leurs services[réf. nécessaire].
Économiques
Les données ouvertes permettent, dans l'idéal, une concurrence équitable entre toutes les entreprises. Cependant, des études sociologiques en Inde et au Canada ont mis en évidence que l'accès et l'utilisation des données ouvertes étaient conditionnés par des critères matériels (électricité, possession de matériel informatique) et sociaux (éducation)[51].
De plus selon certaines études, la libération de ces données publiques diviserait par cinq le capital nécessaire pour exercer une activité professionnelle dans le secteur de la téléphonie mobile[52]. Le rapport MEPSIR datant de 2006, financé par la commission européenne, estime que le marché européen lié à la réutilisation des informations publiques représente 27 milliards d'euros.
Par ailleurs, l'impact économique direct et indirect a été évalué 140 milliards € par an pour l’Europe[53].
Écologiques
L'évolution actuelle de l'écologie et en particulier la connaissance des phénomènes passés et futurs repose sur une synthèse et une analyse d'une grande quantité de données. Dans ce cadre l'ouverture des données représente une opportunité de taille pour le futur de la protection de l'environnement. Pourtant le défi actuel repose sur la capacité des différents partis à fournir des données uniformisées et reposant sur des méthodes scientifiques similaires.
Débats sur l'ouverture des données
Paradoxe de l'œuf et de la poule
Il existe des opinions divergentes sur la mise en œuvre des données ouvertes qui se résume au « Paradoxe de l'œuf et de la poule" »:[réf. nécessaire]
- Certains pensent que ce sont les données (« l'œuf ») qui permettront de voir naître une possible alchimie et ainsi créer de la richesse qui profitera à toute la société. Il faut donc commencer en priorité par mettre à disposition toutes les données qui existent déjà au sein des institutions publiques. De la poule ou de l'œuf, c'est l'œuf qui existe déjà… donc les données sont leurs priorités.
- D'autres pensent qu'une communauté (« poule ») est indispensable pour transformer les données en Killer application ou en future start-up. C'est le cas par exemple de la FING (Fondation internet nouvelle génération) qui depuis 2000 a une approche principalement sociale[54] en recommandant depuis janvier 2011 aux collectivités de compléter la démarche par une «infrastructure sociale[54] »:(« modalités d’accompagnement de la réutilisation, les formes d’animation de la communauté des ré utilisateurs, la facilitation des modes de partage entre réutilisateurs »)[54].
Depuis la création de l'Internet, les anglo-saxons sont en tête dans la mise en œuvre du Web, du Web des données en terme technologique, scientifique et économique[réf. nécessaire]L'approche « œuf d'abord » apparaît dans la mise en œuvre des données ouvertes comme avec DBpedia. Cette approche pragmatique de commencer par les données semble donc efficace pour la mise en œuvre des données ouvertes. La question se pose de savoir si elle permet leur exploitation et donc de savoir comment en récolter les fruits; certains résultats sont encourageants. Par exemple en Grande-Bretagne, le croisement des données ouvertes a permis une diminution de 30 % de la facture de consommation d'énergie dans les bâtiments publics en seulement deux mois[49].
Rendre compte des actions publiques
Les institutions en France ont le devoir de valoriser leurs données publiques car à budget constant de l'État, c'est un moyen de pouvoir augmenter leurs recettes pour maintenir leur mission (comme avec l'INA, la BNF, les musées, etc.). Seule une décision politique et donc une loi avec un décret d'application contraindraient toutes les institutions à libérer les données exploitables et interopérables dont elles disposent.[réf. souhaitée]
Ainsi en attendant cette loi et son décret, des associations mettent la pression sur les élus pour obtenir ces données car ils pensent que certains élus ne veulent pas voir des données qui les touchent étalées sur la place publique comme leurs prises de décisions dans les institutions, leurs conflits d’intérêts, leurs frais de remboursement, leurs salaires, etc. Automatiquement dans l'imaginaire des élus, ils pensent que les données ouvertes ne serviront principalement aux citoyens qu'à se substituer à la cour des comptes et donc ralentira d'autant leur travail.[réf. souhaitée]
Ainsi, un débat civique sur le thème « Quel est l’intérêt de l'ouverture des données dans la société ? » est devenu « Pourquoi freiner l'ouverture des données avec des écrans de fumée si les politiques n'ont rien à cacher ? ». Parmi les problèmes non bloquants pour la mise à disposition des données, et qui peuvent sembler être des écrans de fumée pour les citoyens, on peut citer les problèmes suivants :
- Juridiques : sur le droit de réutilisation des données dans la société bien que les données soient publiques.[réf. souhaitée]
- Economiques : le financement de la recherche des technologies de l'information et des institutions ayant des données sont au point mort pour "cause de crise", bien que les économies soient instantanées dans les pays qui mettent en œuvre l'ouverture des données.[réf. souhaitée]
Les citoyens considèrent ainsi que leurs élus font souvent le service minimum pour la mise en œuvre d'une politique en rupture dans le domaine de l'ouverture des données et donc de la transparence de toutes les institutions par et pour la société.[réf. souhaitée]
Avancement
Ouverture des données publiques
Liste par pays
Voici une liste non-exhaustive des pays s'inscrivant dans le mouvement des données ouvertes:
URL | Entité | Pays/Entité | Date de Lancement | Licence | Données gratuites | Données complètes (non altérées) | Point d'accèsSPARQL & nb triplets | Formats | Thématiques | Note sur l'échelle de Berners-Lee | |
---|---|---|---|---|---|---|---|---|---|---|---|
data.un.org | Organisme international | Nations unies | |||||||||
data.worldbank.org | Organisme international | Banque Mondiale[55] | |||||||||
open-data.europa.eu | Organisme international | Union européenne, Commission Européenne | |||||||||
Gouvernement | Afghanistan | ||||||||||
Gouvernement | Afrique du Sud | ||||||||||
Gouvernement | Albanie | ||||||||||
Gouvernement | Algérie | ||||||||||
govdata.de | Gouvernement | Allemagne | |||||||||
Gouvernement | Andorre | ||||||||||
Gouvernement | Angola | ||||||||||
Gouvernement | Antigua-et-Barbuda | ||||||||||
Gouvernement | Arabie saoudite | ||||||||||
Gouvernement | Argentine | ||||||||||
Gouvernement | Arménie | ||||||||||
data.gov.au | Gouvernement | Australie[56] | |||||||||
data.gv.at | Gouvernement | Autriche | |||||||||
Gouvernement | Azerbaïdjan | ||||||||||
bahrein.bh | Gouvernement | Bahreïn | |||||||||
data.belgium.be (Données ouvertes en Belgique) | Gouvernement | Belgique | Encore en bêta, mais utilisable. | ||||||||
dados.gov.br | Gouvernement | Brésil | |||||||||
data.gov.bf | Gouvernement | Burkina Faso | alpha | 103 | CSV | 11 | |||||
data.gc.ca (Données ouvertes au Canada) | Gouvernement | Canada | |||||||||
datos.gob.cl | Gouvernement | Chili | |||||||||
govinfo.nlc.gov.cn | Gouvernement | Chine | |||||||||
datosabiertos.gob.go.cr | Gouvernement | Costa Rica | |||||||||
digitaliser.dk | Gouvernement | Danemark | |||||||||
opendata.ee et pub.stat.ee | Gouvernement | Estonie | |||||||||
data.gov | Gouvernement | États-Unis | |||||||||
data.gouv.fr (Données ouvertes en France) | Gouvernement | France | |||||||||
Gouvernement | Finlande | ||||||||||
geodata.gov.gr | Gouvernement | Grèce (données géospatiales)[57] | |||||||||
Gouvernement | Hong Kong | ||||||||||
statcentral.ie | Gouvernement | Irlande | |||||||||
data.gov.it | Gouvernement | Italie | [58] | ||||||||
« opendata.go.ke » (Archive • Wikiwix • Archive.is • Google • Que faire ?), consulté le 2013-08-16 | Gouvernement | Kenya | |||||||||
date.gov.md | Gouvernement | Moldavie | |||||||||
data.gov.ma | Gouvernement | Maroc | |||||||||
« data.overheid.nl » (Archive • Wikiwix • Archive.is • Google • Que faire ?), consulté le 2013-08-16 | Gouvernement | Pays-Bas | |||||||||
« data.govt.nz » (Archive • Wikiwix • Archive.is • Google • Que faire ?), consulté le 2013-08-16 | Gouvernement | Nouvelle-Zélande [59] | |||||||||
data.norge.no | Gouvernement | Norvège | |||||||||
« data.go.kr » (Archive • Wikiwix • Archive.is • Google • Que faire ?), consulté le 2013-08-16 | Gouvernement | République de Corée | |||||||||
datosperu.org | Gouvernement | Pérou | |||||||||
Gouvernement | Arabie saoudite | ||||||||||
data.gov.sg | Gouvernement | Singapour | |||||||||
datos.gob.es | Gouvernement | Espagne | |||||||||
transparency.gov.tl | Gouvernement | Timor | |||||||||
government.ae/web/guest/uae-data | Gouvernement | Émirats arabes unis | |||||||||
data.gov.uk (Données ouvertes en Angleterre) | Gouvernement | Royaume-Uni | |||||||||
datos.gub.uy | Gouvernement | Uruguay | |||||||||
data.gov.in | Gouvernement | Inde | |||||||||
dados.gov.pt | Gouvernement | Portugal | |||||||||
opengovdata.ru | Initiative privée | Russie, OpenGovData Russia Catalog | [60] | ||||||||
data.gov.sk | Gouvernement | Slovaquie | |||||||||
xn--ppnadata-m4a.se | Gouvernement | Suède | |||||||||
opendata.admin.ch | Gouvernement | Suisse | [61] | ||||||||
Ghana Open Data Initiative | Gouvernement | Ghana(GODI) | |||||||||
satupemerintah.net | Gouvernement | Indonésie | |||||||||
mapas.gob.mx | Gouvernement | Mexique | |||||||||
oman.om/opendata | Gouvernement | Oman | |||||||||
data.gov.tn et opendata.interieur.gov.tn (Données ouvertes en Tunisie) | Gouvernement | Tunisie | |||||||||
paloalto.opendata.junar.com | Municipalité | États-Unis, Palo Alto | |||||||||
rotterdamopendata.nl | Municipalité | Pays-Bas, Rotterdam | |||||||||
bahiablanca.opendata.junar.com | Municipalité | Argentine, Bahía Blanca | |||||||||
donnees.ville.montreal.qc.c | Municipalité | Canada, Montréal | |||||||||
lima.datosabiertos.pe | Municipalité | Pérou, Lima | |||||||||
data.iledefrance.fr | Région | France, Région Île-de-France | |||||||||
Problèmes
Des moyens faibles face à une rentabilité mal évaluée
Force est de souligner que les budgets informatiques nécessaires pour la mise en œuvre de portails dédiés aux données ouvertes sont faibles. Aux États-Unis, le pilotage de l'Electronic Government Fund ne nécessite que 34 millions $ en 2010[62]. En France, l'équipe Étalab, anciennement dirigée par Séverin Naudet, ancien conseiller « internet » de François Fillon chargé notamment du développement du site France.fr, comprend 9 personnes et dispose d'un budget de 4 M€ hors charges salariales pour réaliser le portail data.gouv.fr; elle est rattachée au premier ministre et a le soutien de la DILA.
Bien que le portail britannique data.gov.uk ait coûté 600 K€, le croisement des données ouvertes a permis une diminution de 30 % de la facture de consommation d'énergie dans les bâtiments publics en seulement deux mois[49].
Une publication inégale selon les domaines
Certains domaines jugés sensibles, stratégiques ou rémunérateurs ne sont pas libérés.
Ouverture des données économiques et financières
Les données qui permettraient de rendre transparents le commerce et la finance sont généralement dans des entités qui ne communiquent que rarement leurs données et bien souvent leurs conclusions sont invérifiables car sans liens avec les données qui ont permis de faire leurs conclusions. Certaines sont publiées du fait de la réglementation, mais sans normalisation ni formats facilement exploitables.
Données sur les entreprises
Données boursières
Ouverture des données scientifiques
L'ouverture des données scientifiques et le libre accès sont deux sujets connexes mais distincts. Le libre accès concerne les publications scientifiques, souvent relues par des pairs. L'ouverture des données scientifiques peut concerner les données à la base de ces articles, ou toute base de données à caractère scientifique (par exemple des relevés météorologiques ou autres), afin de permettre la reproduction des expériences menées, afin de les affirmer ou les infirmer[63].
Les technologies
Les données ouvertes sont soumises à une seule contrainte qui est d'être accessible par tous types de machines pour permettre leur traitement. Cela implique que les données ouvertes soient interopérables. Si les données ne respectent pas les standards du Web pour permettre leur interopérabilité, on parlera de données bridées car leur réutilisation est moindre voire quasiment nulle.
Ce critère d’interopérabilité n'a jamais été réellement respecté dans l'industrie, jusqu'en 2008 où le standard SPARQL est devenu une recommandation du W3C. Ce langage de requête permet aux développeurs de tester leurs requêtes directement depuis leurs navigateurs Web sur les données ouvertes en ligne puis de développer leur propre programme pour analyser ces données. On peut ainsi consommer les données à distance sans avoir à les transformer ou à les déplacer. Ainsi, les gouvernements au Royaume-Uni et aux États-Unis ont commencé à basculer leurs données dans le Web des données ouvert (en anglais, Linked Open Data ou LOD) en respectant les standards du W3C et en offrant un point d'accès SPARQL pour les développeurs.
Exemple de données réellement ouvertes : trouver sur une carte les écoles les plus proches de son domicile avec les données de Data.gov.uk (du gouvernement au Royaume-Uni) qui offre toutes les données relatives aux écoles sur son territoire.
Une conséquence de ce choix politique, d'offrir un vrai standard pour les données publiques comme le Web des données, est décrit dans le livre "Linking Government Data[64]". Dans ce livre est décrit comment le Web des données est passé de quelques 40 millions de triplets RDF au sein de quatre entrepôts de données en 2007 à 203 entrepôts avec plus de 25 milliards de triplets avec 395 millions de liens à la fin 2010. Les plus optimistes parlent de croissance exponentielle des données (comme dans l'illustration : Évolution du Web des données) et annoncent un Web 3.0 et même un possible point de singularité dans l'avenir. Quoi qu'il en soit, ce choix politique a permis d'ouvrir de nouvelles pistes de recherche scientifique, économique et sociale.
Les licences
L'ouverture des données impose d'apposer une licence fixant les conditions dans lesquelles ces données pourront être copiées, diffusées, réutilisées librement. Les contextes juridiques variant d'un pays à un autre, diverses licences sont aujourd'hui utilisées à travers le monde.
Licences de l'Open Knowledge Foundation
Open data commons est un projet lancé au Royaume-Uni en décembre 2007 par l’Open Knowledge Foundation. La première licence libre du projet a été élaborée en mars 2008 par Jordan Hatcher et Dr Charlotte Waelde.
Ces licences peuvent être appliquées aux bases de données et données qu'elles contiennent prises isolément. L’Open Knowledge Foundation a élaboré trois types de licences de données libres qui se fondent sur leur droit interne, lui-même basé sur le modèle anglo-saxon et qui diffère des droits romano-germaniques, c’est-à-dire civilistes, avec une protection plus reconnue et aboutie du droit moral. De là, l'application de certaines de ces licences aux œuvres de l'esprit n'est pas valable en France mais peut être envisagée pour la diffusion des données publiques dans la mesure où elles sont par définition, publiques.
Public Domain Dedication and License
La licence Public Domain and License (PDDL)[65] donne la possibilité d’utiliser, de copier, de modifier, de redistribuer une base de données sans aucune restriction. C’est une licence libre de tout droit, de type domaine public. Les données peuvent donc être exploitées de façon totalement libre et l’auteur abandonne son droit moral.
Open Database Commons
Cette licence[66] que l'on retrouve sous le sigle ODC-by autorise l’utilisation, la copie, la redistribution, la modification, la réalisation de travaux dérivés de la base de données, sous réserve d’indiquer le nom de l’auteur de la base de données originale. On retrouve ces principes dans la licence Creative Commons By.
Open Database License
La licence ODC-ODbl[67] est fondée sur le droit d'auteur et le droit sui generis des bases de données. Elle donne la possibilité aux utilisateurs de copier, distribuer, utiliser, modifier et produire une œuvre dérivée à partir d’une base de données sous réserve de la redistribuer sous les mêmes conditions imposées par la licence originale. Elle implique aussi d’indiquer le nom de l’auteur de la base de données d’origine.
Licences de type Creative Commons
À l'exception de la licence CC-0 spécialement conçue à cette fin, les licences de la famille Creative Commons ne sont pas adaptées à un usage sur une base de données. Elles sont en effet uniquement centrées sur le droit d'auteur, et négligent le droit sui generis des bases de données : cela risque d'une part de les rendre inefficientes (le respect de leurs obligations n'étant plus lié à la cession de droit) et d'autre part de rendre incertains le statut des données diffusées sous ces licences (l'éventuel droit sui generis des bases de données n'étant pas partagé)[68].
Licences en France
En droit français, les données publiques sont considérées comme susceptibles de contenir des informations sensibles, soit, car elles permettent d'identifier une personne, soit car elles sont soumises au droit d'auteur, secret d'État ou pour des considérations de défense nationale. Dans ce contexte, les données ne peuvent pas être librement diffusées sans autorisation préalable ou doivent faire l'objet d'une anonymisation. Une fois les droits de diffusion garantis, des licences vont s'appliquer. Différents organismes ont élaboré des licences libres applicables à tout type de contenu, public ou créations de l'esprit. Il s'agit de simples modèles de licence d'exploitation qui n'imposent pas de s'y conformer. Des contrats inédits peuvent être élaborés, à la condition de respecter le droit interne, tant au regard des dispositions des lois du 17 juillet 1978 ou encore du 6 janvier 1978 qu'au regard des règles d'ordre public applicables au contrat[69]. En France, jusqu'à cinq licences différentes de réutilisation ont été apposées sur les données ouvertes. En 2013, l'harmonisation des pratiques a conduit à l'usage de deux licences types utilisées dans des proportions équivalentes [70]: la Licence Ouverte et l'Open Database Licence.
Licence du ministère de la Justice français
Le ministère de la Justice a pris l'initiative de concevoir une licence adaptée aux données publiques, la Licence information publique librement réutilisable[71] communément appelée la LIP.
Elle donne la possibilité de réutiliser les données du Répertoire du ministère[72] gratuitement, même à des fins commerciales sous réserve de mentionner les sources, la date de mise à jour, de ne pas altérer les données et de ne pas en dénaturer le sens.
Il est également prévu que l'utilisateur ne puisse autoriser une nouvelle réutilisation sous une licence qu'à la condition d'avoir ajouté de la valeur à la donnée d'origine.
Licence Ouverte
Cette licence créée par ETALAB est destinée à être utilisée notamment sur data.gouv.fr.
Open Database License
La licence ODbL a été traduite en français par la ville de Paris afin de l'adapter à un usage national. Une variété de projets utilisent cette licence, depuis Open Street Map aux collectivités locales (Paris, Nantes, Toulouse…).
Organisations de promotion des données ouvertes
- freeourdata.org.uk[73] -
- Open Data Institute -
- Open Knowledge Foundation -
- Scholarly Publishing and Academic Resources Coalition (en) -
- Sunlight Foundation (en) -
- LinkedScience.org[74] -
- Talis (en) -
- w3.org (en) [75] -
- Blue Obelisk (en) - Groupe de chimistes pour la promotion des données ouvertes
- Freebase - Base de données maintenue par Google
- Factual (en) -
- Information Retrieval Facility (en) -
- Socrata (en) -
- International Development Research Centre -
- OMG standard (en) -
- CiteSeer (en) - bibliothèque et moteur de recherche d'articles scientifiques, notamment en informatique
- Knoema -
- Ecodesk (en) - Données sur les profils environnementaux des entreprises
- LiberTIC
- Regards Citoyens
Notes et références
- ↑ http://www.opendefinition.org/okd/
- ↑ Le sigle ODOSOS a été développé lors du lancement de grands projets scientifiques fondés sur l'ouverture des résultats de recherche
- 1 2 Mohammed-Adnène Trojette Magistrat à la Cour des comptes (2013) L’ouverture des données publiques, comparaison internationale (contenu sous Licence Ouverte Etalab, n’engageant pas la cour des comptes) 16 dec 2013
- ↑ Open Acess initiative ; http://openaccess.inist.fr/spip.php?article9
- ↑ Déclaration de Berlin ; http://www.zim.mpg.de/openaccess-berlin/BerlinDeclaration_fr.pdf
- ↑ http://www.opendataconsortium.org/
- ↑ Chronologie de l'ouverture des données publiques par Tim Davies
- ↑ Open data : quelles perspectives d’élargissement du mouvement au sein des collectivités locales d’ici 2014 ?, blog Administration numérique MARKESS International
- ↑ Ordonnance 2005-650 du 6 juin 2005
- ↑ Décret n° 2005-1755 du 30/12/2005 relative à la liberté d'accès aux documents administratifs et à la réutilisation des informations publiques, pris pour l'application de la loi n° 1978-753 du 17/7/1978
- ↑ Loi n° 1978-753 du 17/7/1978
- ↑ Texte en vigueur : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006068643&dateTexte=20110517
- 1 2 Texte en vigueur: http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2003:345:0090:0096:FR:PDF
- ↑ Direction de l'information légale et administrative, « Comment améliorer la transparence de l’administration ? - S'adapter aux attentes des usagers Découverte des institutions », (consulté le 14 décembre 2014)
- ↑ Légifrance, « Déclaration des Droits de l'Homme et du Citoyen de 1789 » (consulté le 14 décembre 2014)
- ↑ Assemblée nationale, « Le temps de l'invention (1789-1799) - Histoire de l'Assemblée nationale » (consulté le 14 décembre 2014)
- ↑ Mohammed Adnène TROJETTE Magistrat à la Cour des comptes (2013) L’ouverture des données publiques, comparaison internationale, voir graphique page 21/28 du PDF (contenu sous licence Ouverte Etalab, n’engageant pas la cour des comptes) 16 dec 2013
- ↑ Texte en vigueur : http://www.justice.gov/oip/foia_updates/Vol_XVII_4/page2.htm
- ↑ Texte en vigueur : http://www.justice.gov/oip/amendment-s2488.pdf
- ↑ [http://www.whitehouse.gov/the_press_office/Transparency_and_Open_Government/ memorandum sur la transparence et gouvernance ouverte de 2009
- ↑ la Directive sur l'ouverture des données de 2013
- ↑ « L'information détenue par le gouvernement fédéral est un bien national » (discours du 20 janvier 2009)
- ↑ http://www.whitehouse.gov/sites/default/files/omb/assets/memoranda_2010/m10-06.pdf
- ↑ ; Projet data.gov.uk
- ↑ Décret no 2002-1064 du 7 août 2002 instaurant la mise en ligne gratuite sur l'internet des informations juridiques
- ↑ "Acts and statutory instruments"
- ↑ « Ordre du jour définitif du Conseil Municipal de Paris du 16/03/2012 » (Archive • Wikiwix • Archive.is • Google • Que faire ?), consulté le 2013-08-15
- ↑ http://opendata.paris.fr
- ↑ Carte interactive sur l’histoire des noms des rues de Paris à partir de données ouvertes
- ↑ « Carte électorale interactive » (Archive • Wikiwix • Archive.is • Google • Que faire ?), consulté le 2013-08-16
- ↑ Cartographie des 70 essences d'arbres à Paris
- ↑ Etalab, mission de création du portail de données publiques data.gouv.fr
- ↑ Allocution de Séverin Naudet lors du salon i-expo le 18 mai 2011 : « Avec l'internet, il est logique d'adosser le prix de l'information sur son coût marginal proche de zéro, surtout lorsque la donnée est financée par tous via l'impôt. »
- ↑ « L'ouverture des données publiques: une dynamique de long terme, impulsée par Etalab », data.gouv.fr, (consulté le 3 janvier 2012)
- ↑ Les partenaires de Dataconnexions
- ↑ theitcircle.net, Open Data : Besançon pourrait suivre le mouvement, consulté 2011-09-25
- ↑ Les finalistes du premier concours Dataconnexions
- ↑ La France, 3e au classement mondial de l’Open Data Index
- ↑ Joan Tilouine, « #OpenData : Le Kenya lance le mouvement » (consulté le 13 juillet 2011)
- ↑ Minister Day Launches Open Data Portal
- ↑ Canada's Action Plan on Open Government
- ↑ 10 principes de l'ouverture des données selon la Sunlight Fundation
- ↑ Tim Berners-Lee, « Linked Data », sur le site W3C, section « Is your Linked Open Data 5 Star? » (page consultée le 10 février 2014).
- ↑ Exemple donnée météorologique basique : T°c la plus basse selon jour/mois/année, tiré de « 5 ★ Open Data », 3 avril 2012 (page consultée le 10 février 2014).
- ↑ Même donnée que ci-dessus, mais sous forme d'un tableau Excel, plus facile à réutiliser
- ↑ Même donnée que ci-dessus en format CSV (reconnu par Excel et de nombreux autres logiciels)
- ↑ Même donnée que ci-dessus, mais via un lien URL
- ↑ Même exemple que ci-dessus, mais avec lien hypertexte
- 1 2 3 Citation de Charles-Henri Schulz lors de l'atelier Open data, open standards lors de l'Open World Forum du 24 septembre 2011.
- ↑ Émilien Ercolani, Open data : pas si simple ! L'informaticien, no 91, mai 2011, page 29.
- ↑ Michael Gurstein, Open data : Empowering the empowered or effective data use for everyone ?, First Monday (Université de l'Illinois), 7 février 2011, consulté le 15 octobre 2013
- ↑ Chiffre cité par Olivier Schmit lors la conférence Les Modèles économiques de la réutilisation des données publiques (open data) du salon i-expo le 18 mai 2011
- ↑ REVIEW OF RECENT STUDIES ON PSI RE-USE AND RELATED MARKET DEVELOPMENTS by Graham Vickery
- 1 2 3 Guide pratique de l'ouverture des données publiques territoriales, à l'usage des territoires et de leurs partenaires (version Beta)
- ↑ TED talk : l'open data au service de l'aide internationale, par Sanjay Pradhan, vice président de l'Institut de la Banque Mondiale (vidéo 15 min, collaborativement sous-titrée en Français)
- ↑ http://www.smos.gov.au/media/2011/mr_072011.html
- ↑ (en) « GR: Free geospatial data available online at geodata.gov.gr », sur epractice.eu
- ↑ « Wikitalia ovvero la partecipazione civica dopo e oltre i referendum », Libertiamo, (lire en ligne)
- ↑ New Zealand Government initiative to publish Government Data under Creative Commons licences, defined further at NZ GOAL
- ↑ (en) « Catalogues », sur opengovernmentdata.org
- ↑ « À propos du portail Open Government Data de la Confédération suisse », sur opendata.admin.ch
- ↑ Émilien Ercolani, Open data : pas si simple ! L'informaticien, no 91, mai 2011, page 29.
- ↑ http://www.lemonde.fr/sciences/article/2013/07/15/pour-une-recherche-reproductible-publiez-vos-codes-et-donnees_3447825_1650684.html
- ↑ (en) David Wood, Linking Government Data, (ISBN 978-1461417668), p6, The Linked Open Data cloud has grown from about 40 million triples representing four data sets in 2007 to 203 data sets (qualified from the 215 submitted) consiting of over 25 billion RDF triples and 395 million RDF links, as of the end of 2010.
- ↑ [PDF] Licence ODC PDDL
- ↑ Licence ODC by : http://www.opendatacommons.org/licenses/by/1.0/
- ↑ Licence ODC ODbl
- ↑ Voir Mike Linksvayer, « CC and data[bases]: huge in 2011, what you can do », « https://creativecommons.org/weblog/entry/26283 » (Archive • Wikiwix • Archive.is • Google • Que faire ?), consulté le 2013-08-16
- ↑ À titre d'exemple, le droit moral de l'auteur ou encore la nullité des clauses abusives
- ↑ Carte de France des initiatives d'ouverture de données publiques
- ↑ http://www.rip.justice.fr/information_publique_librement_reutilisable
- ↑ http://www.rip.justice.fr/ ; licence conçue par Thomas Saint Aubain
- ↑ "Free our data" (The Guardian section technologie)
- ↑ http://linkedscience.org/about
- ↑ Linking Open Data on the Semantic Web
Voir aussi
Bibliographie
- CARMES Maryse, NOYER Jean-Max. Le mouvement « Open Data » dans la grande transformation des intelligences collectives et face à la question des écritures, du web sémantique et des ontologies, 2012, p. 2-3
- Romain Lacombe, Pierre-Henri Bertin, François Vauglin et Alice Vieillefosse, Pour une politique ambitieuse des données publiques, La Documentation française, (lire en ligne)
- Simon Chignard, L'open data, comprendre l’ouverture des données publiques, Fyp Éditions,
Articles connexes
- Licence libre
- Licence Creative Commons
- Science Commons
- Licence information publique librement réutilisable
- Directive 2003/98/CE
- Culture libre
- Logiciel libre
- Web sémantique
- Données ouvertes en France
- Le Web des données qui utilisent, entre autres, les standards:
Liens externes
- (en) Open Data Commons - outils légaux pour les données ouvertes
- ville-data.com - site Français réunissant une grande partie des données disponibles.
- Participation et rédaction d'une proposition de loi : Open data : libérer les données publiques
Vidéographie
- Courte présentation de l'Open data (Yann Bresson)
- [vidéo] Courte présentation des données ouvertes (par l'association nantaise LiberTIC)
- [vidéo] (en) Courte présentation du Linked Open Data, c'est-à-dire en français les données ouvertes liées ou les données ouvertes au sein du Web des données (par l'Europeana Linked Open Data ; LOD).
- [vidéo] (en) #opendata - film court sur les données ouvertes gouvernementales de l'Open Knowledge Foundation (sous-titrée en français)
- [vidéo] (en) Vidéo de Tim Berners-Lee à TED (conférence) 2009 demandant des "données brutes, et maintenant" (sous-titrée en français)
- [vidéo] (en) Vidéo de 6 minutes de Tim Berners-Lee à TED (conférence) 2010 montrant des exemples de données ouvertes (sous-titrée en français)
- Portail de l’informatique