Le blog francophone consacré
aux technologies Esri

ArcGIS et Open Data, du nouveau très bientôt (1/2)

La semaine dernière avait lieu la FedGIS Conference, la conférence annuelle d'Esri dédiée aux structures fédérales Américaines. Après l'intégration, mi 2012, de la technologie Open Source de GeoIQ, ce fut l'occasion pour Esri de faire le point sur sa stratégie pour répondre aux attentes des organisations souhaitant mettre en place des plateformes Open Data. Je prends donc le temps de 2 articles pour revenir sur le sujet.   



Vous avez dit Open Data ?


La localisation géographique de l'information offre un contexte commun à travers lequel nous pouvons comparer différents types de données et comprendre les relations entre ces données et les phénomènes qu'elles révèlent. Les organismes publics et les entreprises ayant des missions de service public collectent de nombreuses données pour exercer leurs missions et réaliser leurs opérations. Cependant, l'usage de ces données est souvent limité au périmètre d'application et utilisateurs définis par l'organisation qui les possède. On passe donc potentiellement à coté d'opportunités intéressantes de démultiplier les usages et d'innover autour de ces données, avec de nouvelles analyses, de nouveaux croisements d'information et de nouvelles applications. En les ouvrant l'accès à ces données au plus grand nombre et en autorisant plus largement leur réutilisation, on entre dans un cercle vertueux dans lequel les données ouvertes (Open Data) apportent de nouveaux services aux citoyens, permet le développement de nouvelles activités économiques et conduit à plus de démocratie.

Une démarche qui s'accélère

Depuis quelques années, en France, l'ouverture des données est une réalité (voir cette brève histoire de l'Open Data) http://www.paristechreview.com/2013/03/29/origines-open-data/ et un certain nombre de projets connaissent un succès confirmé parfois même au delà de nos frontières (voir ce récent article de TechCrunch). Que ce soit au niveau de l'état avec le portail data.gouv.fr, dans les collectivités territoriales (Rennes, Paris, Lyon, Loir-et-Cher, Saône-et-Loire, Région PACA, Région Nord-Pas-de-Calais, Région Ile-de-France, …) ou dans certains établissements publics (INSEE, SNCF, RFF, RATP, La Poste, IGN, BRGM, SHOM, Météo France, …), les exemples sont désormais nombreux. 

Ci-dessous, une carte des plateformes Open Data de collectivités territoriales déjà ouverts (les données sont issues du site OpenData-Map de LiberTIC).



Des nuances et des interrogations

L'expérience de ces premières années a rapidement permis de poser les principes et les modèles, développés par la communauté, clarifiant les caractéristiques attendues d'une donnée ouverte. On pourra se référer aux principes édictés dès 2007 puis complétés en 2010 par le Sunlight Foundation dans ce document. Ces principes indiquent, notamment, que pour mériter l'appellation de données ouvertes, ces dernières doivent être: complètes, fraîches, accessibles numériquement, respecter des standards ouverts, disponibles sous une licence claire, accessibles de façon pérenne ou encore gratuites.

Aujourd'hui, les plateformes déployées en France respectent pour l'essentiel ces principes. On peut parfois regretter les choix dans les priorités et la pertinence des données diffusées. On doit aussi s'interroger sur l'aspect peu ambitieux de la démarche Open Data de certains organismes qui possèdent pourtant de nombreuses données valorisables auprès du plus grand nombre. On pourra également remarquer que pour ce qui concernes les données à caractère géographique (une part non négligeable des données ouvertes aujourd'hui), elles sont souvent présentées comme des données tabulaires classiques et assez peu valorisées sur les plateformes de diffusion.

Toujours est-il que suivre ces principes et diffuser une partie de ses données en Open Data constitue, dans bien des cas, un véritable défi. Au delà de la volonté politique ou de l'enthousiasme de valoriser son savoir-faire en ouvrant ses données, différentes éléments peuvent freiner votre projet Open Data.

Tout d'abord, des questions se posent sur les données:
  • Quelles sont les données qui ont de l'intérêt ?
  • Comment prioriser leur diffusion ? 
  • Est-ce que mes données sont de qualité suffisante pour être rendues publique ? 
  • Est-ce que leur structure actuelle permet un usage par le plus grand nombre ? 
  • Quel type de licence choisir et quels formats proposés ?
  • Quels processus de transformation et de conversion mettre en place pour fournir des formats ouverts ? 
  • Comment s'intègre dans le cycle de production de données de mon SI (SIG) ? 
  • ...
Des questions se posent également sur l'infrastructure de diffusion:
  • Est-ce que mon site web grand public peut intégrer les fonctions nécessaires à la diffusion de données ouvertes (catalogage, recherche, filtrage, visualisation, téléchargement, commentaires, notification,…) ?
  • Dois-je créer une plateforme de diffusion dédiée à ma démarche Open Data ? 
  • Est-ce qu'une même plateforme peut répondre à mes besoins de partage privés et publics ? 
  • Comment une même donnée peut-elle être diffusée dans des formats grand-public et professionnels sans être dupliquée ?
  • Dois-je héberger ma plateforme dans mon infrastrucutre ou la déployer dans une infrastructure sur le Cloud ?
  • ...
Des question se posent enfin sur les coûts:
  • Comment estimer le surcoût du travail de préparation de mes données ouvertes ?
  • Quelles ressources utiliser en interne pour assurer la vie de mon programme Open Data ?
  • Combien va me coûter ma plateforme de diffusion Open Data ?
  • Comment partager ces coûts avec des partenaires, qui peut participer à ma démarche ?
  • Quel budget prévoir pour communiquer sur la démarche et valoriser mes données ouvertes ?
  • Comment calculer un ROI sur une telle initiative ?
  • ...
Certaines de ces questions sont loin d'être réglées, y compris pour les organisations ayant déjà déployé leur plateformes. Des points importants restent à solutionner, notamment dans le domaine des données géographiques, pour trouver l'articulation la plus efficiente et la moins coûteuse entre le Système d'Information Géographique et la plateforme Open Data. 


De nouvelles solutions pour les utilisateurs ArcGIS


Chez Esri, l'expérience en gestion de base de données (spatiales ou non) couplée à celle des plateformes et des portails géospatiaux font que l'on est au coeur de ces problématiques depuis déjà plusieurs années. Au delà de la plateforme ArcGIS Online, qui en soit peut constituer un socle pour une infrastructure Open Data (voir l'exemple du portail OpenGeoData.fr), de nouvelles solutions dédiées à la diffusion de données ouvertes vont très bientôt être disponibles. 

Pour prendre le temps de détailler tout cela, je vous donne rendez-vous dans un second article dès demain.


Partager cet article:

Rejoindre la discussion

    Les commentaires à propos de cet article: