Open data : à qui cela coûte, à qui cela rapporte ?

Publié le par dan29000

opendata-1-.jpgOpen data : à qui ça coûte, à qui ça rapporte? (suite et fin)

 

Lors d'un atelier «Brest en biens communs » en octobre 2011, la mairie de Brest a présenté son projet d'open data. Un exemple cité était la fourniture des plans de ville, gratuitement, ce qui permettrait à une société X de développer une application qui donnerait en temps réel des informations sur la circulation et permettrait aux automobilistes d'éviter les bouchons. En réalité «donner» n'est pas le bon terme, «vendre» serait plus exact, car pour l'automobiliste ce serait un abonnement payant. L'argument pour la gratuité est de dire que la donnée existe, a déjà été payée par les impôts, la société X n'a donc pas à la repayer. Cela suppose que sa mise à disposition ne nécessite aucun travail. Or la mise à disposition de ces données est un service à part entière, qui coûte : analyse technique, juridique, création du site, serveur, plate-forme d'indexation et de recherche des données, licences ou développement des logiciels, préparation des données et leur mise à jour, sans oublier les cabinets-conseils habituels. Par exemple la ville de Montpellier utilise une plate-forme Microsoft, dont la licence ne doit pas être gratuite (non je ne crois plus au Père Noël …).

Rappelons nous : « L’œuvre doit être accessible dans son intégralité pour un prix ne dépassant pas un coût raisonnable de reproduction ». Les données étant mise à disposition gratuitement, la préconisation est évidemment respectée. Mais ne peut-on se poser la question inverse : pourquoi ne fait-on pas payer ce coût de reproduction ? Ce qui représenterait probablement un coût modique. Encore faudrait-il le connaître, or sur aucun des sites open data consulté je n'ai trouvé trace de celui-ci, il y est pourtant souvent question de transparence.

À qui ça peut rapporter ? Clairement aux sociétés qui développeront des applications qu'elle feront payer à partir de données qui ne leur coûteront rien. Un peu comme si quelqu'un vendait de la confiture de mûres qu'il a faite, en utilisant des mûres ramassées par d'autres. Or ce qui est long c'est de ramasser les fruits pas de faire cuire la confiture. Ceci est particulièrement vrai pour les données géolocalisées, c'est à dire des informations liées à des coordonnées : latitude, longitude. Notre terre étant ronde, mine de rien cela complique sérieusement les choses, puisqu'il faut passer d'une position sur un globe à une position sur une carte plane. Il existe différentes méthodes, mais quelque soit la méthode utilisée, c'est du temps de travail, des moyens techniques, des données volumineuses, donc un coût.

La ville de Rennes par exemple propose une même donnée géolocalisée en sept formats différents. Quand le fichier fait 1Mio, ça en fait 7Mio au final d'espace disque occupé, même si le prix de l'octet stocké diminue il n'est pas négligeable, sans compter le travail de conversion, pas toujours simple. Les entreprises ne sont-elles pas capables de faire les conversions dont elles ont besoin?

Concernant plus particulièrement ces données géolocalisées, il s'agit souvent de mettre à disposition des données déjà connues par les habitants, individuellement, mais non exploitables par une entreprise. Par exemple la localisation des arrêts de bus près des écoles, qui ça intéresse ? Vous avez votre enfant qui va à l'école, vous voulez connaître le bus le plus proche, que faites-vous ? Vous demandez à l'instituteur, à la mairie , au voisin et vous avez votre information. La donnée est déjà connue, mais la mettre sous forme d'un fichier exploitable va permettre à des entreprises de développer des applications qu'elle revendront. Vous paierez pour voir sur votre téléphone le plan avec l'arrêt de bus : ça s'appelle le progrès.

Pourquoi pas ? Cela peut déboucher sur de nombreuses applications, gadgets ou véritablement utiles c'est un autre débat, mais la question qui est évacuée c'est celle du qui paie quoi ? Pourquoi ne pas faire participer au financement de la reproduction les entreprises qui en tirent un bénéfice commercial ? Si cette participation est bien calculée, elle ne sera pas dissuasive, et l'entreprise la répercutera sur le prix de vente.

Par ailleurs les salariés qui travaillent sur l'open data sont motivés de participer à des projets innovants techniquement, au service des citoyens. Mais n'oublions pas qu'ils sont fonctionnaires, et qu'au même moment leur salaire a baissé (maintien du brut et hausse des cotisations retraites). Ils sont donc en droit de se poser quelques questions. et qu'en ces temps d'économie budgétaire, le temps qu'ils passent à travailler sur l'open data ils ne le passent pas sur d'autres projets.

Ne soyons pas naïfs, la porte des données ne s'est pas ouverte pour nous citoyens mais pour les entreprises, mais puisque la porte est entrouverte, poussons là, on pourrait y trouver, ou imposer si nécessaire, de quoi effectivement remplir notre rôle de citoyen.

Sinon l'open data risque de n'être qu'une nouvelle version du cheval de Troie. Ou pour le dire autrement une version particulièrement bien habillée de la devise «la dépense pour le public et la recette pour le privé».

-------------------------------------------------------------------------------

Open-data et les formats : ouverts ou propriétaire?

Pour finir une partie un peu plus technique avec ci-dessous les formats utilisés pour les sites consultés et une petite analyse rapide.

Site

formats ouverts

formats propriétaires

Montpellier

csv

ods

xls

kml

shp

Nantes

csv

xls

khz

shp(cc47)

shp(l93)

Paris

csv

ods

txt

xls

shp

 

Rennes

csv

dxf(l93)

dxf(cc48)

dxf(wgs84)

xls

kml

shp(l93)

shp(cc48) (

shp(wgs84)

Les formats ouverts odt, ods sont quasiment inexistants, ce qui est pour le moins surprenant, car les tableaux proposés sont souvent de structure simple, ne comportant pas de macro, et peuvent donc être fournis sans souci en ods. De plus quand ils le sont, ils le sont aussi en xls.

Pour les données géolocalisées pourquoi la présence de la projection wgs84, alors que la loi 99-533 du 25/06/199 impose comme format d'échange le l93 ou ccnn ? Et pourquoi en fournir plusieurs comme le fait la ville de Rennes ?

Les formats kml et shp sont des formats binaires propriétaires (respectivement Google et Esri). Pourquoi ne pas se contenter du dxf(cc48) ?

Je ne suis pas spécialiste et je ne sais pas exactement ce qu'il en est de l'ouverture des formats des données géolocalisées, mais il me semble que la démarche de l'open data pourrait être l'occasion pour les pouvoirs publics d'agir sur l'ouverture des formats, qui me paraît être une condition indispensable à une véritable ouverture des données.


Références :


Rennes http://www.data.rennes-metropole.fr; Nantes :http://data.nantes.fr/; Montpellier : http://opendata.montpelliernumerique.fr/ ; Paris : http://opendata.paris.fr/opendata/jsp/sit/Portal.jsp  Département de la Saône et Loire : http://www.opendata71.fr/ Gironde : http://www.datalocale.fr/


Piyou le 8 janvier 2012


Publié dans écrans

Commenter cet article

Piyou 26/01/2012 22:56


Sur le coût de préparation et de mise en ligne, de par quelques unes de mes expériences professionnelles, je ne pense pas qu'il soit négligeable, encore faudrait-il le connaître, et c'est là où
le bât blesse.

Je n'ai pas proposé de faire payer les étudiants, chercheurs et amateurs, mais les sociétés qui en tireront profit.

Quant à l'idée que les cabinets-conseils ne sont appelés que quand on a réellement besoin d'eux, c'est une vision très optimiste du fonctionnement des collectivités, qui me parait éloignée de la
réalité.

dan29000 26/01/2012 22:59



Merci pour cette réponse...



Christian Rogel 24/01/2012 14:34


Les deux questions posées sont parfaitement légitimes, mais quelques éléments politiques et techniques permettent, soit de rassurer sur le rapport qualité-coût de l'Open data, soit de montrer que
l'ouverture n'est pas seulement l'utilisation des formats libres.


 


Vision politique : ce sont les citoyens qui ont le droit de savoir quels outils et données utilisent leurs mandants et l'informatique n'est pas une excuse pour introduire plus d'opacité que,
quand on ne pouvait demander que des documents papier.


Il y a ici le prisme bien français de l'administration qui se protège de manière arbitraire et excessive, alors qu'ailleurs, elle se veut clairement au service de tous.


 


En manière de données environnementales, c'est une convention internationale (convention d'Aarhus) qui oblige les administrations à fournir les données en leur possession et sans qu'elles aient
le droit de demander le motif.


Elles sont libres d'obliger les citoyens à venir dans les bureaux pour obtenir les copies sur papier, mais les mettre en ligne apparaît plus futé.


 


Mais, il n'y a pas que l'environnement qui aiguise la curiosité des citoyens du monde, car les données des bus de Brest méritent d'être comparées avec celles de toutes les villes, tout autant
qu'avec les moyens de transport concurrents.


 


Dire que la mise en ligne a un coût est une évidence, mais il ne faut pas exagérer le travail de préparation : les administrations utilisent des bases de données internes et la publication
n'amène pas à les refaire, mais seulement à trouver le moyen de les mettre automatiquement sur un serveur.


Ces serveurs ont vocation à se trouver dans des entrepôts de données partagés entre des dizaines d'administrations, ce qui en abaisse alors très fortement le coût.


 


Oui, MicroSoft capte une clientèle avec sa plateforme Azure, mais c'est parce que celle-ci était déjà captive et elle est, apparemment, toujours contente de l'être.  Donc, pas de souci, ils
doivent leur faire un prix. ;-). 


 


Un cabinet-conseil? Seulement, pour les pionniers, car quand la publication sera de l'ordre de la routine et enseignée partout, chaque agent saura ce qu'il a à faire et les données seront
apprêtées en suivant une manière de faire, à partir de la première saisie. 


 


Si des entreprises commerciales en tirent de l'argent, tant mieux pour l'activité globale, mais les premiers utilisateur des données locales et ceux qui en tirent les choses les plus
intelligentes sont les amateurs de programmation à titre de loisir, car, ce sont eux qui se sont emparé des données du Vélib pour des applications sur smartphones gratuites ou très peu onéreuses.


Le moindre péage pour cette catégorie de créatifs les écarterait, sans qu'un modèle économique existe pour toutes ces mini-applications.


Une autre catégorie de gens intéressés sont les étudiants et les chercheurs et, là, aussi, le péage serait bloquant, alors que les administrations ont besoin de ce regard pour s'améliorer.


De toute façon, un faible prix ne servirait, pour l'essentiel, quà rémunérer la chaîne de travail humaine pour contrôler les recettes, comme c'est le cas des bibliothèques.


 


C'est vrai que les formats interopérables ne sont pas la norme, ce qui est toujours surprenant, chez des collectivités sensées aplanir les difficultés des citoyens dans l'accessibilité aux
services.


A leur décharge, les entreprise de logiciel propriétaires savent lâcher du lest et tous les formats de la colonne de gauche peuvent être ouverts avec des applications libres (QuantumGis peut
retraiter shp et kml, par exemple).


 


Offrir plusieurs type de projection est parfaitement justifié, car la France n'est pas une île et imposer le Lambert 93 aux Japonais friserait le ridicule.


Une occasion de rappeler que ce qui se passe à Brest, Montpellier ou Rennes ne concerne pas que leur banlieue, mais le monde entier.


Ce qui ne veut pas dire que toutes les données aient une utilisation mondiale


A l'inverse, les ordinateurs sauront convertir ce format exotique en n'importe lequel des standards internationaux. Un grand bravo à Rennes pour son exceptionnel esprit d'ouverture.


 


En ce qui me concerne, j'attends avec impatience l'ouverture des données géographiques de Quimper Communauté, pour les ajouter aux miennes dans OpenStreetMap et pour que tous ceux qui les
voudront, créent les cartes qui les intéressent. La collectivité et l''Office de tourisme feront des économies et donc, peut-être, moi-aussi.


 


Christian Rogel


Quimper


 

dan29000 24/01/2012 15:45



Merci pour ces précisions, je suis certain que l'auteur pourra vous répondre après lecture dans les jours prochains...Dan29000



Piyou 18/01/2012 23:02


Merci pour la référence à cette étude, je vais aller voir cela.


Piyou

jérémie 18/01/2012 12:03


Bonjour,


 


Juste pour vous signaler qu'en effet le format shape est proprietaire et donc non libre, mais qu'il s'agit d'un format ouvert, car exploitable par des outils en open source comme QGIS.

dan29000 18/01/2012 12:15



Merci pour ces précisions utiles



Olivier Amprimo 18/01/2012 10:02


Bonjour,


Quelques remarques pour completer. Des etudes realisees en Angleterre, pays plus avance que la France sur le sujet montre que:


- L'open data avec son travail sur les standards, les licences et les prix ouvre le marche des donnees publiques aux individus. Ainsi 3 ou 4 ans apres le lancement de l'initiative anglaise, les
individus representent 30% du marche des donnees du service public. Sans open data les donnees collectees par le service public ne sont accessibles qu'aux entreprises qui ont les moyens
techniques de gerer plusieurs formats, juridiques et financiers pour realiser des transactions longues, complexes et couteuses.


- Le calcul du prix de vente est un exercise complique qui est souvent lie a une logique d'incitation / regulation. Il y a plusieurs options: cout marginal, cout nul, cout de revient ou cout
generant un profit. Dans le cas anglais en phase de lancement, une etude technique a recommande le cout marginal. C'est un choix politique, qui a vocation a etre explique et debatu.


- Le terme d'Open Data recouvre des donnees de nature differentes. Cela a des consequences sur la politique de prix pratiquee. Je vous laisse prendre connaissance des pages 9 et 10 de l'etude
precedente.


Cordialement,


Olivier

dan29000 18/01/2012 11:45



Merci pour ces précisions, sans doute l'auteur de l'article aura envie d'apporter sa pierre...