La codification de l’Open Data, un catalyseur pour les transports ?

Article du 10 octobre 2016
Tranposrts

Si on peut faire remonter les liens entre données et droit d’accès aux informations publiques à l’article XV de la Déclaration des Droits de l’Homme et du Citoyen de 1789 (« La Société a le droit de demander compte à tout Agent public de son administration »), l’ouverture des données dans le secteur du transport est un phénomène plutôt récent qui a fait l’objet de l’attention des pouvoirs publics ces dernières années. Le 12 mars 2015, Francis Jutand, directeur scientifique de l’Institut Mines-Telecom, remet au gouvernement une série de recommandations (le « rapport Jutand ») en faveur de l’ouverture des données de transport. Certaines sont reprises dans la loi dite « Macron » [1], promulguée le 7 août 2015. Plus d’un an après, ces textes ont-ils contribué à accélérer l’ouverture du secteur des transports à l’Open Data ?

Des initiatives vraiment « Open » ?

Si une étude universitaire de 2013[2] dénonçait le retard d’une grande métropole comme Paris, par rapport à d’autres grandes villes dans le monde, les grands acteurs privés ou publics du secteur des transports ont tous lancé ces derniers mois des initiatives Open Data pour combler ce retard. Le STIF en particulier (Syndicat des Transports d’Île de France) a mis en ligne sur son portail plusieurs dizaines de jeux de données, l’objectif étant d’unifier toutes les données éparses produites par les différents opérateurs de transport de la région et de proposer des services dynamiques tels que la recherche d’itinéraires.

Ce mouvement répond clairement à une demande provenant à la fois des citoyens et des acteurs du monde du numérique. Avec la démocratisation des smartphones et le développement de milliers de nouvelles applications, les usagers des transports sont en attente de nouveaux services et d’infos en temps réel, de la part d’acteurs traditionnels comme la SNCF ou la RATP ou de nouveaux entrants. Et leur exigence de qualité de service est toujours plus grande. La demande d’ouverture des données de transport est relayée par tout un écosystème numérique (développeurs, start-ups, data scientists, grandes entreprises du numérique …) qui souhaitent se positionner sur les défis de la nouvelle mobilité.

Les pouvoirs publics locaux y voient aussi des avantages pour développer des innovations au service des habitants, améliorer les services publics et encourager leurs écosystèmes d’entreprises locales du numérique. Certaines collectivités commencent ainsi à insérer de nouvelles dispositions contractuelles relatives aux partenariats sur le sujet data dans les contrats de concession ou de délégation.

Le nouveau cadre législatif s’inscrit dans cette logique de la « shared city », en visant à faire profiter la société des bénéfices de l’ouverture des données. Selon l’article L 1115-1 du Code des transports, issu de la loi Macron, les « services réguliers de transport public de personnes et des services de mobilité » sont en effet tenus de diffuser « librement, immédiatement et gratuitement » ces informations en vue d’informer les usagers et de fournir le meilleur service. Le même article les oblige à diffuser par voie électronique ces informations « dans un format ouvert » destiné à permettre « leur réutilisation ». Cette obligation s’impose aux exploitants des services de transports et de mobilité et, le cas échéant, aux autorités organisatrices de transport.

Du côté des acteurs privés, plusieurs transporteurs ont ouvert des plateformes Open Data ces dernières années. Transdev fait figure de pionnière avec son partenariat avec la ville de Rennes. Dès 2010, les deux acteurs font de la capitale Bretonne la 1ère ville française à ouvrir ses données de transport public. La SNCF propose désormais 78 jeux de données sur sa plateforme. La RATP, elle, a dévoilé sa plateforme en 2013. 20 Jeux sont présents aujourd’hui. La plupart de ces données sont toutefois des données dites statiques, c’est-à-dire des données géolocalisées (arrêts, réseaux, emplacements, etc.), statistiques (nombre de voyageurs) ou descriptives (tarifs, produits, horaires théoriques, etc.).

ratp

Alors que les horaires en temps réel font partie des services les plus plébiscités par les utilisateurs des données de mobilité, ces dernières sont pour l’instant en majorité absentes des jeux de données des plateformes. La RATP annonce leur mise à disposition fin 2016. A la SNCF, elles sont disponibles sur l’API[3] développée par le groupe pour les développeurs tiers. Via l’API, les développeurs ont un accès gratuit aux données dans la limite d’un seuil maximal de requêtes possibles (90.000 requêtes par mois et 3000 requêtes journalières)[4].

Les dispositions de la loi Macron sont donc – à première vue – plus ambitieuses que ce que proposent actuellement les transporteurs. La RATP et la SNCF défendent plutôt un modèle freemium (un accès gratuit mais restreint pour les petits développeurs, puis une base payante pour les grandes entreprises). Certains acteurs utilisateurs de la donnée dénoncent ce positionnement. Une polémique a même éclaté en avril dernier entre la RATP et Citymapper[5], qui a lancé une pétition sur internet réclamant à la RATP de lui livrer gratuitement ses données de trafic en temps réel.

Atlante avait déjà évoqué cette polémique et le débat autour de la valeur de la donnée et du modèle économique associé dans son article « Un Open Data à péage pour une donnée de service public ? » le 16 mai dernier.

Un cadre juridique qui cherche l’équilibre entre besoins d’ouverture et de protection

On le voit donc tous les acteurs du secteur n’adhèrent pas à l’ouverture complète et gratuite des données de transport, malgré l’affirmation de ces principes dans la loi Macron et les demandes répétées des acteurs utilisateurs de la donnée. En réalité, le cadre juridique actuel prend en compte les réticences des producteurs de données de transport et leur laisse un degré de flexibilité dans les modalités de mise à disposition de leurs données.

Pourquoi autant de précautions des transporteurs français vis-à-vis de l’Open Data ? La première explication réside dans la valeur que revêt la donnée. Comme l’indique le député PS Gilles Savary, « il n’y a pas de raison, si ces données ont de la valeur, qu’elles dépossèdent l’entreprise qui les produit et qui est obligée de les rendre publiques ». C’est la position défendue par la SNCF dont le directeur du numérique expliquait : « D’autres jeux de données, ceux relatifs aux services commerciaux de la SNCF, comme les horaires du TGV, ont un coût et une valeur d’usage très importante. Notre position est ferme : ces données doivent avoir un prix »[6]. Certains transporteurs voient dans les utilisateurs de leurs données, développeurs d’applications tels que Citymapper, Waze ou CaptainTrain des « concurrents potentiels en matière d’informations aux voyageurs ». Cette concurrence pousse ces acteurs à mettre à jour leurs propres applications en y intégrant plus de services : temps réel, géolocalisation, système de notification par push, multimodalité, etc. La RATP a ainsi proposé récemment une nouvelle version de sa propre appli, en y intégrant outre la géolocalisation, les prochains passages en temps réel des bus, trams, métros et RER mais aussi la disponibilité en temps réel des Vélib et Autolib et un système de guidage piéton.

La deuxième raison repose dans le risque concurrentiel de la part d’acteurs étrangers puissants et déjà bien implantés. Ni le gouvernement, ni les transporteurs ne souhaitent « une dépendance complète de notre pays à un certain nombre de services gérés par Google, parce qu’il a été le premier à avoir la capacité à les mettre en place et à s’en servir » (Gilles Savary)[7]. Google Maps fait en effet aujourd’hui office pour des millions d’usagers de calculateur d’itinéraire trans-territoire. Dans ces conditions quelle marge pour développer une application « locale » ? Gabriel Plassat, ingénieur à l’Ademe, l’affirme : « Le Grand Lyon a développé Optimod’Lyon, un outil en temps réel, multimodal, mais ils ont du mal à ce que les gens l’utilisent, car Google est déjà opérationnel sur tout le territoire. L’économie de l’attention[8] fait qu’il est quasiment déjà trop tard »[9].

Enfin, pour la RATP, il s’agit également de compenser le coût de mise à disposition de ces données en faisant payer à certains utilisateurs une redevance. La régie affirme en effet investir « plusieurs centaines de milliers d’euros » pour bâtir « une architecture technique » capable de supporter les requêtes des développeurs, y compris celles des « utilisateurs de masse » comme Citymapper. Selon le directeur marketing de la RATP, « le but de cette redevance est, conformément à la loi, de faire supporter aux très gros utilisateurs les coûts engendrés par l’équipement et la mise à jour des données. Notre conviction c’est qu’il n’y a pas de raison pour que cela soit les Franciliens qui supportent le coût de l’ouverture des données temps réels »[10].

Si la RATP évoque la conformité de sa position à la loi, c’est que l’article L 1115-1 du Code des transports a prévu la possibilité de s’affranchir de l’obligation d’ouverture gratuite, libre et immédiate des données par l’adoption de « codes de bonne conduite » homologués par les ministres des Transports et du Numérique. Ces codes peuvent notamment définir « les dérogations au principe de gratuité à l’égard des utilisateurs de masse, justifiées par des coûts significatifs de mise à disposition, sans toutefois que la contribution des utilisateurs puisse excéder ces coûts ».

« Quatre demandes d’homologation ont été déposées et sont en cours d’instruction » a indiqué le secrétaire d’Etat aux transports Alain Vidalies. Parmi celles-ci, une provient de quatre grands opérateurs de transports (Air France, SNCF, RATP, Transdev) qui ont travaillé à un code commun autour des lignes directrices suivantes :

  • « La gratuité est de principe, mais les seuls surcoûts générés par les utilisateurs de masse pourront donner lieu à des redevances, afin de ne pas faire supporter au contribuable les frais des politiques Open Data
  • Les données peuvent être ouvertes sous licence ODbL, afin de garantir que les réutilisateurs jouent bien le jeu de l’Open Data
  • Les engagements sur des délais permettant la mise en place des infrastructures requises pour assurer la continuité du service »[11].

Si l’existence de ce dispositif dérogatoire, non prévu initialement, a suscité de nombreuses critiques de la part d’associations de défense de l’Open Data telles que Regards Citoyens[12], il a également attiré l’attention de la Cour des Comptes[13] qui a regretté en février « la possibilité pour certains producteurs de données « transport » d’échapper aux intentions du législateur par le recours aux protocoles ». Cette intervention de la Cour des comptes a conduit le Premier ministre à s’engager publiquement sur deux sécurités en faveur de l’ouverture des données de transports[14] :

  • L’élaboration par l’Agence française pour l’information multimodale et la billettique (AFIMB) d’une grille d’analyse des protocoles, qui sera rendue publique;
  • La création d’un « observatoire de l’ouverture des données de l’offre de transports ».

Qu’attendre du décret d’application de l’article L 1115-1 et de la loi pour une République numérique ?

Le décret d’application devrait normalement préciser la portée des dispositions en faveur de l’Open Data (personnes, services et données concernés, conditions de diffusion, d’actualisation et réutilisation des données). Mais ces précisions ne sont valables que pour ceux qui n’auraient pas adopté ou adhéré aux « codes, protocoles ou lignes directrices » mentionnés précédemment. Dans la mesure où on peut s’attendre à ce que la majorité des acteurs du secteur adoptent un tel code, le décret d’application, annoncé aux dernières nouvelles pour le 2ème trimestre 2016, n’aura que peu d’impact. Tout au plus pourra-t-il inspirer la rédaction des codes. On observe là une claire prédominance de ce que les juristes appellent le droit « mou » (issu de codes rédigés à l’initiative des entreprises elles-mêmes) face à un droit plus classique issu des textes législatifs et réglementaires.

Il en est de même pour la loi pour une République numérique, adoptée définitivement le 28 septembre, dont les dispositions semblent s’adresser davantage aux autorités concédantes et acteurs publics qu’aux entreprises producteurs de données.

En cas de délégation d’un service public (ce qui est le cas dans le domaine des transports), le concessionnaire devra par principe fournir aux pouvoirs publics « les données et les bases de données collectées ou produites à l’occasion de l’exploitation du service public faisant l’objet du contrat et qui sont indispensables à son exécution » – et ce « sous format électronique, dans un standard ouvert librement réutilisable et exploitable par un système de traitement automatisé », conformément aux principes de l’Open Data. L’autorité concédante pourra librement extraire et exploiter tout ou partie de ces données et bases de données, « notamment en vue de leur mise à disposition à titre gratuit à des fins de réutilisation à titre gratuit ou onéreux ». Pour échapper à ces contraintes, l’acteur public concédant devra se justifier par « des motifs d’intérêt général », et rendre sa décision publique.

Ces nouvelles clauses d’Open Data ne vaudront que pour les contrats conclus à compter de l’entrée en vigueur de la loi Lemaire. On peut donc s’attendre à ce que cette loi renforce la tendance d’ores et déjà observée et citée en début d’article d’intégration de clauses concernant le partage des données dans les contrats de concession.

Une influence limitée du cadre juridique. Des usagers et des usages catalyseurs

L’analyse des textes juridiques et de l’évolution du secteur ces derniers temps tendent donc à montrer que l’ouverture du secteur des transports à l’Open Data, si elle s’accélère, est davantage due à la volonté des opérateurs de transport eux-mêmes (codes de bonne conduite), au droit contractuel (contrats de concession) et aux pressions conjuguées des entités utilisatrices de données et des usagers, qu’à la législation en elle-même.

Cette accélération devrait se poursuivre, les développements et débouchés des données de transport semblant inépuisables. Selon le directeur d’OpenDataSoft[15], en matière de transport, une grande partie du potentiel de l’Open Data reste encore largement à exploiter : « Entre les données des parcmètres, des parkings en plein air ou encore des feux de circulation, pourvus de capteurs mais dont les données ne sont pas libérées, il y a de quoi faire pour les entreprises qui souhaitent développer des solutions intelligentes et de grands projets d’urbanisme ». Le développement de la voiture autonome devrait également attiser les besoins : cette technologie (à laquelle Atlante a déjà consacré en article) requiert en effet une compréhension fine des villes et donc des données et des algorithmes à la pointe.

sncf

***

[1] loi n° 2015-990 du 6 août 2015 pour la croissance, l’activité et l’égalité des chances économiques

[2] Catherine Bouteiller, Sybille Berjoan. OPEN DATA EN TRANSPORT URBAIN : QUELLES SONT LES DONNEES MISES A DISPOSITION ? QUELS SONT LES STRATEGIES DES AUTORITES ORGANISATRICES ?. 2013.

[3] Une API est une Interface de programmation d’applications. Elle a pour objet de faciliter le travail d’un programmeur en lui fournissant les outils de base nécessaires à tout travail.

[4] Source : http://www.zdnet.fr/actualites/open-data-la-sncf-revoit-sa-politique-en-moins-bien-39820850.htm

[5] Application gratuite, Citymapper permet aux utilisateurs de comparer ou agréger différents modes de déplacement pour optimiser leurs trajets (transports en commun, Velib’, Uber, etc). Lancée à Londres en 2011, elle vient de réaliser en janvier dernier une levée de fonds de 40 millions de dollars. L’application fonctionne dans une trentaine de villes dans le monde, dont Lyon en France, sur un principe d’Open Data, fourni gratuitement par les acteurs du transport.

[6] Source : http://business.lesechos.fr/directions-numeriques/la-sncf-s-oppose-aux-deputes-sur-la-gratuite-des-donnees-111968.php

[7] Source : http://www.nextinpact.com/news/96310-comment-gouvernement-a-recule-sur-mise-en-open-data-donnees-transport.htm

[8] L’économie de l’attention désigne une nouvelle branche des sciences économiques et de gestion qui part du principe que, pour les marchés dans lesquels l’offre est abondante (et donc économiquement dévalorisée), la ressource rare devient le temps et l’attention des consommateurs. Dans ce contexte, le niveau d’attention dont bénéficie un objet est une source de valorisation.

[9] Source : http://www.lagazettedescommunes.com/437557/google-fournisseur-officiel-de-services-publics/

[10] Source : http://www.journaldunet.com/economie/transport/1176563-ratp-open-data/

[11] Source : Vrai/Faux publié le 11 avril par la RATP sous forme d’un article intitulé « Open Data : la RATP et la question des données de transport en temps réel »

[12] Celle-ci considérant que « si l’objectif d’Emmanuel Macron était d’avoir recours à un code de conduite, il n’avait pas besoin de passer par une phase législative et une discussion au Parlement. La vérité sur ce dossier, c’est que le ministre de l’Économie et le rapporteur à l’Assemblée ont plié face au lobbying intensif des anti-Open Data du transport. »

[13] Référé S 2016-0109, portant sur « l’action de l’État pour le développement des transports intelligents », 19 février 2016

[14] Courrier du Premier ministre au Premier président de la Cour des comptes le 26 avril 2016

[15] Entreprise française facilitant l’ouverture des données de transports grâce à une plateforme dédiée aux entrepreneurs qui veulent développer de nouveaux services intelligents