Florian Liscoët : Nous nous retrouvons aujourd’hui, aux RNTP2021, pour une conférence sur le thème de la production de données au service de la LOM et des usages. Pour l’occasion, nous avons le plaisir de recevoir et d’échanger avec l’un de nos clients réutilisateurs, Aurélien Marcon-Blache du réseau Tout’en bus d’Aubenas ainsi que deux membres de l’équipe de transport.data.gouv, Miryad Ali, responsable de l’ouverture des données mobilité et Francis Chabouis, développeur de la plateforme.
Aurélien Marcon-Blache : Zenbus a été déployé en 2019 sur une première ligne test, dans le cadre de l’opération Cœur de Ville. Ce test s’est montré concluant et nous avons décidé de déployer la solution Zenbus sur l’ensemble de notre réseau urbain et scolaire.
F.L : Avec Zenbus, nous sommes en capacité de pousser des données temps-réel et nous souhaitons les rendre accessibles au plus grand nombre de réutilisateurs. Parmi eux, et dans le cadre du réseau Tout’en bus, nous avons travaillé sur un pilote avec Google Maps.
Aurélien, d’où provient la demande de ce pilote ?
A.M-B : Pour l’anecdote, c’est une fonctionnalité que j’avais remarquée sur des réseaux à l’étranger. Partant du principe qu’un utilisateur a forcément Google Maps sur son téléphone, j’ai demandé à Zenbus s’il était possible d’intégrer ces données temps-réel directement sur cette cartographie, pour permettre aux utilisateurs de visualiser leurs bus en temps-réel sans télécharger d’applications supplémentaires.
Après de nombreux allers retours entre nous, l’un de vos chefs de projet et Google Maps, nous sommes heureux d’avoir des données temps-réel sur cette carte mondialement reconnue, pour l’ensemble de nos lignes urbaines.
F.L : Google Maps s’est servi de nos données temps-réel pour afficher la position des bus sur leur carte, afficher le temps estimé d’arrivée aux arrêts (ETA) mais surtout pour faire ce qu’il sait faire aux yeux de tous : du calcul d’itinéraire.
Miryad quel est le rôle de transport.data.gouv ?
Miryad Ali : transport.data.gouv est une plateforme qui a été développée pour pallier le manque de données des transports en commun dans les applications grand public hors métropoles, pour permettre l’intermodalité et pour réunir les jeux de données dans une seule et unique plateforme.
À l’époque, les ré-utilisateurs devaient aller sur chaque portail open data des collectivités pour récupérer les données. Avec cette plateforme toutes les données des transports en commun peuvent être déposées dans des formats spécifiques par type de données.
Nos missions chez transport.data.gouv sont de sensibiliser les producteurs de données et les collectivités sur l’open data, de les accompagner dans l’ouverture des données et de permettre aux réutilisateurs de déployer plus facilement leurs services en agissant comme tiers de confiance entre les producteurs et les réutilisateurs de données.
Ces missions sont encadrées par le Règlement Européen et par la Loi d’Orientation des Mobilités (LOM). L’objectif est que toutes les collectivités ouvrent leurs données sur le Point d’Accès National (PAN) dès lors qu’elles existent, au 1er décembre 2021.
Initialement, le délai d’ouverture des horaires théoriques des transports en commun était fixé au 1er décembre 2019, au 1er décembre 2020 pour les données temps-réel des 8 plus grosses métropoles françaises et au 1er décembre 2021 pour l’ensemble des collectivités.
Pour pouvoir diffuser ces données, nous acceptons 3 formats : le format d’échange SIRI et SIRI Lite avec le profil France et le format GTFS-RT. Contrairement aux deux formats précédents, le format GTFS-RT n’est pas un format autoporteur, il doit être affilié à un format GTFS pour pouvoir être réutilisé.
Actuellement, on retrouve sur transport.data.gouv uniquement des données au format GTFS-RT. Les données au format SIRI arriveront prochainement.
À date, il y a 57 jeux de données GTFS-RT, qui ont été publiés et librement accessibles.(NDLR : dont 39 jeux de données produits et standardisés par Zenbus). Il existe également 19 autres jeux de données pas officiellement référencés, car ce sont des formats ni GTFS-RT, ni SIRI, ni SIRI lite, ou bien, car ils ne sont pas en libre accès.
Pour accéder à ces données, il suffit d’aller sur le site transport.datagouv, de cliquer sur la tuile “temps-réel transports en commun” et vous trouverez l’intégralité des jeux de données officiellement publiées.
transport.data.gouv est une sous-couche de data.gouv. Pour référencer des jeux de données, il suffit d’ouvrir un compte personnel sur data.gouv puis un compte organisation. Dès lors, vous pourrez ajouter un lien pointant vers vos serveurs ou bien vers le portail open data de la collectivité. Un membre de notre équipe fera ensuite la migration entre data.gouv et transport.data.gouv.
Pour les producteurs de données qui appréhendent d’avoir une surcharge sur leurs serveurs à cause de requêtes des réutilisateurs, nous avons mis en place un accompagnement temporaire appelé proxy. Disponible uniquement pour le format GTFS-RT, le proxy permet aux producteurs d’avoir qu’une seule requête de transport.data.gouv sur ses serveurs, qu’importe le nombre de requêtes qu’il y aura sur le flux temps-réel par les réutilisateurs. (NDLR : Zenbus n’utilise pas le proxy de transport.data.gouv. Les ré-utilisateurs requêtent en direct nos serveurs.)
Si vous souhaitez utiliser ce proxy, il suffit d’envoyer une URL par mail qui pointe vers votre jeu de données au format GTFS-RT, notre équipe se chargera de la traduire en URL proxy, qui vous sera ensuite renvoyée pour vous permettre de la référencer sur data.gouv.fr.
Le proxy agit comme une béquille. Il ajoute une étape supplémentaire dans la chaîne de transmission des données soit un délai supplémentaire et se doit d’être temporaire. L’objectif est de s’en passer notamment pour le flux de données temps-réel où les informations doivent être les plus fraîches possibles. Aujourd’hui parmi les 57 jeux de données temps-réel ouverts sur le PAN, seul une dizaine de contributeurs utilisent le proxy.
F.L : Chez transport.data.gouv avez-vous un rôle pédagogique auprès des autorités organisatrices des mobilités, que ce soit auprès des techniciens ou des élus ?
M.A : Concernant le temps-réel des transports en commun, nous sommes moins en relation avec les élus. Cependant, nous contactons parfois les collectivités pour leur demander d’ouvrir leurs données.
Francis Chabouis : Par notre mission de PAN, nous sommes déjà en contact avec un très grand nombre de collectivités et nous avons donc déjà rencontré beaucoup de problématiques différentes. Lorsqu’une collectivité rencontre des blocages politiques ou techniques sur l’ouverture des données, nous sommes en capacité de les accompagner et de les aider à mettre leurs données sur transport.data.gouv. Le proxy étant un accompagnement parmi d’autres.
F.L : Chez Zenbus nous sommes en ordre de marche pour répondre à ces nouveaux enjeux d’open data cependant nous ne poussons pas automatiquement les flux sur le PAN. Nous avons besoin, en amont, de l’autorisation de l’exploitant ou de l’autorité organisatrice. Insistez-vous beaucoup sur l’aspect réglementaire ?
M.A : Nous utilisons ce levier seulement dans le cas de producteurs réfractaires qui refusent catégoriquement d’ouvrir leurs données, ce qui reste très rare.
F.C : Le PAN a été créé en 2017. A l’époque, les échéances d’open data étaient encore lointaines, nous avons donc développé un discours pédagogique basé sur les avantages de l’ouverture des données comme par exemple l’augmentation des usages sur les réseaux de transport, mais non sur l’aspect réglementaire.
Olivier Deschaseaux : Chez Zenbus, la philosophie d’ouverture de données est dans notre ADN. Dès le début de l’aventure en 2013, nous avons participé au concours dataconnexion lancé par Etalab pour lequel nous avons été premier Lauréat.
Nous étions heureux d’avoir reçu ce prix, mais nous nous sommes rapidement rendu compte que la qualité de la donnée disponible n’était pas au rendez-vous pour permettre de créer des services à même de développer des usages.
Nous nous sommes donc intéressés à la donnée en elle-même et à la capacité de l’ouvrir nous-mêmes.
En 2015, nous avons participé pour l’occasion au Comité de débat sur l’ouverture des données relatives à l’offre de transport qui a permis la remise du rapport Jutand et de rentrer dans les détails des articles qui allaient intégrer la LOM.
En 2017, nous avons été ravis de contribuer, dès le début, à l’ouverture des données temps-réel et de continuer à être contributeur actif. Nous souhaitons démystifier l’open data et dire que cela est accessible à tous les réseaux de transport : les petites, les grands, les réguliers, les éphémères, etc. En parallèle, nous mettons un point d’honneur à pousser des données en format GTFS-RT avec une fréquence de rafraîchissement élevée, pour des données de qualité.
Question du public : Il existe des plateformes d’open data régionales. Passez-vous par ces plateformes pour récupérer les flux de données temps-réel ou directement par l’émetteur ?
M.A : Quand les données sont déjà en open data, la région ou la collectivité qui les possède peut mettre le lien qui pointe vers ces données sur le portail transport.data.gouv. On passe donc, à la fois par les producteurs et les collectivités. En revanche, pour le temps-réel, nous avons tendance à passer davantage par les producteurs, car ils peuvent nous lister les collectivités pour lesquelles ils travaillent.
F.C : transport.data.gouv est un catalogue où nous référençons des données existantes, mais nous ne les hébergeons pas nous même. Chaque fichier téléchargé sur notre site provient d’une plateforme open data régionale ou du producteur lui-même, que ce soit pour des données théoriques ou dynamiques. Nous répertorions simplement sur une même plateforme l’ensemble des données qui étaient auparavant éparpillées un peu partout sur internet.
Question du public : En lien avec ce qui se fait en Angleterre avec le projet BODS, avez-vous pour ambition d’unifier et normaliser la source de données GTFS sur l’ensemble du territoire ? Ce qui permettrait d’avoir accès en une seule requête à l’ensemble des flux temps-réel disponibles.
F.C : Les Anglais possèdent un référentiel national des points d’arrêts. Il permet aux producteurs de données d’avoir les mêmes identifiants d’arrêts et donc de faciliter l’agrégation des données.
En France, nous n’avons pas ce type de référentiel et il est très difficile d’agréger des GTFS produits par différents producteurs. En effet, chacun à ses propres identifiants d’arrêts avec ou sans accents, avec une orthographe distincte ou encore des positions géographiques différentes.
Cela reste un sujet qui nous intéresse beaucoup. Il pourrait être réalisable grâce au format SIRI. Ce format est plus complexe que le GTFS-RT et a l’avantage d’avoir une base très solide sur la modélisation du réseau. La Norvège, par exemple, est capable de produire un flux SIRI national en agrégeant tout un tas de flux SIRI.
F.L : Merci à toutes et à tous, merci pour vos interventions et merci pour vos questions !
Retrouvez notre infographie sur la LOM ici ainsi que l’intégralité des questions posées durant l’interview sur notre chaine YouTube.