Les données ouvertes promettent beaucoup : transparence, réutilisation, innovation. Dans le domaine des transports, elles sont abondantes, standardisées (GTFS, CSV…) et d’un accès aisé.
En théorie.
Dans la pratique, transformer ces jeux de données en une information réellement utilisable, comme afficher les transports disponibles autour d’un point géographique, soulève de nombreuses difficultés.
Dans ce retour d’expérience, je raconte comment j’ai construit un système exploitant plusieurs sources de données ouvertes sur les transports et, surtout, ce qui a posé problème :
- interfaçage avec Drupal,
- vitesse de récupération des informations,
- données incomplètes ou incohérentes,
- doublons entre réseaux,
- formats et encodages hétérogènes,
- choix à faire entre précision, performance et simplicité,
- et arbitrages techniques loin des architectures idéales.
Nous verrons comment des solutions simples, parfois low-tech, permettent de produire un résultat fiable et performant, sans surenchère technologique.
L’objectif de ce talk est de partager des enseignements concrets pour toute personne souhaitant exploiter des données ouvertes dans un contexte réel.