L’Open Data doit être gratuit pour tous !


Cet article est écrit en réaction à l’annonce du GART qui souhaite imposer une taxation des usages commerciaux des données information voyageurs. Je fais suite à l’excellent article de @schignard dont je recommande la lecture. Il exprime un point de vue équilibré et bien argumenté.

La taxation évoquée par le GART concernerait les applications commerciales utilisant des données mises à disposition par le GART. Une telle disposition vise explicitement les géants de l’Internet (Google, Amazon, Apple) qui pourraient avoir l’outrecuidance d’oser rendre des services utiles avec ces données et en conséquence gagner de l’argent avec.

La position du GART semble relever d’un réflexe rétrograde de contrôle et d’un archaïsme conduisant qu’une application commerciale ne peut pas « produire de bien commun ». Et pourtant…

Pourquoi une application commerciale peut bénéficier au grand public

Je préfère préciser d’emblée que je n’ai pas de lien d’intérêt particulier avec aucun acteur actuel ou potentiel, français ou anglo-saxon, de l’information voyageurs : ni actions ni contrat. En tant que citoyen et comme professionnel, en revanche, je fais partie des réutilisateurs potentiels des applications d’informations voyageurs grâce aux données.

Le GART semble penser ou croire qu’une application à vocation commerciale bénéficie uniquement à son créateur qui engrangerait éventuellement des revenus (s’il a le malheur de développer une bonne application !) « sur le dos » de ceux qui fournissent les données. C’est là ignorer un concept très simple, celui de valeur ajoutée.

Si je reprends des données ouvertes brutes et les mets à disposition sur un site web, je ne gagnerai rien ou presque en publicité, car ma valeur ajoutée est quasi-nulle. La seule valeur ajoutée qu’il pourrait y avoir est celle de diffuser une information identique par un canal supplémentaire, ce qui est généralement considéré comme une faible valeur ajoutée sur Internet. La preuve ? Google accorde peut ou pas de valeur de référencement aux données dupliquées !

En revanche si j’utilise et / ou analyse et les produit sous une forme plus ordonnée, avec une visualisation spécifique, etc… je peux intéresser des utilisateurs qui n’avaient pas intérêt à exploiter directement les données brutes. La localisation des stations de transports publics (bus, métro, tramway, train, vélos en libre-service) sur une carte contenant d’autres informations, type Google Maps ou Bing Maps, et pouvant être elle-même réutilisée, cela peut intéresser de nombreuses personnes, qui seront contentes de les visualiser sous cette forme. Encore parle-t-on d’une donnée très basique, mais néanmoins très utile si elle est correctement exploitée, puisqu’il devient possible de calculer un itinéraire à pied, vélo, voiture vers une station de bus, avec tous les outils habituels, ceux que je connais et utilise spontanément, et non des outils dédiés spécifiques.

Dans ces conditions même une application commerciale qui contient de la publicité, peut avoir une valeur positive pour la société dans son ensemble. Ce système est admis jusque sur la télévision publique qui diffuse de la publicité pour compléter son financement publique. Car même s’il y a publicité, tout le monde, du plus pauvre au plus riche, peut accéder au programme.

Commercial vs gratuit

Le GART met en avant qu’il veut favoriser les applications n’ayant pas d’objet commercial. Ils n’ont pas dit gratuit, qui serait plutôt le point de vue du consommateur. Je valorise des applications développées par la communauté, avec du code open-source, de la réutilisation possible, une libre diffusion. C’est une composante essentielle de l’Open Data qui apporte de nombreux bienfaits collectifs.

Mais cela doit-il exclure les applications commerciales ? Ou bien faut-il traiter différemment ces applications ? Si ce débat a animé (et anime encore) la communauté open-source, il s’agit malgré tout d’une dialectique largement dépassée, comme le démontrent les (nombreux) exemples de collaboration entre open-source et projets à vocation commerciale. Outre les projets commerciaux qui ont pu être rendus Open-Source (ex : le langage JAVA a été placé pour l’essentiel sous licence Open-Source par Sun Microsystems) ou les projets Open-Source développés avec le soutien (technique et financier) d’industriels, certains projets de nature commerciale ont pu être intégralement développés en open-Source. C’est le cas de l’OS Android, développé par Google pour l’essentiel sous une licence Open-Source, ce qui implique : libre diffusion / réutilisation (notamment par les constructeurs de smartphones), grande liberté de modifications de l’OS (y compris au niveau du code source) par ces mêmes constructeurs ou par des tiers pour tout type d’applications.

Pour l’Open Data il devrait en aller de même il me semble, et les applications commerciales pouvoir coexister avec des applications « gratuites », mieux encore Open Source, aux mêmes conditions d’exploitation des données.

Les applications non commerciales sont importantes lorsqu’il s’agit de répondre à des besoins de niche (applications ayant une forte valeur pour un nombre limité de personnes), pour contribuer à des connaissances générales accessibles au plus grand nombre et pour permettre un empowerment des citoyens en permettant l’exploitation des données brutes pour contrôler l’action des pouvoirs publics et donner aux citoyens l’information dont ils ont besoin pour effectuer des choix plus libres. J’évoquais ces questions dans un article précédent sur les évolutions souhaitables de Via Navigo et du STIF vers davantage d’Open Data.

Les applications non commerciales bénéficient d’une bonne viralité car portées par une communauté et entièrement gratuites, mais peuvent être limitées par le manque de moyens techniques et commerciaux pour la soutenir. Dans d’autres cas les applications non commerciales peuvent être plus puissantes que des applications commerciales pour aggréger et analyser de larges quantités de connaissances à moindre coût (c’est le cas de Wikipedia, davantage consulté et fiable que Britannica).

Les applications commerciales en revanche peuvent présenter de l’intérêt si de gros investissements techniques sont nécessaires dans l’infrastructure (ex : Google Maps, iTunes / Vimeo). C’est d’ailleurs ce qui limite quelque peu Wikipedia, qui gèrent surtout des textes et images : étant le sixième site le plus consulté au monde, son infrastructure coûte cher et le modèle pure fondation peut présenter des difficultés de pérennité.

Ainsi le fait que les différents types de modèles puissent coexister dans des conditions équivalentes d’accès aux données est utile non seulement pour l’augmentation de la diversité de l’offre, mais surtout parce que tous ces modèles peuvent se croiser et se fertiliser les uns les autres. Par conséquent je plaide pour l’unicité des modalités de mise à disposition des données pour tous, gage de simplicité et d’ouverture à de nouveaux modèles n’existant pas encore.

Pourquoi les développements tiers peuvent avoir plus de valeur que ceux faits en propre par la collectivité

L’un des piliers de l’Open Data il me semble, c’est l’idée que ce ne sont pas toujours les acteurs publics qui sont les plus pertinents pour développer des applications innovantes, explorer de nouveaux usages. Les acteurs publics sont pertinents lorsqu’un concept est mûr et représente un bien commun. À cet égard Via Navigo est un bon exemple. Pendant des années ce sont les sites des transporteurs qui fournissaient de l’information de qualité en Ile de France, les sites du STIF étant peu utilisées, de mauvaise qualité, distancés sur les usages. Il a fallu attendre 2011 pour une première version de Via Navigo intéressante pour les usagers, et c’est la dernière version qui a réellement une valeur ajoutée. C’est parce que le concept d’information voyageurs multimodale est devenu mainstream et qu’il y a désormais une valeur dans la mutualisation des ressources par un organisme public pour produire une application de plus grande qualité et gratuite au service des citoyens.

La problématique de la taxation

Le problème soulevé par le GART est mal posé. En effet s’il s’agit de faire contribuer Google & Co à la valeur qu’ils créent à partir des données ouvertes, il existe déjà une taxe, c’est la TVA. Il existe aussi un impôt sur les sociétés qui taxe plus généralement les bénéfices d’une société. Ces taxations sont prévues pour faire revenir à la collectivité une partie de la valeur créée par les activités commerciales et qui utilise de fait des biens collectifs mis à disposition de tous : l’Etat de droit, la sécurité, les infrastructures de toute sorte, et pourquoi aussi des données publiques logiquement.

Donc le vrai problème en matière de taxation, c’est éventuellement le fait qu’un certain nombre d’acteurs, principalement anglo-saxons, ne paient quasiment pas de TVA et d’impôt sur les sociétés sur les activités en France à cause d’un cadre législatif inadapté. Il y a donc un vrai sujet, plus général. Mais créer une usine à gaz pour traiter une micro-partie d’un problème qui nécessite une solution globale, ce serait inefficient.

La problématique de la taxation est double : ces acteurs anglo-saxons ne contribuent pas en France, ce qui est dommageable pour les services publics dont ils bénéficient et qu’ils devraient contribuer à financer. Mais ils bénéficient aussi d’un avantage compétitif artificiel parce que leur taux d’imposition est plus faible que leurs concurrents, notamment européen et surtout français.

Conséquences prévisibles de la position du GART

Si la position du GART était suivie en l’état par un nombre significatif d’AOT (Autorités Organisatrices des Transports), plusieurs effets pervers sont prévisibles.

D’un côté, les grands groupes ne seraient pas tant que cela impactés par une telle mesure. Ils pourraient payer pour les données si elles leur apportent beaucoup de valeur et le faire payer in fine au consommateur d’une façon ou d’une autre. D’ailleurs si la taxe porte exclusivement sur la publicité associée à l’usage de ces données il leur suffirait… de ne pas utiliser de publicité mais de se rémunérer d’une autre manière ! Ou bien de mettre en place un autre dispositif de contournement. En revanche ces grands groupes ne seraient pas incités à exploiter les données ayant une certaine valeur pour le grand public mais difficile à transformer commercialement (par exemple des données qui intéressent les populations les moins fortunées). Quelle terrible inégalité si Google Maps intégrait les informations voyageurs de Paris et du 92, mais pas du 93 et du 94 !

Les principaux bénéficiaires d’une telle mesure, ceux qui ne s’en plaindront, voire qui l’ont peut-être instillé ou soufflé  au GART, ce sont les grands groupes gestionnaires de réseaux de transport : SNCF, RATP, Veolia Transdev, etc… Car ces groupes accèdent déjà à des données et les utilisent, et ils voient d’un mauvais œil l’arrivée de nouveaux acteurs qui pourraient venir les concurrencer et établir un contact avec les usagers, donc potentiellement prendre position pour une future concurrence d’offres.

Enfin tous les innovateurs et les entrepreneurs seraient les grands perdants d’une telle mesure. En effet pour explorer de nouveaux usages, il faut être agile mais surtout accepter l’erreur. Les entrepreneurs ont souvent ces caractéristiques : ils peuvent rapidement tester de nouveaux usages et ils se trompent souvent ;-) Encore faut-il que le coût de l’erreur soit supportable. S’ils doivent payer systématiquement l’accès aux données, ils auront moins le droit à l’erreur et seront moins agiles car devront réfléchir à deux fois avant de lancer une nouvelle application qui pourrait consommer de la donnée, donc du cash. Même si la taxe porte sur les recettes publicitaires, une start-up a besoin d’économiser sa trésorerie. Pour une même application, un grand groupe peut dépenser 100 k€ quand une start-up dépensera 20 k€. Pour le grand groupe payer 10 k€ d’accès aux données, ce la ne comptera pas beaucoup, pour la start-up cela sera rédhibitoire.

Le résultat général sera de ralentir l’innovation dans les usages des données et même la possibilité pour des entités n’ayant pas de vocation commerciale d’accéder et de réutiliser des données déjà formatées et travaillées. Combien d’association et d’organismes à but non lucratif utilisent aujourd’hui Google Maps, en général gratuitement, sans avoir besoin de mettre en place de coûteux SIG (Systèmes d’Information Géographiques) ? L’accès au données brutes n’est pas suffisant, il faut que des services intermédiaires variés (pas seulement ceux proposés et contrôlés par l’AOT) permettent d’utiliser ces données rapidement et à moindre frais, pour des usages dérivés.

Ce que nous apprend la position du GART

Nos dirigeants peinent toujours à comprendre l’intérêt de l’Open Data pour la société, et quand ils le comprennent ils semblent craindre les effets possibles de cette ouverture, effets qu’ils craignent de ne pas contrôler (d’où la tentation de proposer uniquement des services exploitant ces données – qui ont aussi leur utilité par ailleurs). Je détaillais dans un article précédent quelques intérêts de l’ouverture de ces données publiques pour les citoyens qui pourraient ne pas satisfaire nos dirigeants : qualité de service des transporteurs, qualité de service et disponibilité des transports en fonction de la zone géographique exacte, etc…

Le second enseignement c’est que nos dirigeants, pour conserver le contrôle, préfèrent dépenser l’argent public de manière hasardeuse plutôt que laisser faire des acteurs privés à vocation commerciale ou non. Plutôt que de fournir un cadre souple à l’utilisation des données qui permette d’éviter tout effet pervers, la collectivité va investir dans le développement de services de mise à disposition des données, qui coûteront cher en études amont, développement, hébergement et exploitation, redéfinition. Ces services seront inadaptés car nous ne savons pas exactement aujourd’hui ce dont nous avons besoin. Surtout chaque AOT, qui couvre souvent une population de moins de 500 000 habitants, va répéter ces coûts, qui sont particulièrement élevés en phase d’innovation car la connaissance et l’expertise nécessaires sont imprécises et rares.

Il serait bien plus avisé pour les AOT d’ouvrir les données donc, de réguler lorsque nécessaire, et d’observer les offres qui se développent, les attentes de la population. Au bout de quelques années il serait temps de faire un bilan localement, de profiter de l’expérience sur d’autres territoires, et de déterminer que certains types de services, certains types de données, doivent faire l’objet d’investissements de la part de la collectivité pour s’assurer qu’ils bénéficient au plus grand nombre  si jamais l’offre qui se sera développée n’apportait pas les conditions d’accessibilité. Dans ce cas de figure la collectivité peut développer juste ce qui est nécessaire (première grosse économie) et déployer des solutions standardisées donc peu coûteuses (deuxième économie) avec un faible risque de se tromper sur le besoin des usagers (troisième économie).

Je sais que ce scénario paraît quelque peu utopiste à cause d’un pré-requis d’humilité des responsables politiques et technocratiques, mais en ces temps de disette pour les finances publiques, y réfléchir pourrait permettre d’optimiser l’usage des ressources publiques qui sont en fait nos ressources.

Heureusement il y a d’excellentes initiatives de plusieurs collectivités en France qui vont de l’avant, encore la réutilisation des données et obtiendront des bénéfices à long terme. Car les applications basées sur les données peuvent aussi rendre les transports plus efficients (notamment en améliorant la multimodalité), pour un coût très faible, rapidement. À moyen terme c’est donc aussi l’attractivité économique des territoires qui est en jeu : avant de déménager dans une ville pour un nouveau travail, j’aimerais savoir si je disposerai des informations transport locales sur mes applications de cartographie et de voyages favorites…

About these ads

Une réflexion sur “L’Open Data doit être gratuit pour tous !

  1. Ping: La gratuité de l’Open Data en débat… depuis longtemps déjà! | Innovation & mobilité

Poster un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Connexion à %s