Fiche pratique

Rendre accessible – open data

Comment rendre accessibles mes données ?

Dans quel but ?

Le partage de  données permet :

  • d’encourager et d’approfondir les débats scientifiques,
  • de mener de nouvelles collaborations entre producteurs de données et réutilisateurs,
  • d’assurer la transparence des recherches,
  • de promouvoir les résultats scientifiques obtenus à partir de ces données en organisant leur citabilité,
  • d’assurer la crédibilité, la fiabilité et la validité, et la reproductibilité des résultats scientifiques obtenus à partir des données.

Dès 2007, le guide de l’OCDE « Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds publics », encourage les chercheurs à partager leurs données et leurs résultats obtenus grâce à des fonds publics.

Il s’agit donc d’un mouvement de fond qui s’est considérablement développé depuis ces quelques années en raison d’une conjonction entre des avancées technologiques importantes et une volonté politique de certains pays ou régions (Europe) de s’engager dans l’ouverture et la réutilisation des données ; les données étant considérées comme un gisement d’innovations potentielles permettant la croissance économique.
En quoi cela consiste ?

L’ouverture des données (open data) est une philosophie visant à rendre des données numériques accessibles à tous et à s’affranchir des restrictions sur le droit d’accès et de réutilisation. Ces restrictions peuvent être imposées soit par l’usage de formats propriétaires soit de licences restrictives, notamment les licences payantes parfois mises en place sur des données publiques : données géographiques (IGN) ou météorologiques (Météo France).

L’ouverture vise à publier les données selon une méthodologie qui supprime les restrictions limitant notamment leur exploitation et leur reproduction. La réglementation qui s’applique en la matière est la loi de 1978 régissant l’accès aux documents administratifs. La directive 2003/98/CE du 17 novembre 2003 concernant la réutilisation des informations du secteur public transposée en droit français en 2005, fixe un ensemble minimal de règles concernant la réutilisation et les moyens pratiques destinés à faciliter la réutilisation de documents existants détenus par des organismes du secteur public des États membres.

Ces « documents » pouvant être interprétés de façon large et prendre la forme de données.

Les organismes de recherche étaient jusqu’à présent exclus de ce dispositif en vertu d’une « exception culturelle ». La Directive 2013/37/UE du Parlement européen et du Conseil du 26 juin 2013 modifiant la directive 2003/98/CE concernant la réutilisation des informations du secteur public tend à supprimer cette exception culturelle. La Directive 2013/37/UE du Parlement européen et du Conseil du 26 juin 2013 modifiant la directive 2003/98/CE concernant la réutilisation des informations du secteur public réaffirme le principe général d’exclusion de l’ouverture et de réutilisation des données produites dans les établissements d’enseignement et de recherche, y compris des organisations créées pour le transfert des résultats de la recherche, des écoles et des universités. Seules les données issues des bibliothèques universitaires sont concernées par l’obligation d’ouverture et de réutilisation. Cette réglementation européenne conforte les dispositions de la loi CADA et il semble peu probable que la transposition de cette directive change de manière fondamentale ses principes.

Pour qu’une donnée soit ouverte : 3 critères

  • techniques : les données brutes doivent être exploitables de manière automatique (i.e.« machine readable ») et mise à disposition dans des formats les plus ouvertes possibles et non propriétaires (par exemple : on privilégie le format .csv à .xls d’Excel),
  • juridiques : les licences doivent clarifier les droits et les obligations des détenteurs et des réutilisateurs de données, elles doivent être les plus ouvertes possibles (par exemple : obligation d’attribution ou de partage à l’identique), économiques : peu ou pas de redevances tarifaires (susceptibles de constituer des freins à la réutilisation), si tarification elle ne doit pas dépassée le coût marginal de mise à disposition des données.

Recommandations

  • Se référer à la politique de l’institut concernant le type de données susceptibles d’être ouvertes selon les critères communément admis (voir ci-dessous).
  • S’assurer des droits permettant la mise à disposition des données.
  • S’assurer des critères techniques permettant de rendre accessibles les données pour la réutilisation.
  • S’assurer de l’anonymisation des données au nom de la protection de la vie privée.

Y-a-t-il un droit de propriété sur les données ?

NON dans l’absolu, les données brutes ne sont pas reconnues en l’état comme des « choses » pouvant faire l’objet d’une appropriation, il n’y a pas de régime juridique général de la donnée clairement défini. Cependant, il y a des règles (en pleine évolution) sur certaines catégories de données (données personnelles et données publiques) et il n’y a pas de statut juridique de la propriété des données en France à l’heure actuelle.

Donc en droit par principe, la collecte des données ne détermine pas la propriété quelle que soit la personne qui collecte. Une donnée (comme les idées) est une information qui est de principe de « libre parcours ».

CEPENDANT, il y a des stratégies d’appropriation consacrée par la loi : le droit rattaché aux bases de données par exemple mais il s’agit d’un produit de la donnée au même titre que la publication, sur lequel un droit d’appropriation s’applique. De même, pour certaines données notamment confidentielles, il y a des droits de propriété réservée (secret des affaires / secret professionnels).

En savoir plus

Coepia mémento

« La protection des informations à caractère personnel dans le cadre de l’ouverture et du partage des données publiques » juillet 2013
http://www.gouvernement.fr/sites/default/files/fichiers_joints/coepia_memento_donnees_personnelles.pdf