postheadericon La CNIL publie les résultats de son enquête sur l’open data

Des acteurs conscients d’enjeux… qui restent à mieux appréhender. C’est ainsi que l’on peut résumer les résultats de l’enquête que la CNIL vient de mener auprès de 400 membres de la communauté open data. Une enquête dont les résultats sont à prendre avec précaution car l’échantillon est en dessous des seuils statistiques généralement considérées comme fiables (1000 prs) et intégrait essentiellement des profils très au fait des problématiques vie privée avec 50% de CIL.

Néanmoins cette enquête montre que la question des données personnelles fait aujourd’hui partie des préoccupations des acteurs de l’open data avec 55% des répondants « responsables open data » et « gestionnaires de données publiques » qui se sont déjà demandés si certains jeux de données dont l’ouverture était envisagée, pouvaient contenir des données personnelles. Une prise en compte qui a abouti parfois au refus de libérer certaines données. Ainsi, un quart des réutilisateurs interrogés indiquent avoir déjà essuyé des refus d’ouverture d’informations au motif d’un risque d’identification des personnes (données concernant des professions libérales et artisans, décisions de justice, données géolocalisées, données INSEE, données de santé, données relatives aux marchés publics, liste des bans de mariage, noms d’élus, …).

Globalement, la CNIL estime que « le risque de présence de données personnelles est souvent pris en compte, sans pour autant bloquer la diffusion de données si des solutions simples peuvent être trouvées ». En d’autres termes certains jeux de fichiers sont plus faciles à anonymiser que d’autres, comme ceux ou figurent explicitement les coordonnées directes (nom, adresse, téléphone, mail…) et où il suffit de supprimer les colonnes d’un tableur pour les rendre anonymes. C’est plus difficile lorsqu’il s’agit de documents où des données nominatives apparaissent de manière épisodique (comme une délibération ou un contrat) et il y a le cas, mentionné par quelques répondants, de données permettant une identification indirecte ou par recoupement d’informations.

Aujourd’hui, en cas d’incertitude ou de difficulté à anonymiser, les administrations jouent la prudence (et parfois l’excès de prudence). La CNIL entend poursuivre ses réflexions – notamment sur les logiciels d’anonymisation – mais on sent qu’en arrière plan de la question de l’open data se profile celle du « big data », c’est-à-dire du recoupement en masse de données hétérogènes (données publiques + réseaux sociaux par ex.). Et là la CNIL est sans doute un peu démunie car les enjeux dépassent largement nos frontières et celui des données personnelles dans leur définition actuelle.

Les commentaires sont fermés.

TIC*