Les limites de la surveillance automatisée mises en lumière par un outil anti-surveillance
On parle beaucoup ces jours-ci de ICWatch, une base de données contenant 27 000 profils d’individus appartenant ou travaillant en étroite collaboration avec la communauté américaine du renseignement. Ces profils ont été automatiquement recueillis sur LinkedIn, le réseau social professionnel, à l’aide de mots clés dont la liste n’est pas fournie par l’association (Transparency Toolkit) qui a développé cette initiative. L’objectif derrière ce projet est de retourner les outils de la surveillance de masse contre ceux qui les utilisent au quotidien au mépris des principes élémentaires de la vie privée.
Pourtant, la démonstration, aussi spectaculaire soit-elle, me semble justement mettre en lumière les problèmes découlant de la constitution automatisée de bases de données par des machines qui ne comprennent pas grand chose aux informations qu’elles collectent, et encore moins au contexte associé à ces informations.
Si on examine de plus près un échantillon de profils canadiens, on se rend rapidement compte de la nature assez hétéroclite des profils présentés: on y retrouve en effet des journalistes, des spécialistes des relations publiques, et même un ardent défenseur de la vie privée que l’on ne peut pas soupçonner de collusion avec les services de renseignement. Ces personnes se retrouvent bien malgré elles dans cette base de données parce que les mots-clés choisis pour extraire les profils ont été trop insuffisamment spécifiés, et que le même terme peut évidemment être employé pour décrire des compétences très différentes et qui ne sont pas exclusives au monde du renseignement.
Dans la mesure où les profils extraits de LinkedIn et agrégés dans cette base de données n’ont pas été validés individuellement par un être humain capable de faire la distinction, on se retrouve avec un taux probablement très élevé de « faux positifs »: des personnes qui seront dorénavant associées à leur insu à la nébuleuse de la surveillance d’État et dont on ne sait pas vraiment quelle procédure elles devront suivre pour être retirée de cette liste infamante.
Il semble que même ceux qui luttent contre la surveillance aient du mal à échapper aux biais qui la rendent très souvent inefficace.
Ce contenu a été mis à jour le 17 juin 2015 à 14 h 25 min.