ImageNet, la base de données inquiétante pour le respect de la vie privée

·2 min de lecture

Les chercheurs qui ont créé ce corpus de près de 15 millions d’images craignent des usages pour lesquels elles ne sont pas destinées. Ils ont flouté tous les visages pour empêcher qu’ils ne servent à des projets de reconnaissance faciale

On compte 14.197.122 images dans la base de données ImageNet, utilisée pour la recherche en intelligence artificielle et vision par ordinateur. Elle remonte à 2009 et doit sa renommée au fait qu’elle a beaucoup servi au développement du "deep learning" à partir de 2012. Mais depuis le 11 mars 2021, 243.198 photos où figurent des personnes ont été altérées. Plus exactement, les visages ont été floutés, comme l’indiquent une mise à jour et un article de recherche mis en ligne sur le site d’. Il y a parfois plusieurs visages sur une même image, d’où plus de 560.000 opérations de floutage. L’initiative revient aux créateurs de ce corpus, des chercheurs des universités américaines de Princeton, dans le New Jersey, et de Stanford, en Californie.

ImageNet a pour particularité de présenter des situations réelles, des scènes de la vie de tous les jours, des objets dans leur contexte et parfois en cours d’utilisation : une bouteille en train d’être bue, un voyageur portant un sac-à-dos, un cavalier lors d’un rodéo, etc. Sans compter des scènes de réunions, des situations de travail devant des ordinateurs, des ambiances de salles de classes ou de bureau.

Un déploiement anarchique de la reconnaissance faciale

Les images montrant des personnes ne représentent néanmoins qu’une faible partie du total. Mais c’est assez pour soulever des questions d’ordre éthique. Car avec les performances du "deep learning", toute une série de travaux et d'usages se sont développés et parmi eux, la reconnaissance faciale. Aux Etats-Unis, celle-ci avec une tendance à l’absence de transparence, aux pratiques mal encadrées et aux résultats biaisés. Autant d'éléments qui ont poussé plusieurs villes à interdire leurs services de se servir de cette technologie (et en premier lieu la police) et certaines phares du domaine à cesser leurs travaux en la matière tant qu’il n’existera pas une réglementation fédérale.

Les créateurs d’ImageNet ont décidé que la base ne devait pas servir à entraîner des algorit[...]

Lire la suite sur sciencesetavenir.fr

A lire aussi