Quand l'informatique détecte des expressions scientifiques douteuses

·2 min de lecture

Guillaume Cabanac, chercheur français en informatique, a été récompensé par la prestigieuse revue Nature pour ses travaux sur la détection des contenus erronés dans des articles scientifiques. Il assure à Sciences et Avenir qu'il s'attaque là, avec ses collègues, à "une nouvelle forme de plagiat qui n’est pas encore détectée".

La célèbre et prestigieuse revue scientifique Nature a pour habitude de publier . Pour 2021, un Français, Guillaume Cabanac, compte parmi les lauréats. Chercheur en informatique à l’Université de Toulouse (France), il s’emploie à détecter le contenu douteux de nombreux articles scientifiques. Afin de mieux saisir sa démarche, Sciences et Avenir l’a interrogé.

Sciences et Avenir : À quoi renvoient les termes "tortured phrases" que vos collègues chercheurs et vous employez ?

Guillaume Cabanac : Quand on est chercheur, on lit des articles pour s’informer, on rédige des articles pour communiquer de nouvelles connaissances. Avec mes collègues scientifiques, nous nous sommes rendus compte que dans certains articles validés par la communauté scientifique et publiés par les plus grandes maisons d’édition, on trouvait des expressions incongrues, inattendues voire erronées, c’est ce qu’on a appelé des "expressions torturées". Au lieu de voir écrit "intelligence artificielle" dans un article, il était marqué "conscience contrefaite". Ainsi dans l’article, on pourra trouver marqué : "la conscience contrefaite permet au véhicule de se déplacer dans la ville". Au lieu de "cancer du sein", il pourrait y avoir écrit "péril de la poitrine". Ça ressemble plus à une forme poétique, ça peut faire sourire mais lorsqu’on est chercheur et qu’on travaille sur un domaine particulier, on se doit d’utiliser les termes qui sont établis par la profession. Si une personne travaille sur le "cancer du sein", elle ne travaille pas sur le "péril de la poitrine", ça n’a pas de sens.

En 2005, des chercheurs du M.I.T (Massachusetts Institute of Technology) ont créé un logiciel appelé SCIgen (scientific generator) qui visait à produire à partir de rien, un texte qui ressemblait à de la science, pour plaisanter. Ils avaient utilisé ce logiciel pour créer de faux articles qu’ils avaient ensuite envoyé à des conférences ou des revues qu’ils jugeaient "prédatrices" (des revues employant des moyens fraudul[...]

Lire la suite sur sciencesetavenir.fr

A lire aussi

Notre objectif est de créer un endroit sûr et engageant pour que les utilisateurs communiquent entre eux en fonction de leurs centres d’intérêt et de leurs passions. Afin d'améliorer l’expérience dans notre communauté, nous suspendons temporairement les commentaires d'articles