Des drones intelligents pour retrouver des personnes disparues

La méthode de l'apprentissage par renforcement sert à générer des cartes orientant les recherches d'un drone équipé d'une caméra. La méthode a été testée en simulation.

Des randonneurs, des chasseurs, des pêcheurs qui se perdent en pleine nature, cela arrive, et la solution la plus connue consiste à envoyer un hélicoptère pour mener les recherches. Mais le dispositif est lourd et prend du temps, dans une situation où chaque minute compte.

D’où le recours à des drones dotés de caméra. Une équipe en sciences aérospatiales de l’université de Glasgow (Grande-Bretagne) a conçu une solution combinant un drone et un algorithme d’apprentissage automatique capable de générer des trajectoires probables empruntées par la personne disparue. Ce qui a pour objectif d’orienter plus précisément les zones où envoyer l'appareil.

Une méthode particulière de l’apprentissage automatique est sollicitée ici : l’apprentissage par renforcement, par laquelle l’algorithme n’apprend pas à partir d’exemples tirés d’une base de données mais à partir d’un procédé par essai-erreur. Il se comporte aléatoirement mais reçoit un signal de récompense lorsqu’il fait un bon choix. En l’occurrence, ici, concernant ses déplacements. Le projet est détaillé dans un article de mai 2024 diffusé sur la plateforme Arxiv en preprint.

Des drones pour lancer plus vite les recherches

Ce travail a été effectué avec pour référence le cas de l’Ecosse, où les équipes de police secours ou le Scottish Mountain Rescue (secours en montagne écossais) disposent de flottes de drones en plus de leurs hélicoptères. Les premiers n’ont pas vocation à remplacer les seconds, ne serait-ce que parce qu’un hélicoptère peut, lui, hisser à son bord et transporter une personne après l’avoir retrouvée. Les drones permettent de lancer plus vite les recherches. Mais un usage efficace, précisent les chercheurs dans leur article, nécessitent "une planification minutieuse".

L’équipe a utilisé un algorithme d’apprentissage par renforcement appelé SAC ("Soft Actor Critic"). Le mécanisme de récompense consiste à signaler à l’algorithme que son mode d’exploration est conforme aux limites de la zone de recherche d[...]

Lire la suite sur sciencesetavenir.fr

A lire aussi