Les chatbots dopés à l’IA deviennent de plus en plus courants, et des tas d’entreprises et d’organisations sont en train de se doter de systèmes de ce genre. Désormais, c’est l’Agence Spatiale Européenne (ESA) qui va se joindre à la fête : elle va développer son propre assistant virtuel sur le modèle de ChatGPT pour aider le public à y voir clair dans les données relatives à l’observation de la Terre.
Cette initiative a été lancée par le Φ-lab (prononcez Phi-Lab), une division de l’ESA qui a pour objectif d’accélérer le développement de technologies d’observation terrestre innovantes. Pour cela, le laboratoire s’appuie notamment sur des partenariats avec des entreprises comme Nvidia ou OVH, et des institutions de recherche prestigieuses comme l’EPFL ou l’ETH Zurich.
Faciliter l’exploitation des données
Avec ce nouveau projet, elle compte résoudre un problème particulièrement tenace. En effet, l’observation de notre planète génère chaque jour d’immenses volumes de données précieuses, à tel point qu’il est très difficile pour les humains d’en optimiser l’exploitation.
À première vue, c’est typiquement le genre d’exercice où les algorithmes basés sur l’IA pourraient faire des merveilles. Mais le souci, c’est que toutes ces données ne sont pas étiquetées. Dans le contexte du machine learning, l’étiquetage est un processus qui consiste à indiquer au système à quoi correspond chaque donnée utilisée pendant le processus d’entraînement. Prenez un algorithme conçu pour reconnaître des images ; pour l’entraîner, il faut lui fournir des tas d’exemples où on lui indique explicitement ce qu’il a sous le nez. Par exemple, la première photo représente un chien, la deuxième contient une maison, et ainsi de suite.
C’est un processus qui est généralement extrêmement long et éprouvant, puisqu’en pratique, cela implique de passer des heures à ajouter manuellement des mots clés dans une base de données. Et dans certains cas, comme l’observation de la Terre, le volume de données est tout simplement trop important ; l’ESA ne peut tout simplement pas se permettre de tout faire étiqueter par des humains, car il faudrait une véritable armée d’employés à plein temps pour obtenir des débuts de résultats.
Un modèle de fondation spécialisé dans l’observation terrestre
Pour cette raison, l’ESA a choisi de baser son assistant sur un modèle de fondation, comme celui qui sous-tend ChatGPT. La différence par rapport à l’approche traditionnelle du machine learning, c’est que ces modèles apparus vers 2018 s’entraînent seuls, sans supervision humaine; on parle d’apprentissage auto-supervisé. Et surtout, ils peuvent le faire à partir de données non étiquetées. Ces systèmes sont donc plus délicats à manipuler que leurs ancêtres. Mais lorsque la mayonnaise prend, on obtient un modèle particulièrement performant et versatile qui peut ensuite être paramétré pour un usage bien spécifique.
L’ESA travaille déjà sur plusieurs modèles de fondation spécialisés dans l’interprétation des données d’observation. Mais dans un communiqué, elle a révélé que l’un d’entre eux, baptisé PhilEO, est en train d’arriver à maturité après un peu plus d’un an de travail acharné. Il a récemment été proposé à différents grands acteurs de l’observation terrestre afin de commencer à valider ses performances.
À terme, son objectif sera de passer en revue toutes les données rapportées par les engins de l’ESA, comme les satellites Sentinel, pour en extraire des informations directement exploitables. « Imaginez pouvoir demander à un chatbot “Peux-tu me créer une carte extrêmement précise de la classification des cultures au Kenya ?”, ou “Les bâtiments dans ma rue sont-ils en train de s’affaisser ?”. Et imaginez que cette information soit scientifiquement solide et basée sur des données vérifiées », explique le communiqué de l’agence.
Un outil très prometteur pour les experts et le grand public
« Ce concept d’assistant numérique spécialisé dans l’observation de la Terre, qui peut nous offrir une large gamme d’informations utiles à partir de sources variées, est une perspective particulièrement alléchante », estime Giuseppe Borghi, le directeur du Φ-lab. « Étant donné que nous avons déjà fait des progrès extrêmement encourageants avec PhilE, je m’attends à ce que ces nouveaux projets changent complètement notre façon d’observer la Terre, et ce dans un futur proche », se réjouit-il.
Et le plus excitant, c’est que ce concept va sans doute être appliqué à des tas d’autres branches de la science sur les prochaines années. On pense notamment aux disciplines qui nécessitent de travailler avec d’immenses ensembles de données ô combien indigestes, comme l’astrophysique, la physique des particules ou la climatologie.
C’est une excellente nouvelle pour les professionnels chevronnés, qui pourront rapidement extraire des conclusions pertinentes avec un minimum d’efforts — et par extension, accélérer considérablement le processus de découverte. Et la cerise sur le gâteau, c’est que le concept est également très intéressant pour le grand public, puisqu’un tel assistant sera aussi un formidable outil de vulgarisation.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.