Emille Ishida, lauréate de l'appel à projet CNRS-Momentum
Nouveau programme lancé en 2016 par le CNRS, Momentum s’adresse à de jeunes scientifiques ayant soutenu leur doctorat depuis moins de huit ans. Il leur permet de mener une recherche innovante au sein d’un laboratoire du CNRS. Avec un total de 430 dossiers éligibles, l’appel a connu un grand succès. Emille Ishida, chercheuse CNRS au Laboratoire de Physique de Clermont (LPC - CNRS/Université Clermont Auvergne), fait partie des 19 projets retenus.
Les algorithmes d'apprentissage supervisé apprennent grâce à un grand nombre de données. Cependant, l'étiquetage de ces données peut être très coûteux et prendre beaucoup de temps, alors que les données non étiquetées sont apparemment peu coûteuses et facilement accessibles. L’apprentissage actif (AL, pour Active Learning) s’intéresse à l’idée qu'un algorithme donné peut être plus performant avec un petit nombre de données d'entraînement, si celles-ci sont soigneusement choisies.
L'arrivée de ressources de calcul modernes et plus accessibles, ainsi que la grande quantité de données amassée au cours de la dernière décennie, ont poussé l'adoption de telles stratégies dans de nombreux domaines. Or l’astronomie n'a que récemment bénéficié de ces développements en apprentissage automatique. Par ailleurs, le rôle crucial joué par les sondages à grande échelle est un aspect inévitable de l'astronomie du 21ème siècle. À titre d'exemple, le télescope synoptique grand champ (LSST - https://www.lsst.org/ ) devrait produire ~ 30 To de données par nuit d'observation sur 10 ans. Dans ce contexte, le développement d'algorithmes ML fiables capables de traiter des ensembles de données aussi volumineux pose une série de défis sans précédent. Ce projet CNRS-Momentum se concentre sur l'un d'entre eux: la nécessité d'observations à haute résolution pour la classification des sources transitoires (objets dont la luminosité varie avec le temps).
Une fois qu'un objet transitoire est découvert, nous avons besoin d'au moins une observation à haute résolution afin de déterminer sa nature, ce qui permet de l’utiliser pour des études scientifiques ultérieure. Le LSST fournira seulement des observations photométriques à large bande passante (basse résolution) à différents moments dans le temps. En d'autres termes, nous observeront comment la luminosité d'un objet évolue, sans déterminer directement quel type d'objet nous regardons. Ces informations sur leur nature seront disponibles pour un petit pourcentage du nombre total d'objets découverts - et dépendent d'accords avec d'autres télescopes capables d'acquérir des observations à haute résolution.
Afin d'optimiser cette synchronisation mondiale des télescopes, le projet vise à développer une stratégie de ciblage qui permettra aux astronomes de maximiser la classification des objets transitoires en utilisant minimum d'observations à haute résolution. Cette situation présente de nombreux défis, tels que des coûts d'étiquetage variables, des erreurs de mesure, et des mesures bruitées, corrélées et incomplètes. Compte tenu des particularités des données astronomiques, l'analyse développée dans ce projet servira également d'exemple de la façon dont les données astronomiques peuvent encourager le développement de nouveaux algorithmes d’apprentissage. Un tel effort nécessite une approche multidisciplinaire et une collaboration intense entre des experts de différents horizons.