Mathilde Caron et Florent Koechlin distingués lors du prix de thèse Gilles Kahn

Distinctions Informatique Image

La dernière édition du prestigieux prix de thèse en informatique Gilles Kahn a connu deux accessits. Mathilde Caron a travaillé avec le Laboratoire Jean Kuntzmann (LJK - CNRS/Université Grenoble Alpes), le centre Inria de Grenoble et Facebook AI Research sur l’apprentissage auto-supervisé appliqué à la vision par ordinateur. Florent Koechlin a quant à lui exploré diverses questions informatiques à l’aide d’outils issus de la combinatoire au Laboratoire d'Informatique Gaspard-Monge (LIGM - CNRS/Université Gustave Eiffel). 

La Société informatique de France (SIF) remet chaque année, sous le patronage de l’Académie des sciences, le prix de thèse Gilles Kahn. Baptisé en hommage à l’ancien directeur d’Inria et membre du conseil d’administration du CNRS, ce prix peut être accompagné d’un maximum de deux accessits : Mathilde Caron et Florent Koechlin, ont été récompensés pour leurs thèses.

Lors de sa thèse CIFRE intitulée « Apprentissage auto-supervisé de représentations visuelles avec des réseaux de neurones profonds », préparée au LJK avec le Centre Inria de l’Université Grenoble Alpes et Facebook AI Research, Mathilde Caron s’est attaquée à un problème fondamental en vision par ordinateur. « Lorsque l’on voit une image avec un chien, elle est automatiquement traitée par notre cerveau qui reconnaît aussitôt l’animal, explique-t-elle. Pour un ordinateur, limage est juste un tableau de pixels auquel donner du sens est une tâche difficile. »

Pour y parvenir, Mathilde Caron emploie des réseaux de neurones. Ces structures sont en général entraînées avec des données étiquetées. Par exemple, une photo de chien reliée aux termes « animal » et « chien ». Mais lorsqu’il faut disposer d’une grande quantité d’information pour entraîner les réseaux de neurones, le temps et les coûts consacrés à cet étiquetage s’envolent. Cette approche a aussi le désavantage d’introduire des biais potentiels en fonction de qui a annoté les données.

Mathilde Caron a donc travaillé sur des réseaux de neurones auto-supervisés, qui créent eux-mêmes ces annotations à partir de données brutes. Elle a pour cela employé des algorithmes de groupement automatique pour obtenir des pseudos étiquettes, avec lesquelles les réseaux peuvent se réentraîner en boucle afin daboutir à des annotations aussi utiles que si elles avaient été entrées à la main. Mathilde Caron a ensuite affiné ces algorithmes qui, par exemple, groupaient parfois les données dans des ensembles trop grands et triviaux pour permettre au processus itératif davancer correctement.

Cette méthode est également plus proche de la manière dont nous apprenons nous-mêmes à reconnaître le monde qui nous entoure.

« J’ai découvert l’informatique assez tard, alors que j’étais dans une école d’ingénieurs plutôt généraliste, se souvient Mathilde Caron. J’ai suivi un super cours en troisième année sur la vision par ordinateur et j’ai adoré manipuler les images. Puis j’ai effectué un premier stage de recherche sur l’imagerie médicale, qui m’a donné envie d’aller plus en amont et j’ai naturellement prolongé sur une thèse. » Mathilde Caron a depuis rejoint une équipe de recherche Google basée à Grenoble, où elle élargit ses travaux sur la vision par ordinateur à la vidéo et aux textes.

La thèse de Florent Koechlin s’intitulait quant à elle « Systèmes de fonctions holonomes : application à la théorie des automates ». Elle a été effectuée à l’Université Gustave Eiffel, au sein du LIGM. « Mes travaux se sont organisés en deux parties relativement indépendantes pour ce qui est des objets étudiés, explique Florent Koechlin. Elles trouvent cependant un point commun dans lutilisation d’outils venus de la combinatoire analytique, notamment l’étude des séries génératrices. »

Le premier volet concerne les expressions aléatoires utilisées pour étudier la complexité moyenne d’un algorithme ou pour tester expérimentalement ses performances. Une question se pose pour ces expressions aléatoires : représentent-elles correctement les données sur lesquelles est exécuté l’algorithme ? En général, les modèles génèrent bien des expressions syntaxiquement correctes, mais sans prendre en compte les redondances, notamment quand plusieurs expressions de tailles très différentes représentent le même objet. Par exemple, si une expression arithmétique commence par une multiplication par zéro, même si la suite est très grande et parfaitement aléatoire, l’expression totale sera en fait équivalente à zéro, une expression bien plus petite !

On pense étudier le comportement moyen de l’algorithme sur de nombreuses expressions différentes et de grandes tailles, alors qu’en réalité, à cause des très nombreuses redondances introduites par un élément absorbant, on teste l’algorithme sur un très petit nombre de cas.

Dans la seconde partie de sa thèse, Florent Koechlin a exploré les liens entre la combinatoire et la théorie des automates, qui peuvent trouver des applications en vérification. « La question a commencé à être étudiée dans les années 60, mais ses réelles applications ont surtout été exploitées au milieu des années 80, explique-t-il. Ces travaux navaient cependant pas vraiment été mis à jour depuis, alors que chacun de ces deux domaines a continué de se développer. »

Florent Koechlin est actuellement en postdoctorat au Laboratoire lorrain de recherche en informatique et ses applications (LORIA - CNRS/Inria/Université de Lorraine). « En classe prépa, j’ai su que je n’étais pas tellement tenté par le métier d’ingénieur, alors je me suis orienté vers l’ENS Cachan, détaille-t-il. J’ai quand même hésité à la sortie de l’école à essayer de devenir prof en prépa, mais la thèse m’a vraiment confirmé que je voulais travailler dans la recherche et rester au plus près de la communauté scientifique. »

Contact

Mathilde Caron
Chercheuse chez Google Research
Florent Koechlin
Chargé de recherche CNRS au LIPN