Gabriel Peyré, ERC Consolidator Grant 2016

Distinctions International Image

Comment comparer des données, comme des images ou des textes, pour savoir lesquelles sont les plus proches, et les regrouper par familles ? Le transport optimal est un outil mathématique puissant qui permet de résoudre ce type de problèmes. Il reste cependant sous-exploité du fait de sa complexité. Dans son ERC NORIA, l’objectif de Gabriel Peyré, chercheur CNRS au sein du Département de mathématiques et applications de l’ENS (DMA – CNRS/ENS Paris), est de démocratiser cet outil théorique en développant des algorithmes rapides de calcul et en mettant en application ces avancées en infographie, en vision par ordinateur, mais aussi dans le domaine des neurosciences.

Les histogrammes ne se résument pas à la visualisation de résultats mis en forme sous Excel. Beaucoup de données à analyser peuvent être représentées sous forme d’histogrammes. Cette approche permet de modéliser ainsi de nombreux problèmes : la palette de couleurs d’une image correspond à l’histogramme de ses couleurs, et le contenu sémantique d’un texte se retrouve dans les fréquences d’apparition des mots. Le transport optimal définit une distance entre de tels histogrammes en mesurant « l’effort » de transfert de la masse pour passer d’une distribution à l’autre. Le type de données à comparer (image, texte, etc.) est ainsi pris en compte à travers un coût associé à l’effort de transfert (par exemple une distance entre couleurs ou entre les mots d’un langage). Ceci est très différent des distances classiques entre histogrammes (comme la métrique euclidienne) qui ignorent le type de données. Ainsi, des choses intuitives pour l’humain, comme la proximité de deux images avec des palettes similaires, ou bien de deux textes aux contenus sémantiques proches, peuvent être mesurées et exploitées. Le transport optimal permet également d’étudier finement ce qui sépare, et donc ce qui se produit, entre deux histogrammes, afin de pouvoir interpoler un histogramme intermédiaire. 

Image retirée.
Interpolation entre trois formes © Gabriel Peyré

Mais cet outil du transport optimal, très élégant d’un point de vue conceptuel, est complexe à comprendre mathématiquement et surtout difficile à calculer numériquement. Le transport optimal reste donc un outil confidentiel limité aux applications de niche, alors que les sciences de l’imagerie seraient un domaine d’application tout indiqué puisqu’ils emploient couramment des distributions de probabilité. C’est pour lutter contre cet état de fait que le projet ERC NORIA de Gabriel Peyré a été retenu. Ce projet proposera des avancées théoriques et informatiques pour généraliser l’application du transport optimal à différents problèmes, tout en restant algorithmiquement efficaces. Le but est également de réaliser des logiciels open source pour qu’un utilisateur novice puisse exploiter les ressources du transport optimal. NORIA prévoit ainsi de développer la prochaine génération de progrès théoriques, numériques et algorithmiques pour permettre des calculs de transport optimal à grande échelle en imagerie, machine learning et neurosciences. 

Pour cela, les algorithmes développés par NORIA s’appuieront sur plusieurs avancées mathématiques en optimisation (optimisation stochastique, flot de gradients) et en calculs parallèles (schémas de régularisation entropique). Ces techniques permettront de calculer rapidement un transport approché, qui sera également plus stable, ce qui est important pour être robuste au bruit contaminant les données. 

Pour mettre en application ces avancées théoriques, Gabriel Peyré prévoit trois domaines d’application. Le premier, sans doute le plus naturel, concerne le traitement des couleurs et des matériaux en infographie. Le deuxième se concentre sur l’analyse et la synthèse de textures en vision par ordinateur, avec notamment les problématiques de reconnaissance d’images et d’objets. Enfin, le troisième domaine traitera des données, aussi bien images que signaux, en neurosciences. Ces trois domaines d’application permettent ainsi au projet NORIA de s’attaquer à la fois à des problèmes de petite dimension (2 dimensions pour les images, voire 3 ou 4D) et à des problématiques, de type machine learning, en grande dimension (pour la reconnaissance ou la classification de données). Enfin, les applications en neurosciences correspondent à des problèmes en grande dimension, auxquels s’ajoutent des particularités biologiques à prendre en compte, à travers une collaboration étroite avec le laboratoire UNIC de Gif-sur-Yvette.

Image retirée.
Moyenne de plusieurs activités corticales (gauche : moyenne "classique, droite : moyenne par transport optimal). La moyenne par transport optimal permet d'avoir une meilleure estimation du centre de l'activation. © Gabriel Peyré

 

Contact

Gabriel Peyré
Directeur de recherche CNRS au DMA