Elsa Cazelles, l'analyse de données via le transport optimal

Institutionnel Informatique Signal

Elsa Cazelles a rejoint l'Institut de Recherche en Informatique de Toulouse (IRIT - CNRS/Université Toulouse 3 Paul Sabatier/INP Toulouse) en 2020 en tant que chargée de recherche CNRS.

Quel est votre domaine de recherche ?

Elsa Cazelles : Mes travaux de recherche sont axés sur l’analyse de données via les outils du transport optimal. En particulier, je m’intéresse aux données pouvant être décrites comme des observations de distributions de probabilité. En tant qu’instrument de modélisation, les mesures de probabilité sont plutôt générales et flexibles, peuvent représenter plusieurs phénomènes et sont bien définies dans des dimensions, des espaces et des représentations (continues ou discrètes) arbitraires. La construction de distributions approchées à partir de données n’est pas seulement valable pour des observations, elle peut également être intéressante lors de la modélisation d’une variable latente ou d’une prédiction, comme pour des distributions résultant de l’inférence bayésienne.

Les distances de transport se sont alors révélées une alternative appropriée lorsqu’il s’agit de comparer des distributions de géométrie ou de supports différents. Le transport optimal (TO) se réfère à la façon optimale (c’est-à-dire à moindre coût) de transporter la masse d’une distribution sur une autre. En apprentissage statistique, le TO va alors permettre de quantifier la perturbation d’une distribution (pour les variations d’amplitude et de phase) tout en incorporant la géométrie sous-jacente de l’espace sur lequel sont définies les distributions de probabilité. Dans mon travail, jexploite ces avantages dans l’étude dordre un et deux de jeux de données, ainsi que dans l’analyse de signaux.

 

Qu’avez-vous fait avant d’entrer au CNRS ? Pourquoi avoir choisi le CNRS ?

E. C. : J’ai débuté mes études supérieures à l’Université Paul Sabatier de Toulouse, où j’ai pu m’épanouir dans une certaine autonomie et par une organisation choisie du travail. J’ai ensuite effectué mon stage de M2 au sein de l’IRT Saint Exupéry, en travaillant sur des problématiques appliquées. J’ai alors poursuivi un doctorat à l’Institut de Mathématiques de Bordeaux, sous la direction de Jérémie Bigot et Nicolas Papadakis, découvrant alors le transport optimal. Enfin, j’ai réalisé un post-doctorat durant deux ans à l’Université du Chili au sein du Centre de Modélisation Mathématique, première IRL du CNRS, portant sur l’analyse de signaux principalement.

En tant que pôle de la recherche publique en France, le CNRS permet d’accéder a beaucoup de ressources, à la fois techniques, financières et humaines. En ce sens, il est plus aisé de se consacrer à la recherche, sans se sentir isolée, en s’intégrant dans une communauté scientifique large. En effet, le développement de collaborations, nationales et internationales, est grandement encouragé. Enfin, évidemment, la liberté scientifique — et géographique —  a été la raison principale de ma volonté d’intégrer le CNRS.

 

Qu’est-ce qui vous a amené à faire de l’informatique et/ou des sciences du numérique ? 

E. C. : Ayant fait des études en mathématiques appliquées, j’ai réellement découvert l’informatique durant ma thèse. Le code a premièrement été un moyen de visualiser les phénomènes prouvés préalablement grâce aux mathématiques.

Le code a ensuite été un véritable outil d’exploration, afin de mettre en lumière les modèles et idées, essayer de mieux les comprendre, d’extraire des intuitions sur le comportement de certaines données, et enfin de poursuivre dans une direction plutôt qu’une autre l’étude de certains objets.

Par ailleurs, la possibilité de tacler des problèmes concrets avec une jolie théorie en arrière-plan est vraiment ce qui m’a motivée à poursuivre dans les sciences du numérique. En effet, développer des outils pouvant être utiles à différents domaines de sciences, en tentant de mieux comprendre par exemple des phénomènes sociaux ou biologiques observés, m’est particulièrement important, l’idée étant de mettre les sciences du numérique au service de l’étude de données.

Contact

Elsa Cazelles
Chargée de recherche CNRS à l'IRIT