Maxime Peyrard aide les algorithmes à différencier causalité et corrélation

Institutionnel Informatique

Les algorithmes issus de l’apprentissage automatique ont des difficultés lorsqu’ils effectuent leurs tâches sur des données trop éloignées de celles sur lesquelles ils se sont entraînés. Ils sont particulièrement vulnérables aux fausses associations statistiques. Maxime Peyrard a obtenu une chaire de professeur junior afin de traiter la question au Laboratoire d’informatique de Grenoble (LIG, CNRS/Université Grenoble Alpes).

C’est un retour aux sources pour Maxime Peyrard, qui intègre le LIG grâce à une chaire de professeur junior CNRS. Ce statut récent est un CDD, ici de cinq ans, qui aboutit, après évaluation, à une titularisation au grade de directeur de recherche CNRS.

Maxime Peyrard a passé son diplôme d’ingénieur à Grenoble INP – Ensimag et a découvert la recherche lors d’un stage au LIG. Il est ensuite parti en Allemagne, à l’université technique de Darmstadt, et y a obtenu un master, puis son doctorat sur le traitement du langage naturel et l’apprentissage automatique. Il a également travaillé pendant un an comme chercheur chez Amazon, au Royaume-Uni, puis a enchaîné avec un postdoctorat à l’École polytechnique fédérale de Lausanne, avant de revenir à Grenoble.

Mes études ont d’abord concerné les mathématiques appliquées et la physique, puis j’ai dévié vers l’apprentissage statistique.

« J’étudie surtout des aspects méthodologiques et des problèmes très généraux, liés à l’opposition entre causalité et corrélation, explique Maxime Peyrard. Quand un modèle s’est entraîné sur un certain corpus, comme Wikipédia ou des articles de presse, il va avoir du mal à travailler s’il doit manipuler des types de textes très différents, comme du chat ou des tweets. Les perspectives causales pourraient aider à surmonter cette difficulté. »

Les algorithmes conversationnels subissent en effet parfois des associations statistiques trompeuses, qui fonctionnent dans des contextes précis, mais pas en dehors. Or ces modèles sont souvent des boîtes noires, qui opèrent des choix selon des critères difficilement compréhensibles par les humains. Les aider à distinguer les corrélations à risque des causalités réelles est donc particulièrement complexe. Maxime Peyrard étudie aussi la question sous l’angle de la fairness, qui vise à empêcher que des groupes sociodémographiques soient désavantagés par des algorithmes commettant ce type d’erreurs.

Maxime Peyrard emploie pour cela deux approches. D’abord, quand l’algorithme est entièrement disponible, il émet un diagnostic en lui posant des questions qui vérifient sa capacité à la généralisation. Il identifie ensuite les causes des éventuelles erreurs, puis revient en arrière afin de voir comment les éviter lors de la phase d’apprentissage. « Il faut parfois changer la manière dont l’algorithme est entraîné, et en particulier sa fonction de récompense qui est chargée de lui confirmer s’il a réussi sa tâche », ajoute Maxime Peyrard. Il s’intéresse également à l’intelligence artificielle neuro-symbolique, qui combine l’apprentissage automatique avec des systèmes lisibles par les humains.

Je pense que ces technologies ont vocation à devenir des outils pour les autres sciences, et je souhaite collaborer avec des chercheurs d’autres domaines pour le vérifier.

Face à des modèles complexes et difficilement interprétables, Maxime Peyrard propose de désactiver ou perturber certains composants pour comprendre leur rôle dans le fonctionnement global du modèle. « C’est comme lorsque, en neurosciences, on profite d’une lésion du cerveau pour comprendre à quoi sert la partie en question, prend comme exemple Maxime Peyrard. On perturbe et on obfusque certaines parties du modèle pour regarder l’impact de ces sous-ensembles sur les résultats. »

Cela lui laisse de nombreuses pistes à explorer pendant ses cinq années de chaire de professeur junior CNRS. Celle-ci est accompagnée d’une bourse de thèse pour un premier doctorant déjà prévu pour le mois d’octobre, et d’un budget de 200 000 euros qui servira, entre autres, à financer une autre thèse. En plus de cet encadrement, Maxime Peyrard aura 42 heures annuelles de cours à partager entre l’Ensimag, son ancienne école d’ingénieurs, et l’Université de Grenoble Alpes. Il y enseignera principalement l’apprentissage automatique, bouclant ainsi la boucle.

Contact

Maxime Peyrard
Chaire de professeur junior CNRS, membre du LIG