Éric Gaussier redéfinit les propriétés des modèles de traitement automatique des langues

Distinctions Informatique

Les réseaux de neurones profonds sont à l’origine d’importantes avancées en traitement automatique des langues et en recherche d’information. Toutefois, leurs performances sont souvent limitées sur d’autres corpus de données que ceux utilisés pour leur entraînement. Éric Gaussier, professeur à l'Université Grenoble Alpes et membre du Laboratoire d'informatique de Grenoble (LIG - CNRS/Université Grenoble Alpes), souhaite y remédier en intégrant des propriétés inspirées des capacités humaines dès la construction des modèles. Sa nomination en tant que membre senior au titre de la chaire innovation de l’Institut universitaire de France lui permet d’approfondir ses travaux.

« Nos capacités d’apprentissage sont telles qu’il est possible d’être illettré et bilingue. Cela signifie que nous pouvons parler une langue sans connaître ses règles de grammaire et ses fondements linguistiques », remarque Éric Gaussier, professeur à l’Université Grenoble Alpes et membre du LIG. Par ailleurs, en traitement automatique des langues, un modèle a besoin de bien plus de données que nous pour réaliser correctement une tâche telle que la traduction de textes, le résumé d’œuvres littéraires, etc. Les secrets de notre efficacité pourraient-ils être transposés et intégrés dans le design d’algorithmes ? Quelles devraient alors être les propriétés intrinsèques aux modèles afin que leurs performances s’approchent des nôtres ?

Mes recherches s’inscrivent dans le traitement automatique des langues et la recherche d’information. Je m’intéresse en particulier aux propriétés des modèles dédiés à ces usages.

Ces interrogations animent le chercheur depuis sa thèse. Elles sont désormais au cœur du projet de recherche qu’il va mener en tant que membre senior de l’Institut universitaire de France (IUF), titulaire d'une chaire innovation. Son objectif : formaliser informatiquement ce que nous faisons sans réfléchir. Ainsi, les modèles de traitement automatique des langues et de recherche d’information pourraient disposer de nouvelles capacités acquises et non plus apprises. « Jusqu’à présent, on part du principe que si les données ont une propriété alors le modèle va l’apprendre, c’est l’apprentissage fondé sur les données. Mais cela demande toujours plus de données, sans garantie que celles-ci disposent des bonnes propriétés. Et surtout, cela ne permet pas de passer la barrière de la généralisation », explique Éric Gaussier. Autrement dit, un modèle est bon sur ses données d’entraînement, mais voit ses performances s’effondrer sur des corpus différents. En conséquence, les modèles sont souvent coûteux en termes d’annotations de données et de temps de calcul.

Le chercheur fait alors le pari qu’en encodant les bonnes propriétés dès la création des modèles, moins de données seront nécessaires à l’apprentissage et la généralisation sera facilitée. Mais qu’entend-on par « propriétés » ? Par exemple, en traitement d’images, nous sommes capables de reconnaître une chaise qui a été retournée dans tous les sens. Il est dit que notre système de reconnaissance d’objet est invariant par rotation. « C’est le type de caractéristique que nous voulons intégrer dans nos modèles pour qu’ils aient des performances proches de l’humain. En traitement automatique des langues et en recherche d’information, ces aspects sont cependant moins connus et mes recherches auront notamment pour objectif de les expliciter et les formaliser », précise Éric Gaussier.

La causalité est un concept émergent, mais peu de sociétés en France se sont construites autour de ce sujet. Je veux aussi aider des jeunes qui seront recrutés dans le cadre de notre projet à créer des start-up en causalité.

Une autre ambition de son projet vise à appuyer davantage l’apprentissage d’algorithmes sur des relations causales plutôt que des corrélations, comme actuellement. En traitement d’images, par exemple pour reconnaître un chien, une relation causale consiste à identifier une truffe, la forme des oreilles, ou d’autres caractéristiques qui permettront d’identifier sa présence dans l’image. Mais qu’est-ce que la causalité dans une langue ?  « La causalité s’intéresse au « pourquoi » d’une langue. Lors d’une traduction, par exemple, pourquoi choisit-on tel mot dans tel contexte ? », explique le chercheur. Selon les résultats qui seront obtenus, Éric Gaussier espère tirer parti de son expérience passée en tant que créateur d’une start-up pour aider d’autres chercheurs à créer de jeunes pousses innovantes exploitant la causalité.

Contact

Éric Gaussier
Professor at Université Grenoble Alpes, member of LIG