Vincent Lostanlen et l'écoute artificielle

Institutionnel Signal

Vincent Lostanlen a rejoint le Laboratoire des Sciences du Numérique de Nantes (LS2N - CNRS/École Centrale de Nantes/Université de Nantes/IMT Atlantique) en 2020 en tant que chargé de recherche CNRS.

Quel est votre domaine de recherche ?

Vincent Lostanlen : Je travaille sur l’écoute artificielle, c’est-à-dire le traitement des sons par l’ordinateur. Mon but est que ce traitement numérique imite les mécanismes cognitifs de l’humain. Par exemple, les musiciens ont une perception fine de la hauteur et du rythme, ce qui leur permet de s’harmoniser et de se synchroniser « d’oreille », sans recourir à une partition. De plus, ils sont attentifs au phrasé, au timbre, et à la technique gestuelle de chaque instrument. Or, notre rapport à la musique est aujourd’hui en grande partie numérisé : qu’il s’agisse de création, de mixage, ou d’écoute en flux (streaming), la qualité de l’interaction humain-machine est un enjeu scientifique récurrent. C’est dans ce contexte que je travaille à des méthodes d’écoute artificielle pour estimer la similarité de timbre entre deux extraits musicaux.

Au-delà de la musique, un autre volet de ma recherche concerne la bioacoustique, c’est-à-dire l’étude du chant animal. On sait que ce chant représente une forme de « signature acoustique » de l’espèce. L’idée est donc de faire une prise de son en milieu naturel puis de détecter automatiquement ces signatures, de sorte à produire un inventaire dynamique des espèces présentes. À l’heure où la biodiversité connaît une extinction de masse, il me paraît urgent d’offrir à la délibération politique une cartographie détaillée des « paysages sonores » dans les zones spéciales de conservation. Dans cette perspective, mon rôle est d’améliorer la fiabilité de l’écoute artificielle, mais aussi son interprétabilité théorique et son autonomie énergétique, dans le respect de la vie privée.

 

Qu’avez-vous fait avant d’entrer au CNRS ? Pourquoi avoir choisi le CNRS ?

V. L. : J’ai étudié à Télécom Paris puis me suis orienté vers le master 2 « Acoustique, Traitement du signal et Informatique Appliqués à la Musique » (ATIAM) de l’UPMC. J’ai préparé ma thèse de doctorat au laboratoire d’informatique de l’École normale supérieure, sous la direction de Stéphane Mallat. En 2017, je suis parti à New York pour un post-doctorat au laboratoire d’ornithologie de l’université Cornell. En parallèle, j’ai rejoint le Music and Audio Research Lab de l’université de New York (NYU), auquel je suis toujours affilié en tant que chercheur invité.

C’est d’abord en lisant les ouvrages de chercheurs et chercheuses de mon domaine que j’ai découvert le CNRS. Je pense notamment à Du songe au son de Jean-Claude Risset et Écoute et acoustique musicale de Michèle Castellengo. Ensuite, il y a eu des rencontres-clés : Mathieu Lagrange, Patrick Flandrin, Nancy Bertin, Cédric Févotte et d’autres.

J’ai choisi le CNRS car c’est une institution vaste, pluridisciplinaire, et avec une forte composante de recherche fondamentale. De façon plus personnelle, j’estime devoir beaucoup à la France et à son service public : après trois ans aux États-Unis, c’est donc un honneur pour moi que de devenir fonctionnaire dans un établissement de recherche publique français tel que le CNRS.

 

Qu’est-ce qui vous a amené à faire de l’informatique et/ou des sciences du numérique ?

V. L. : Le déclic s’est fait peu de temps après mon bac. J’ai d’abord envisagé de m’orienter vers une école de techniques du cinéma telle que Louis-Lumière ou la Fémis. Pour préparer le concours d’entrée, je me suis mis à lire différents ouvrages sur la prise de son, chacun prenant un angle différent : mathématiques, neurosciences, philosophie, histoire … C’est ainsi que j’ai compris que le monde sonore pose des questions scientifiques fascinantes. En me documentant sur Schönberg, j’ai appris l’existence de l’Ircam, puis de tout un réseau de laboratoires de recherche en informatique musicale. Abandonnant mes velléités de formation audiovisuelle, j'ai pris le chemin des écoles d’ingénieurs avec l’idée de poursuivre en master puis en doctorat.

À Télécom Paris, mes enseignants ont su me transmettre le goût du traitement du signal, une discipline à l’interaction entre mathématiques, physique et informatique. Ce qui m’a plu, c’est l’aller-retour permanent entre formalisation théorique et démarche empirique. Ensuite, grâce à mon directeur de thèse, Stéphane Mallat, je me suis spécialisé dans un sous-domaine du traitement du signal qu’on appelle la transformée en ondelettes. Il s’agit d’une méthode très générale qui, dans mon cas, peut servir à mesurer les intervalles de hauteurs qui forment une mélodie. Depuis lors, les ondelettes ne m’ont plus quitté et je pense qu’elles resteront dans mon paysage mental pour de nombreuses années encore.

Contact

Vincent Lostanlen
Chargé de recherche CNRS au LS2N