DeeperArtiSpeech

22 septembre 2022

Ce projet porte sur la synthèse articulatoire de la parole, associant, d’une part, une approche d’intelligence artificielle pour synthétiser la forme géométrique du conduit vocal et ses caractéristiques acoustiques en fonction de la suite de phonèmes à articuler, et, d’autre part, des outils de simulations acoustiques numériques.

Le principal objectif du projet consiste à générer les paramètres d’entrée de la simulation numérique. Ce projet porte sur cette étape et comporte deux sous-problèmes que les outils d’apprentissage profond permettent de résoudre plus efficacement que les solutions actuelles :

la décomposition du conduit vocal en éléments acoustiques (essentiellement de petits tubes) compatibles avec la propagation d’une onde dans le conduit vocal,
la détermination de la forme géométrique du conduit vocal à partir de parole naturelle pour pouvoir régénérer un signal acoustique par synthèse.

Champs thématiques adressés par le projet :

Speech & Natural Language Processing (SNLP)

Plus d’information sur le projet et accès aux ressources :

Article publié dans le cadre de la conférence ICA 2022

L’équipe de recherche à l’origine du projet s’appuie sur le réseau d’ingénieurs du PNRIA

Equipe de recherche :

Yves Laprie LORIA (CNRS/Université de Lorraine/Inria)

Ingénieurs du PNRIA :

Romain Karpinsky LORIA (CNRS/Université de Lorraine/Inria)

En savoir plus sur le réseau PNRIA