Des recherches en séparation de sources récompensées pour leur impact durable
En 2006, un article auquel a contribué Cédric Févotte, directeur de recherche CNRS à l’Institut de recherche en informatique de Toulouse (IRIT – CNRS/Toulouse INP/Université Paul Sabatier), a proposé une série de critères numériques pour l’évaluation d’algorithmes de séparation de sources. Aujourd’hui, la communauté scientifique mondiale utilise ces critères devenus une référence internationale. Les trois co-auteurs de cette recherche viennent d’être récompensés pour l’impact durable de leur publication par l’IEEE, avec près de 20 ans de recul.
En 2002, Cédric Févotte, aujourd'hui directeur de recherche CNRS à l'IRIT, Rémi Gribonval, directeur de recherche Inria au Laboratoire de l'informatique du parallélisme (LIP - CNRS/ENS de Lyon/Université Claude Bernard Lyon 1) et Emmanuel Vincent, directeur de recherche Inria au Laboratoire lorrain de recherche en informatique et ses applications (Loria - CNRS/Inria/Université de Lorraine) étaient respectivement en thèse à l’IRCCyN (aujourd’hui Laboratoire des Sciences du Numérique de Nantes (LS2N - CNRS/École Centrale de Nantes/Nantes Université)), jeune chercheur Inria à Rennes et doctorant à l'IRCAM. Ils obtiennent un financement du Groupement de recherche ISIS (aujourd'hui GDR IASIS, pour Information, apprentissage, signal, image et vision) pour des travaux qui vont marquer à jamais cette discipline. Leurs résultats sont aujourd’hui récompensés par le prix Sustained Impact Paper Award 2023 de l’Institute of Electrical and Electronics Engineers Signal Processing Society, qui salue l’impact à long terme de leur recherche. Mais qu’ont-ils accompli pour recevoir ce prix pratiquement 20 ans plus tard ?
Comment démêler un enregistrement audio complexe pour isoler les différentes sources sonores qui le composent ? Cette question est au cœur des enjeux de la séparation de sources en traitement du signal. À ses débuts, le domaine intéresse aussi bien l’ingénierie musicale que médicale, par exemple afin de dissocier les différents composantes d’un électrocardiogramme.
Retour au début des années 2000. Les méthodes de séparation de sources foisonnent, mais leur évaluation stagne faute de protocole bien établi : « Il était nécessaire de mettre au point des critères numériques qui permettent de comparer objectivement les méthodes développées par les différents groupes de recherche et ainsi faire avancer le domaine », raconte Cédric Févotte. C’est exactement ce que les trois chercheurs ont fait dans le cadre de leur projet « Jeunes Chercheurs » du GDR ISIS.
En pratique, lorsqu’un algorithme de séparation de sources est appliqué à un enregistrement, par exemple musical, les pistes en sortie, par exemple les instruments, ne sont pas parfaitement séparées. Ces erreurs ont différentes causes. Par exemple, des résidus de batterie ou de guitare peuvent persister dans les pistes contenant les voix séparées. Ce sont des interférences. Des erreurs artificielles peuvent aussi être produites par l’algorithme lui-même. Les chercheurs parlent alors d’artefacts. « L’originalité des critères que nous avons proposés, par rapport à l’existant, était qu’ils permettaient d’évaluer les différentes natures d’erreurs », explique Cédric Févotte.
Ces critères s’imposent rapidement au sein de la communauté pour plusieurs raisons. Outre leur pertinence, leur publication s’est accompagnée de la mise à disposition d’une boîte à outils logicielle. Celle-ci a permis aux autres chercheurs et chercheuses de calculer les critères afin de les appliquer aux résultats de leurs méthodes de séparation. Par la suite, un autre article rédigé par des pairs a conforté l’intérêt de ces résultats. « Il a mis en évidence que nos critères numériques apportaient des résultats comparables à des évaluations auditives réalisées par un panel de personnes », décrit Cédric Févotte. La boîte à outils est plus tard intégrée à d’autres suites logicielles, dans d’autres langages de programmation, démocratisant encore plus son utilisation.
Ces critères sont finalement devenus incontournables dans le domaine musical où les outils de séparation de sources sont aujourd’hui largement utilisés. Ils servent à l’édition musicale, notamment pour la restauration d’enregistrements anciens ou la création de remix. Cette prospérité enthousiasme particulièrement Cédric Févotte : « Nous sommes ravis de recevoir ce prix pour notre article. Avoir pu imprimer un tel travail dans la durée, depuis maintenant 20 ans, nous touche beaucoup tous les trois ».
Publication
E. Vincent, R. Gribonval and C. Fevotte, "Performance measurement in blind audio source separation" in IEEE Transactions on Audio, Speech, and Language Processing, vol. 14, no. 4, pp. 1462-1469, July 2006, doi: 10.1109/TSA.2005.858005.