4 thèses internationales dans les laboratoires de l'INS2I en 2021
Chaque année, un certain nombre de thèses sont pourvues dans les laboratoires de recherche internationaux rattachés à l'Institut des sciences de l'information et de leurs interactions du CNRS.
ProbRel2Vec, Representation learning for uncertain relational structures
Porteur du projet : Bogdan Cautis, chercheur au LISN
Laboratoire international : IPAL - Image and Pervasive Access Lab, Singapour
Description du projet :
Le sujet du projet se situe à l'intersection de la gestion des données et de l'apprentissage automatique, avec des ramifications et un impact potentiel dans de nombreux domaines qui ont à traiter des données structurées et incertaines, qui doivent être utilisées dans des processus d'apprentissage automatique et d'analyse de données.
Les représentations vectorielles (également appelées "embeddings") pour divers types d'informations ont été utilisées avec succès ces dernières années, comme moyen de transposer des données discrètes dans un espace différentiable, dans lequel les techniques d'apprentissage automatique peuvent s'appliquer. Ces techniques d'apprentissage par représentation, avec des exemples populaires tels que les algorithmes d'encastrement et les réseaux neuronaux, ont été envisagées pour les données en langage naturel, les graphes, les réseaux d'information et de connaissance, les réseaux de diffusion, etc.
Cependant, les aspects théoriques de ces approches ont été largement ignorés. Dans ce projet de thèse, nous avons l'intention d'étudier les fondements des techniques de représentation vectorielle pour les données structurées et incertaines (données relationnelles probabilistes), y compris les données interconnectées (graphes riches), en nous concentrant non seulement sur les aspects de complexité (et l'efficacité dans les applications du monde réel) mais aussi sur l'expressivité / sémantique de celles-ci.
Les représentations vectorielles pour les données d'arité supérieure (données relationnelles générales) n'ont été étudiées que récemment et sporadiquement, soit en réduisant le problème aux graphes, soit aux phrases en langage naturel. Par conséquent, un premier objectif de ce projet de thèse est d'étudier des techniques d'encastrement qui peuvent directement travailler avec des relations d'arité arbitraire, en étant à la fois intéressantes d'un point de vue pratique et théorique. Puis, dans un deuxième temps, ces techniques seront reconsidérées dans le contexte des données relationnelles probabilistes. Les notions d'homomorphisme et d'isomorphisme entre structures relationnelles sont bien connues et centrales dans la théorie des bases de données (par exemple, à la base de la réponse aux requêtes conjonctives). Nous avons l'intention d'étudier les techniques d'encastrement des structures relationnelles probabilistes qui partent de ces notions et de la similarité entre structures relationnelles basée sur l'homomorphisme.
Pour ces techniques d'intégration, nous nous attacherons à comprendre quels problèmes (requêtes) peuvent être résolus par différentes techniques d'intégration, notamment en capturant quelle sémantique et/ou quelles propriétés numériques des données sous-jacentes. Par exemple, qu'est-ce que cela signifie pour deux objets d'être mis en correspondance avec le même point dans un espace multidimensionnel, ou avec des points similaires (selon diverses interprétations de la similarité) ? Du point de vue des bases de données, nous nous concentrerons sur des questions telles que "quelles classes de questions (requêtes) peuvent être répondues à partir d'incorporations de données", d'abord pour les structures relationnelles standard, puis pour les structures incertaines (données relationnelles probabilistes). Il est intéressant de noter que la compréhension des implications du caractère aléatoire du processus d'incorporation peut conduire à une nouvelle théorie pour la réponse approximative aux requêtes dans les bases de données probabilistes.
Les objectifs fondamentaux de ce projet de doctorat sont fortement liés au programme de recherche IPAL, en particulier aux sujets relatifs à la prise de décision basée sur l'IA dans les systèmes urbains critiques. Les techniques de représentation vectorielle pour les données relationnelles incertaines auront un impact direct sur les recherches qui seront menées par Bogdan CAUTIS avec ses collaborateurs de l'IPAL (Xiaokui XIAO - NUS-IPAL et Christophe JOUFFRAIS - CNRS IPAL) et de l'Université de Paris Saclay (Silviu MANIU) pendant le séjour de recherche d'un an (éventuellement étendu à deux ans) de la délégation CNRS qui devrait commencer en septembre 2021.
IIMOSHI, Implicit Inference and Modeling Of Structured Human musical Interaction
Porteur du projet : Philippe Elsing, chercheur au laboratoire STMS
Laboratoire international : Japanese-French Laboratory for Informatics (JFLI), Tokyo (Japon)
Description du projet :
L'improvisation est extrêmement importante en tant que modèle général des interactions humaines, car elle est profondément impliquée dans chaque action humaine, et elle est stratégique dans chaque aspect des situations de communication et d'interaction. Dans sa forme la plus aboutie, l'improvisation est un mélange d'actions structurées, planifiées et dirigées, et de décisions et déviations locales difficilement prévisibles qui optimisent l'adaptation au contexte. En particulier, il est frappant de constater que l'idée d'improvisation est actualisée dans sa forme la plus essentielle et la plus raffinée dans les arts du spectacle, et notamment dans la musique. La musique est donc un terrain privilégié pour étudier cette compétence et développer des modèles et des outils qui peuvent être généralisés à d'autres domaines de l'action humaine.
En parallèle, les modèles génératifs probabilistes ont récemment pris un grand essor. Notamment, des modèles récents de normalisation de flux et de débruitage de modèles de diffusion ont fourni des résultats génératifs impressionnants, tout en permettant un contrôle tout à fait traçable de l'expressivité de la vraisemblance sous-jacente. Bien que certains modèles visent à reproduire des comportements créatifs, leur apprentissage est basé sur l'approximation des propriétés moyennes des ensembles de données, ce qui semble insuffisant pour être qualifié de créatif.
Cette thèse vise à considérer les concepts de création de modes probabilistes dans le contexte de la créativité, où nous cherchons à créer de nouveaux modes dans une distribution donnée. Pour ce faire, la thèse s'appuiera sur des approches d'apprentissage de type " zero-shot " pour analyser la cinématique d'un espace latent formé sur un ensemble donné afin de découvrir les modes manquants d'un autre ensemble. En s'appuyant sur des flux normalisateurs et des modèles de diffusion, nous visons à étudier cette notion de création de modes probabilistes comme proxy de la créativité. Cette thèse sera construite sur, et généralisera, nos travaux précédents sur la régularisation de l'espace latent et la géométrie de l'information. Ces travaux ont posé les bases théoriques pour effectuer un transfert de topologie latente auto-supervisé dans le contexte de la génération musicale, en dotant un modèle d'une analyse réflexive de son propre comportement créatif. Un aspect critique de cette thèse réside dans la définition correcte des mesures d'évaluation des modèles (mesures d'interaction temporelle, amélioration des compétences et transfert). Ce sujet peut avoir un large éventail d'applications, bien au-delà du domaine de la génération musicale.
PER-FLEX, Développement d’un Porte-Electrode Robotisé souple basé sur des mécanismes FLEXibles
Porteur du projet : Philippe Poignet, chercheur au LIRMM
Laboratoire international : IRP JSML, Stanford (États-Unis)
Description du projet :
Les implants cochléaires sont les premières neuroprothèses fonctionnelles à avoir été développées pour les sujets humains. Elles restaurent la perception auditive chez les individus atteints de surdité sévère à profonde. L’implantation de ces prothèses requiert l’insertion d’un porte-électrode dans la cochlée permettant ainsi la stimulation électrique de l’extrémité des fibres du nerf auditif.
Aujourd’hui, l’insertion de ce porte-électrode est une étape critique de la procédure chirurgicale car elle nécessite de faire avancer ce réseau d'électrodes de 1mm de diamètre dans un petit trou (~2mm) de la cochlée appelé la fenêtre ronde. Cette insertion est réalisée en clinique de manière manuelle, en « aveugle » et sans possibilité de contrôle et de correction de trajectoire à l’intérieur de la cochlée. En effet, le porte-électrode est un dispositif souple, passif et très faiblement manipulable. Sa manipulation est réalisée par son extrémité proximale pour le déployer dans la rampe tympanique sans possibilité de contrôler visuellement sa progression. L’absence de contrôle visuel et la faible manipulabilité du porte-électrode sont à l’origine de nombreux dommages causés aux structures cochléaires et la perte consécutive de l’ouïe résiduelle. Un tel risque empêche l’implantation d’implant cochléaire chez les individus atteints de surdité plus légère.
Pour répondre à la problématique de l’absence de contrôle visuel, nous travaillons actuellement, en collaboration avec le service de chirurgie ORL du CHU de Montpellier (F. Venail, PU-PH), sur le guidage du geste d’insertion en proposant des techniques de fusion d’images US/CT utilisant une sonde ultrasonore dédiée et nouvellement conçue (Thèse L. Lavenir, débutée en octobre 2018, financement de la Fondation pour l’Audition).
Dans le cadre de ce projet de thèse, nous souhaitons donc, conjointement avec nos collègues de l’université de Stanford et du CHU de Montpellier, nous intéresser aux verrous scientifiques et techniques liées à la faible manipulabilité du porte-électrode à travers la conception, la modélisation et la commande d’un nouveau type de porte-électrode intra-cochléaire robotisé. Ce porte-électrode sera basé sur la conception et l’intégration de mécanismes flexibles (robotique souple) et sur une modélisation fine des interactions entre le porte-électrode et la cochlée.
Couplé à notre système de navigation intra-cochléaire, cette solution permettra de mettre en place des outils innovants pour le positionnement précis et sûr de l’électrode avec le contrôle des efforts appliqués sur les parois internes de la cochlée. L’aboutissement de ce projet ouvrira la voie à des interventions thérapeutiques plus sûres pour les pathologies de l’oreille interne, telles que l’administration in situ de médicaments ou la thérapie génique qui ne peuvent être réalisées sans risque avec les outils dont les chirurgiens ORL disposent actuellement.
La concrétisation de ce projet, permettra de poursuivre et de renforcer notre collaboration avec l’Université de Stanford dont les travaux sur la robotique souple sont reconnus mondialement. Elle permettra également de renforcer notre activité et visibilité sur le plan national et international dans le domaine de la robotique chirurgicale. Enfin, ce travail profitera de l’environnement de prototypage et de test disponible dans notre laboratoire, mais également de nos étroites collaborations avec les cliniciens du CHU de Montpellier et de la nouvelle faculté de médecine de Montpellier dans laquelle une partie de l’équipe DEXTER du LIRMM est localisée.
ADEVA, Architecture de décision pour véhicule autonome dans un contexte multi-véhicules
Porteuse du projet : Reine Talj-Kfoury
Laboratoire international : Centre de recherche scientifique en ingénierie (CRSI), Hadat - Beyrouth (Liban)
Description du projet :
Le développement de véhicules autonomes (VA) constitue un domaine d’étude et de développement de grand intérêt pour les industriels de l’automobile et pour les académiques.
Plusieurs compétitions ont été organisées autour du VA, durant les dernières décennies, comme les DARPA Challenges aux USA, les compétitions coréennes, les compétitions européennes GCDC, etc. Malgré le développement indéniable des technologies d’automatisation, beaucoup de verrous restent à lever au niveau de l’autonomie décisionnelle qui pourra imiter l’intelligence humaine face à des situations de conduite complexes, impliquant l’interaction avec les autres occupants de la route, en présence d’incertitudes de natures très diverses (incertitudes de perception, du modèle, des intentions des autres, etc.). Les véhicules autonomes et connectés présentent un potentiel important pour la gestion du trafic, l’évitement de situation conflictuelle, et la réduction de la consommation d’énergie.
L’objectif de cette thèse consiste à développer une architecture hiérarchisée traitant différents aspects de sécurité, de confort et d’économie d’énergie, aux niveaux opérationnel et décisionnel.
L’architecture de prise de décision considère les interactions du véhicule avec son environnement dynamique. Certaines situations complexes de conduite seront traitées comme l’intersection et le rondpoint. L’objectif sera de gérer les principaux enjeux de sécurité et de confort, comme l’évitement de collisions et le respect des priorités. L’incertitude sur les intentions des autres occupants de la route sera considérée. Une approche par apprentissage avec des réseaux de neurone sera employée pour gérer certaines interactions multi-véhicules. La collaboration avec l’Université Libanaise (UL) apportera des compétences dans ce domaine appliqué aux systèmes multi-agents.
Le niveau décisionnel sera en interaction continue avec un niveau local de planification de trajectoire, qui consiste à sélectionner une manœuvre locale optimale, adaptée pour un fonctionnement en temps réel dans un environnement dynamique, et qui répond à plusieurs contraintes comme la dynamique du véhicule (stabilité, confort), l’évitement de collision, le code de la route et le suivi d’une trajectoire globale de référence. Cette partie sera basée sur nos travaux antérieurs en collaboration entre l’Heudiasyc et l’UL. A ce niveau, le travail consistera au suivant :
- La planification de chemin (aspect latéral) : une approche réactive sera étendue pour inclure de nouveaux critères de performances, notamment en lien avec la réduction d’énergie.
- La planification d’un profil de vitesse (aspect longitudinal) : associé au chemin pour considérer le confort, la stabilité, ainsi que l’anticipation de certaines manœuvres de freinage/accélération pour optimiser la consommation d’énergie (intersection, arrêt, feu de signalisation, etc.).
Le contrôle des actionneurs pour le suivi de la trajectoire n’est pas dans le scope de cette thèse. Des modules développés par le laboratoire Heudiasyc seront utilisés. Ils sont basés sur des commandes robustes, adaptatives et non-linéaires, comme le mode glissant et l’Immersion & l’Invariance.
Ce projet de thèse s’inscrit dans la continuité de travaux de collaboration antérieurs avec l’UL, dans le domaine du contrôle et de la planification de trajectoire pour véhicule autonome. En plus, cette thèse s’intègre dans le cadre du projet international IRP Adonis (2020-2025), entre le CNRS, l’UTC en France ; et le CNRS-Liban, l’UL au Liban.