Angeliki Kritikakou : la tolérance aux fautes au service de l’intelligence artificielle

Distinctions Informatique

Nommée membre junior de l’Institut universitaire de France sur une chaire Innovation, Angeliki Kritikakou va approfondir ses travaux sur l’apparition, la propagation et l’effet des fautes matérielles dans les systèmes électroniques. L’intérêt de cette maîtresse de conférences à l’Université de Rennes et membre de l’Institut de recherche en informatique et systèmes aléatoires (IRISA - CNRS/Université de Rennes) se porte sur les systèmes embarqués, notamment lorsqu’ils exécutent des intelligences artificielles.

La fiabilité des systèmes embarqués est son cheval de bataille. Formée à l’école d’ingénieurs de l’université de Patras en Grèce, Angeliki Kritikakou a obtenu son doctorat en collaboration avec l’Institut de microélectronique et composants (IMEC, Belgique). Elle arrive en France en 2013 pour un postdoctorat à l’Office national d’études et de recherches aérospatiales (ONERA), puis est recrutée l’année suivante comme Maîtresse de conférences à l’université de Rennes et membre de l’IRISA.

« J’étudie l’apparition, la propagation et l’effet des fautes qui impactent les composants matériels des systèmes embarqués, puis perturbent les programmes qui tournent dessus, dont les intelligences artificielles, précise Angeliki Kritikakou. Les rayonnements cosmiques peuvent, par exemple, perturber les transistors d’un processeur ou d’une mémoire, entraînant ainsi des bit-flips, c’est-à-dire une modification de leur valeur binaire. »

Tous les systèmes électroniques, y compris les accélérateurs matériels pour l’IA tels que les GPU et les FPGA, sont en effet vulnérables à ces défaillances qui peuvent se propager et donner des résultats incohérents. « Nous avons déjà vu que des algorithmes de détection des objets pour des voitures autonomes peuvent confondre, à cause de fautes matérielles, un camion avec un oiseau, avance Angeliki Kritikakou. De telles erreurs ne sont pas acceptables dans les systèmes embarqués “ critiques ”, c’est-à-dire opérants dans des situations où la sûreté est primordiale, telles que les véhicules autonomes, l’avionique et le domaine médical. »

Les méthodes classiques de tolérance aux fautes ne correspondent pas aux besoins de l’IA.

Les méthodes typiques de tolérance aux fautes, comme la duplication ou la triplication de toutes les opérations, sont trop coûteuses pour les grands systèmes qui exécutent les algorithmes d’IA. En effet, ils nécessitent une quantité massive de transferts de données et de calculs. Angeliki Kritikakou cherche donc des méthodologies aux coûts raisonnables. « Je veux identifier les parties du système plus sensibles aux fautes, notamment les composants qui impactent plus le calcul du résultat, poursuit Angeliki Kritikakou. Pour atteindre cet objectif, il faut analyser l’apparition et la propagation des fautes matérielles. »

Le défi est dans le passage à l’échelle face aux IA, car l’analyse de ces systèmes complexes devient infaisable avec les méthodes traditionnelles, qui prendraient jusqu’à des dizaines d’années.

Elle propose pour cela une analyse qui s’étale sur plusieurs couches d’abstraction du système. Elle et son équipe mènent des expériences où ils irradient avec des neutrons les plateformes électroniques, sur lesquelles tournent des algorithmes d’IA à base de réseaux de neurones. Angeliki Kritikakou couple ensuite ces résultats avec des simulations pour analyser la propagation et l’effet des fautes sur les résultats.

Avec sa nomination comme membre junior de l’Institut universitaire de France (IUF), à une chaire Innovation, Angeliki Kritikakou va pouvoir approfondir ces questions. « Il faut développer un modèle réaliste de fautes de bas niveau, c’est-à-dire qui représente au mieux l’effet d’une faute dans le matériel, et analyser comment elles se propagent à travers les couches d’abstraction du système et impactent les résultats de l’application », précise la chercheuse.

Elle explore ces problématiques dans plusieurs projets en parallèle, comme ses projets FASY, et RE-TRUSTING, tous deux financés par l’Agence nationale de la recherche (ANR). FASY se concentre sur l’étude de la fiabilité des systèmes embarqués critiques, tandis que RE-TRUSTING touche à la fiabilité des accélérateurs matériels pour l’IA, en partenariat avec le groupe Thales, le LIP6 (CNRS/Sorbonne Université) et l’Institut des nanotechnologies de Lyon (INL - CNRS/CPE Lyon/Centrale Lyon/INSA Lyon/Université Claude Bernard). Angeliki Kritikakou est également impliquée dans des partenariats tels qu’avec la Direction générale de l’armement (DGA), sur des sujets liés à la fiabilité des systèmes embarqués pour l’IA.

Contact

Angeliki Kritikakou
Maîtresse de conférences à l'Université de Rennes, membre de l'IRISA