Biologie computationnelle : Quentin Garrido obtient un prix de la meilleure publication d’étudiant

Distinctions Informatique

Afin de mieux comprendre la différenciation cellulaire, Quentin Garrido a développé un réseau de neurones artificiels qui permet de visualiser des structures arborescentes dans l’expression des gènes. Ces travaux, menés pendant qu’il était encore en stage de master entre le Laboratoire d'Informatique Gaspard-Monge (LIGM - CNRS/Université Gustave Eiffel) et l’université de Heidelberg (Allemagne), lui valent de recevoir le prix Ian Lawson Von Toch de la part de l’ISCB lors de la conférence ISMB 2022.

Dans la nébuleuse des prix scientifiques, certains sont destinés aux étudiants. Certains ont vu leurs années de master chamboulées par la pandémie, mais cela ne les a pas empêchés de continuer à contribuer au monde de la recherche. Quentin Garrido a ainsi été distingué par l’International society for computational biology (ISCB) lors de la conférence ISMB 2022. L’organisation lui a remis le prix Ian Lawson Von Toch, qui récompense les meilleurs articles scientifiques publiés par des étudiants, pour Visualizing hierarchies in scRNA-seq data using a density tree-biased autoencoder

« Ces travaux sont issus d’un stage lors de mon master 1, en collaboration avec l’université Gustave Eiffel et le Heidelberg collaboratory for image processing de l’université de Heidelberg en Allemagne, précise Quentin Garrido. Ils concernent le séquençage de l’ARN de cellules uniques pour mesurer l’expression des gènes et la visualisation de son évolution lors de la différenciation cellulaire. On veut comprendre ce qu’il se passe en détail lors de processus tels que les infections ou la transformation des cellules souches. »

Ce projet de biologie computationnelle a combiné les méthodes les plus récentes d’apprentissage profond et certaines spécialités du LIGM, comme l’analyse de graphes et d’arborescences. Cette approche vise à conserver les propriétés hiérarchiques des données génétiques des cellules. Ces travaux ont montré qu’elles se séparaient en plusieurs branches, qui pouvaient ensuite se recouper. À l’échelle de cellules uniques, l’équipe a regardé le degré d’expression de chaque gène pour mettre en avant l’existence de ces structures.

Cette approche est plus adaptée à la spécificité des données que dans les pratiques précédentes et donne de meilleurs résultats, tant sur le plan qualitatif que quantitatif.

Quentin Garrido et ses co-auteurs ont notamment mis au point dans ces travaux le système DTAE (density-tree biased autoencoder). Il s’agit d’un auto-encodeur, c’est-à-dire un réseau de neurones artificiels qui encode des ensembles de données. DTAE parvient ainsi à souligner les structures des arborescences dans un espace de faibles dimensions, ce qui permet ici de suivre l’évolution des cellules dans le temps.

« La biologie n’est pas forcément ma spécialité, mais ce projet réunissait des expertises et des centres d’intérêt commun entre l’université Gustave Eiffel et celle de Heidelberg, explique Quentin Garrido. Les conditions étaient très particulières car, comme nous étions en plein Covid, j’ai passé la moitié de mon stage enfermé chez moi avant de pouvoir me rendre en Allemagne. J’ai cependant pu continuer à travailler dessus lors de mon master 2, et on a ainsi pu publier nos résultats. »

Mes stages de master ont confirmé ma volonté de faire de la recherche.

Quentin Garrido est actuellement en doctorat CIFRE sous la direction de Laurent Najman, professeur à l’université Gustave Eiffel et membre du LIGM, ainsi que de Yann LeCun, chercheur chez Meta AI et lauréat du prix Turing. Son sujet de thèse n’est pas en lien direct avec le projet pour lequel il a été récompensé et concerne l’apprentissage autosupervisé à partir de données vidéo, dont on tire davantage d’informations que sur les images fixes et dont la génération et la manipulation réclament en retour d’importants moyens computationnels.

En savoir plus

Garrido, Q., Damrich, S., Jäger, A., Cerletti, D., Claassen, M., Najman, L., & Hamprecht, F. A. (2022). Visualizing hierarchies in scRNA-seq data using a density tree-biased autoencoder. Bioinformatics, 38 (Supplement_1), i316-i324.

Contact

Quentin Garrido
Doctorant à l’université Gustave Eiffel