Laura Cantini : un projet ERC Starting Grant à l’interface entre apprentissage automatique et biologie
Les techniques de séquençage à haut débit de cellules uniques génèrent une multitude de données regorgeant d’un savoir encore inexploré. Le projet ERC MULTIview-CELL, porté par Laura Cantini, chargée de recherche CNRS au Département biologie du développement et cellules souches (CNRS/Institut Pasteur) et responsable du groupe « Apprentissage automatique pour la génomique intégrative », mise sur le développement de nouvelles méthodes de machine learning pour mieux comprendre les liens biologiques qui régissent le comportement de nos cellules.
Depuis vingt ans, les techniques de séquençage permettent d'étudier l'information biologique contenue dans notre ADN. Plus récemment, le séquençage à haut débit de cellules uniques a permis d’aller plus loin en caractérisant les profils moléculaires de milliers de cellules. En résulte, une quantité faramineuse d’observations d’une richesse inédite que nous commençons à peine à exploiter. Afin d’acquérir de nouvelles connaissances, le développement de nouveaux outils de traitement de données massives, complexes et en simultané, s’impose.
C’est dans ce cadre que s’intègre le projet MULTIview-CELL1 de Laura Cantini, chargée de recherche CNRS au sein du Département biologie du développement et cellules souches, qui vient d’obtenir un financement ERC Starting Grant, attribuée par le Conseil européen de la recherche. « Mon projet va combiner toutes les informations acquises par les séquençages en vue de prédire le comportement de la cellule dans le temps et l'espace », explique la chercheuse. Pour ce faire, la mathématicienne de formation mettra à profit son expertise à l’interface entre apprentissage automatique et génomique.
Au cours de son projet, Laura Cantini compte, par exemple, adapter des méthodes de transport optimal bien étudiées en mathématiques et sciences informatiques, et au cœur de l’apprentissage automatique – pour suivre l’évolution spatio-temporelle des cellules. Les réseaux multicouches, notamment utilisés dans l’étude des interactions entre les individus par les sciences sociales, lui permettront ici de mettre en évidence des interactions entre les gènes et les mécanismes qui dictent le comportement d’une cellule. « Nous savons qu’il y a un lien entre les différentes données cellulaires (autour de l’ADN, l’ARN, les protéines, etc.), mais nous ne savons pas lequel. Pour le moment, les biologistes utilisent des corrélations ou des mesures simples afin d’illustrer une quantité infime de connexions présentes. Les outils qui seront développés dans mon ERC permettront d’identifier davantage de liens et surtout de les comprendre », précise Laura Cantini.
- 1Single-cell multi-omics integration across space and time to unlock cellular trajectories
Ces méthodes seront ensuite appliquées à l’analyse de cellules-souches musculaires dans le cadre d’une collaboration au sein de l’Institut Pasteur. L’objectif : mieux comprendre comment elles réagissent à des maladies comme le cancer ou le virus influenza. Plus largement, le projet jouera un rôle clé dans la prévention de l'apparition de maladies ou de la résistance aux thérapies, avec des retombées sur la santé, la société et l'économie. Toutes les méthodes développées seront finalement mises en œuvre au sein de logiciels libres.
En plus de ces retombées, le projet interdisciplinaire MULTIview-CELL vise à illustrer par l’exemple l’intérêt de méthodes d’apprentissage automatique en biologie. Il vise ainsi à initier de nouvelles synergies entre les communautés de recherche. « C’est avec une grande satisfaction que j’ai reçue la nouvelle de ce financement ERC. Je dirige une petite équipe depuis janvier 2023 et elle va nous permettre de grandir en termes d’effectifs, d’expertises et d’apporter plus de visibilité à nos travaux interdisciplinaires qui, je pense, sont déterminants pour faire avancer les savoirs, autant en biologie qu’en apprentissage automatique », confie Laura Cantini.