Un prix de la science ouverte pour la plateforme NORINE, dédiée aux peptides non ribosomiques

Distinctions Informatique

Les peptides non ribosomiques, dont la pénicilline est l’exemple le plus connu, offrent un large panel de propriétés et d’applications. Le projet NORINE, une collaboration entre le Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL - CNRS/Centrale Lille/Université de Lille) et BioEcoAgro (INRAE/Université Jules Verne/Université de Liège/Université de Lille), est une plateforme libre à destination des chercheurs qui étudient ces peptides. Très attaché à ces principes, NORINE a obtenu le prix « science ouverte des données de la recherche » de la part du Ministère de l’enseignement supérieur et de la recherche.

Avec ses 1700 molécules, NORINE1  s’est imposée comme la base de données de référence pour l’étude, l’analyse et la visualisation des peptides non ribosomiques (NRP). Ce projet, conçu par une collaboration entre BioEcoAgro et le laboratoire CRIStAL, touche une large communauté de chercheurs en biologie, biochimie, phytochimie, pharmacologie ou encore en biologie marine.

« Les peptides sont de petites protéines habituellement synthétisées par les ribosomes d’une cellule, à partir d’une vingtaine de variétés d’acides aminés, explique Maude Pupin, maîtresse de conférences à l’Université de Lille et membre du CRIStAL. Cependant, certains sont naturellement fabriqués par des enzymes qui puisent dans plus de cinq cents briques de base : des acides aminés, mais aussi des lipides, des sucres, etc. Ces peptides non ribosomiques sont donc beaucoup plus divers au niveau de leur composition, mais également de leur structure chimique et de leurs propriétés. »

Les NRP offrent un large panel d’activités biologiques intéressantes : antibiotique comme la pénicilline, antirejet de greffes, antitumoral ou anti-inflammatoire notamment. Les NRP contenant des lipides trouvent de leur côté des applications comme surfactants, détergents biologiques ou encore comme biopesticides. Les NRP présentent donc un intérêt majeur pour la recherche, mais les outils informatiques dédiés aux peptides étaient cependant pensés pour les versions ribosomiques, limitées à une vingtaine de briques élémentaires et toujours de structure linéaire. Ce manque a poussé en 2006 à la création de NORINE, avec une publication inaugurale en 2008.

« NORINE est une plateforme logicielle librement accessible aux chercheurs du monde entier, précise Areski Flissi, ingénieur de recherche CNRS au CRIStAL. Elle permet de consulter l’ensemble des molécules de la base de données avec leurs annotations, mais propose également des outils pour leur visualisation, comparaison, recherche par structures ou annotations. »

  • 1NOnRIbosomal peptides, avec l’ajout du suffixe -ine typique des peptides.
Une centaine de chercheurs, ingénieurs ou doctorants sont inscrits et contribuent à NORINE.

Depuis 2015, NORINE s’est ouvert à l’expert sourcing, ce qui a permis d’enrichir la base de données avec l’ajout de nouvelles entrées ou de compléter les annotations existantes. De plus, NORINE propose une API afin d’encore améliorer l’accès à l’ensemble des données de la base via des services Web. En 2019, un outil permettant la collecte semi-automatique de nouveaux NRP à partir d’autres bases externes plus généralistes a été développé.

La même année, la plateforme a plus formellement adopté les principes FAIR1 , pour des données faciles à trouver, accessibles, interopérables et réutilisables. Chaque NRP s’est notamment vu attribuer un identifiant numérique d’objet (Data object identifier, DOI) que l’on retrouve par exemple pour les publications scientifiques. Cela permet de pérenniser les informations avec une adresse qui restera identique même s’il y a des changements sur les serveurs.

« Je pense que nous avons obtenu le prix de la science ouverte des données de la recherche parce que nous nous sommes alignés sur les principes FAIR et que nous sommes particulièrement exigeants sur la qualité des données mises à disposition, avance Maude Pupin. Qu’elles viennent de contributeurs ou qu’elles aient été extraites automatiquement, les données déposées dans NORINE passent par des processus poussés de validation. »

Depuis sa création, la plateforme logicielle NORINE est le fruit d’un travail collaboratif entre des membres du CRIStAL et de BioEcoAgro. L’équipe s’est ensuite étoffée avec des membres de la plateforme de bioinformatique Bilille, qui est elle-même rattachée à l’unité d’appui à la recherche des Plateformes Lilloises en Biologie & Santé (PLBS - CHU Lille/CNRS/Inserm/Institut Pasteur de Lille/Université de Lille), du Service commun de la documentation de l’Université de Lille et du centre de recherche Inria Lille-Nord-Europe.

  • 1Findable, accessible, interoperable, reusable.
Cyclosporin A, molécule utilisée contre le rejet de greffes /© Bonsai Informatics / NORINE

Contact

Areski Flissi
Ingénieur de recherche CNRS au CRIStAL
Maude Pupin
Maîtresse de conférences à l'Université de Lille, membre du CRIStAL