Une nouvelle méthode pour déterminer la périodicité des logs
De nombreux systèmes informatiques (téléphones portables, voitures autonomes…) produisent des /logs/ ou /journaux/, c'est-à-dire des fichiers associant un évènement à un instant précis. Être capable de déterminer quand, dans ces journaux qui peuvent être longs, une propriété d'intérêt est vérifiée ou violée, peut se révéler être un véritable défi. Par exemple, « quand le possesseur d'un téléphone portable est-il resté dans cette boutique pendant plus de 20 minutes ? ». Ou bien « à quels instants la propriété "il s'écoule au moins 1 seconde entre deux changements de vitesse consécutifs d'un véhicule autonome" a-t-elle été violée ? » Une collaboration franco-japonaise a permis de mettre en place une nouvelle méthode qui détecte automatiquement s’il y a des éléments de périodicité dans les logs, sans avoir à en donner les spécificités recherchées.
Le problème de supervision des logs devient encore plus difficile en présence d'incertitude au sein des propriétés : la réponse « quand le possesseur d'un téléphone portable est-il resté dans cette boutique pendant plus de p minutes ? » consiste en un ensemble de dates associées à des valeurs de la durée p.
Dans l'article « Offline timed pattern matching under uncertainty », une solution à ce problème a été proposée dans le cadre d'une collaboration franco-japonaise en utilisant la technique du model-checking paramétré, et notamment le logiciel IMITATOR initié à l'ENS Paris-Saclay et développé à l'Université Paris 13.
Il devient alors également possible de vérifier si des comportements périodiques se produisent, sans connaître a priori la valeur de la période. Par exemple : « le possesseur d'un téléphone portable se rend-il dans cette boutique de façon périodique et, si oui, quand et avec quelle fréquence ? »
Un des intérêts de cette technique réside aussi dans son temps d'exécution, en pratique linéaire par rapport à la taille du journal, ce qui est raisonnable comparé à d'autres approches.
Ce travail de supervision est applicable à des domaines industriels tels que la sécurité, les réseaux, l'informatique sociale, les bases de données, ou les systèmes cyber-physiques tels que l'industrie automobile. C’est d’ailleurs dans le cadre de la détection de comportements anormaux dans les journaux produits par des modèles de groupe motopropulseurs pour l'automobile que ce travail a été mené, en collaboration avec le projet japonais ERATO MMSD.
Parmi les projets futurs des auteurs de ces travaux figure le souhait de mener un transfert industriel, notamment dans le domaine en pleine expansion des voitures autonomes.
Publication : Offline timed pattern matching under uncertainty, Étienne André1 , Ichiro Hasuo2 , Masaki Waga2