Détection d’anomalies multiples par apprentissage automatique de règles dans les séries temporelles
- Ben Kraiem, Ines (2021)
Thèse
Accès restreint
-
- 2021TOU20017
-
- Détection d’anomalies multiples par apprentissage automatique de règles dans les séries temporelles
-
- Detection of multiple anomalies by the automatic learning of rules in time series
-
- Ben Kraiem, Ines
-
- 29 janvier 2021
-
- Détection d'anomalies
- Séries temporelles
- Apprentissage automatique
- Motifs
- Règles de décision
-
- Anomaly detection
- Time series
- Machine learning
- Pattern
- Decision rules
-
-
Dans cette thèse, nous avons focalisé sur l'utilisation de techniques d’apprentissage automatique dans le but d'automatiser et de consolider le processus de détection des anomalies dans les données de réseaux de capteurs. Ces données proviennent de capteurs se présentent sous forme de séries temporelles. Pour ce faire, nous avons défini deux objectifs principaux: la détection d'anomalies multiples et la génération de règles interprétables par l’être humain pour la détection d'anomalies.
Le premier objectif consiste à détecter différents types d’anomalies dans les données de capteurs.
Dans les travaux de recherche existants, il existe un travail approfondi sur la détection d'anomalies. Cependant, la plupart des techniques recherchent des objets individuels qui sont différents des objets normaux ou bien des séquences de données, mais ne prennent pas en compte la détection de multiples anomalies.
Pour résoudre cette problématique et atteindre notre premier enjeu, nous avons créé un système configurable de détection d'anomalies multiples qui est basé sur des motifs pour détecter les anomalies dans les séries temporelles.
L’algorithme que nous proposons, Composition of Remarquable Point (CoRP), est basé sur le principe de recherche de motifs. Cet algorithme applique un ensemble de motifs afin d’annoter les points remarquables dans une série temporelle uni-variée, puis détecte les anomalies par composition de motifs. Les motifs d’annotation et les compositions de motifs sont définis avec l’aide de l’expert du domaine. Notre méthode a l'avantage de localiser et de catégoriser les différents types d'anomalies détectées.
Le deuxième objectif de la thèse est la génération de règles interprétables et intelligibles par les experts pour la détection d’anomalies. Pour ceci, nous avons proposé un algorithme, Composition based Decision Tree (CDT), qui permet de produire automatiquement des règles ajustables et modifiables par les experts. Pour ce faire, nous avons conçu une modélisation variable des motifs de détection des points remarquables pour labéliser les séries temporelles. Sur la base de la série temporelle étiquetée, un arbre de décision est construit en considérant les nœuds comme des compositions de motifs. Enfin, l'arbre est converti en un ensemble de règles de décision, compréhensibles par les experts. Nous avons aussi défini une mesure de qualité pour les règles produites.
-
Dans cette thèse, nous avons focalisé sur l'utilisation de techniques d’apprentissage automatique dans le but d'automatiser et de consolider le processus de détection des anomalies dans les données de réseaux de capteurs. Ces données proviennent de capteurs se présentent sous forme de séries temporelles. Pour ce faire, nous avons défini deux objectifs principaux: la détection d'anomalies multiples et la génération de règles interprétables par l’être humain pour la détection d'anomalies.
-
-
In this thesis, we focused on the use of automatic learning techniques in order to automate and consolidate the process of detecting anomalies in sensor network data. These data come from sensors and are presented in the form of time series. To do this, we have defined two main objectives: the detection of multiple anomalies and the generation of interpretable rules by humans for the detection of anomalies
The first objective is to detect different types of anomalies in the sensor data.
In the existing research, there is extensive work on anomaly detection. However, most techniques look for individual objects that are different from normal objects or a sequence of data but do not take into consideration the detection of multiple anomalies.
To solve this problem and reach our first issue, we have created a configurable multiple anomaly detection system that is based on patterns to detect anomalies in time series.
The algorithm we propose, Composition of Remarquable Point (CoRP), is based on the principle of pattern search. This algorithm applies a set of patterns to annotate remarkable points in a uni-varied time series, then detects anomalies by pattern composition. Annotation patterns and pattern compositions are defined with the help of the subject matter expert. Our method has the advantage of locating and categorizing the different types of anomalies detected.
The second objective of the thesis is the generation of rules that can be interpreted and understood by experts for the detection of anomalies. For this, we have proposed an algorithm, Composition based Decision Tree (CDT), which automatically produces rules that can be adjusted and modified by experts. To do this, we have designed variable modeling of the detection patterns of remarkable points to label the time series. Based on the labeled time series, a decision tree is constructed by considering the nodes as compositions of patterns. Finally, the tree is converted into a set of decision rules, understandable by experts. We have also defined a quality measure for the rules produced.
-
In this thesis, we focused on the use of automatic learning techniques in order to automate and consolidate the process of detecting anomalies in sensor network data. These data come from sensors and are presented in the form of time series. To do this, we have defined two main objectives: the detection of multiple anomalies and the generation of interpretable rules by humans for the detection of anomalies
-
- Accès restreint
Citation bibliographique
Ben Kraiem, Ines (2021), Détection d’anomalies multiples par apprentissage automatique de règles dans les séries temporelles [Thèse]