Nouvelles approches évolutionnaires pour des algorithmes interprétables de vision par ordinateur pour les systèmes embarqués
- Biau, Julien (1983-....) (2022)
Thèse
Accès libre
-
- Nouvelles approches évolutionnaires pour des algorithmes interprétables de vision par ordinateur pour les systèmes embarqués
-
- New evolutionary approaches for interpretable computer vision algorithms for embedded systems
-
- 15 juin 2022
-
- Réseaux de neurones profonds
- Stratégie évolutionnaire
- CGP
- Systèmes embarqués
- Temps réel
- Application industrielle
- Multiobjectif
- Filtre sur images
-
- Deep neural networks
- Evolutionary strategy
- CGP
- Embedded systems
- Real time
- Industrial application
- Multi-objective
- Image filters
-
-
Depuis quelques années, l'émergence des réseaux de neurones profonds a permis d'outrepasser l'état de l'art en matière d'analyse d'images. Ils sont aujourd'hui utilisés dans de multiples domaines, du commerce à la santé en passant par l'industrie. Seulement leurs précisions ont un coût : une puissance de calcul très élevée rendant leur utilisation sur des cartes électroniques embarquées très complexe voire impossible.
Ces travaux de thèse visent à proposer des solutions alternatives efficaces permettant de lever ce verrou.
Une nouvelle méthode d'extraction et de catégorisation d'objets en mouvement dans les vidéos est proposée. Cette méthode s'exécutant sur une carte électronique embarquée dans un luminaire a été développée en proposant un pipeline à deux étages : la première phase permet la création d'un ensemble de données issues de vidéos et l'apprentissage d'un modèle LSTM tandis que la seconde utilise ce même modèle pour catégoriser les objets. L'utilisation de méta données en lieu et place des images a permis ici une réduction drastique du coup de calcul nécessaire pour une précision équivalente.
Une adaptation du framework CGP-IP a été créée et optimisée pour l'amélioration génétique, permettant une meilleure conservation de la structure du graphe. Elle a permis, sur des filtres à images réalisés par des experts, d'obtenir une meilleure précision en un nombre inférieur de générations.
Afin de mieux contrôler la puissance de calcul nécessaire sur des processeurs limités, le framework CGP-IP-GI a été modifié avec un algorithme multiobjectif de type NSGA2. Il a ainsi permis, sur un filtre développé par des experts, de diviser la puissance de calcul nécessaire par cinq pour une perte de la précision de seulement cinq pour cent.
Les travaux présentés ont donc permis d’adresser plusieurs objectifs. D’un point de vue computationnel, ils proposent des algorithmes permettant d'obtenir des résultats de l'état de l'art sur des processeurs à puissance de calcul limité. D’un point de vue de l’exploitabilité des résultats, l'utilisation de la programmation génétique a permis le développement d'applications et de filtres d'images interprétables. Enfin nous avons montré qu’un algorithme multiobjectif permet de moduler la puissance de calcul tout en obtenant des résultats probants.
-
Depuis quelques années, l'émergence des réseaux de neurones profonds a permis d'outrepasser l'état de l'art en matière d'analyse d'images. Ils sont aujourd'hui utilisés dans de multiples domaines, du commerce à la santé en passant par l'industrie. Seulement leurs précisions ont un coût : une puissance de calcul très élevée rendant leur utilisation sur des cartes électroniques embarquées très complexe voire impossible.
-
-
In recent years, the emergence of deep neural networks have made it possible to go beyond the state of the art in terms of image analysis. They are used today in many fields, from commerce to health and industry. However their precision has a cost: a very high computing power making their use on embedded electronic cards very complex or even impossible.
This thesis aims to propose effective alternative solutions to overcome this lock.
A new method for extracting and categorizing moving objects in videos is proposed. This method running on an electronic card embedded in a luminaire was developed by proposing a two-stage pipeline: the first phase allows the creation of a set of data from videos and the learning of an LSTM model while the second uses this same model to categorize objects. The use of metadata instead of images has here allowed a drastic reduction in the computational cost required for equivalent precision.
An adaptation of the framework CGP-IP has been created optimized for genetic improvement allowing better conservation of the graph structure. It has enabled image filters made by experts to obtain better precision in a lower number of generations.
In order to better control the necessary computing power on limited processors, the framework CGP-IP-GI has been modified with a multi-objective algorithm of the NSGA-II type. It thus allowed on a filter developed by experts to divide the necessary computing power by five for a loss of precision of only five percent.
The works presented have therefore made it possible to address several objectives: From a computational point of view, they propose algorithms making it possible to obtain state-of-the-art results on processors with limited computing power. From a point of view of the exploitability of the results, the use of genetic programming has allowed the development of applications and interpretable image filters. Finally, we have shown that a multi-objective algorithm makes it possible to modulate the computing power while obtaining convincing results.
-
In recent years, the emergence of deep neural networks have made it possible to go beyond the state of the art in terms of image analysis. They are used today in many fields, from commerce to health and industry. However their precision has a cost: a very high computing power making their use on embedded electronic cards very complex or even impossible.
Citation bibliographique
Biau, Julien (1983-....) (2022), Nouvelles approches évolutionnaires pour des algorithmes interprétables de vision par ordinateur pour les systèmes embarqués [Thèse]