Classification et analyse de l'expression des problèmes techniques
- Cassam Sulliman, Shaad (2023)
Mémoire
Accès libre
-
- Classification et analyse de l'expression des problèmes techniques
-
- 26 juin 2023
-
- TAL
- traitement automatique des langues
- corpus
- CMR
- classification
- problèmes techniques
- expression
- français écrit
- typologie
- python
- stanza
- commentreparer.com
- CoCoRep
- TXM
- catégorisation
- annotation
- automatisation
- REX
- retour d'expérience
- fiche d'anomalie
-
- NLP
- natural language processing
- corpus
- CMC
- classification
- technical issues
- expression
- written french
- typology
- python
- stanza
- commentreparer.com
- CoCoRep
- TXM
- categorisation
- annotation
- automatisation
- experience feedback
- lessons learned document
-
-
Ce mémoire de recherche de M1, portant sur l'étude de l'expression du problème technique, a pour objectif la création d'un système de classification automatique de l'expression des problèmes techniques dans un corpus de CMR (Communication Médiée par les Réseaux).
L'étude prend pour point de départ le travail de thèse de Mariame Maarouf qui vise à catégoriser les expressions des problèmes techniques dans le domaine spatial, concernant les lanceurs Ariane. Ces données étant confidentielles, nous récupérons des données similaires et utilisables. Les données utilisées, et formant le corpus CoCoRep, proviennent d'un forum d'aide à la réparation, et sont constituées d'expressions de problèmes techniques rencontrés par des particuliers.
La création du système de catégorisation se base sur la création d'une typologie de l'expression du problème technique adaptée à nos données. A partir de cette typologie, les marqueurs lexicaux et syntaxiques formels sont dégagés pour chaque catégorie, de façon à les transformer en règles suivies par le système.
L'annotation externe, évaluée grâce à un accord inter-annotateur, nous permet d'évaluer le système automatique de façon fiable en fonction des catégories, et d'observer les règles plus ou moins pertinentes utilisées pour la catégorisation. Ce système permet ensuite d'observer la répartition des catégories sur l'entièreté des données de CoCoRep.
-
Ce mémoire de recherche de M1, portant sur l'étude de l'expression du problème technique, a pour objectif la création d'un système de classification automatique de l'expression des problèmes techniques dans un corpus de CMR (Communication Médiée par les Réseaux).
Citation bibliographique
Cassam Sulliman, Shaad (2023), Classification et analyse de l'expression des problèmes techniques [Mémoire]