Caractéristiques et enjeux des mots-clés d'auteurs : pour une terminologie du TAL.

Joyau, Marie (2020) Caractéristiques et enjeux des mots-clés d'auteurs : pour une terminologie du TAL. [Mémoire]

[img] Text

Marie.Joyau_master1.pdf


Accès : Repository staff only

Télécharger (1MB) | Request a copy
Item Type: Mémoire
Creators: Joyau, Marie
Directeur de recherche: Tanguy, Ludovic
Divisions: UFR Langues, Littératures et Civilisations Etrangères > Département Sciences du langage
Diplôme: M1 Linguistique, Informatique, Technologies du Langage
Subjects: ARTS-LETTRES-LANGUES-PHILOSOPHIE > Langues > Linguistique générale
INFORMATIQUE MATHEMATIQUES TECHNOLOGIES > Informatique > Recherche d'information
INFORMATIQUE MATHEMATIQUES TECHNOLOGIES > Informatique > Informatique et langage
SCIENCES HUMAINES ET SOCIALES > Statistiques
Uncontrolled Keywords: Mots-clés d'auteurs, termes, indexation, terminologie
Mots-clés dans une autre langue: Author keywords, terms, indexation, terminology
Abstract: Ce mémoire s’inscrit dans le domaine de la terminologie, et s’intéresse plus précisément à l’apport des mots-clés d’auteurs (MCA) en termes de contenu et aux enjeux qu’ils soulèvent pour constituer et/ou mettre à jour des ressources terminologiques. Nous étudions ici le cas des MCA attribués librement aux articles scientifiques du corpus TALN, dans le but de déterminer leur pertinence pour créer une ressource terminologie du domaine du TAL. En d’autres termes, notre objectif est de définir si les MCA du corpus TALN ont des caractéristiques de termes, selon la définition de L’Homme (2004). Pour y parvenir, nous avons élaboré une méthode d’analyse en deux temps. Nous avons dans un premier temps étudié les caractéristiques des MCA selon leurs formes ainsi que leurs caractéristiques morphologiques. Dans un second temps, nous nous sommes intéressés aux contextes dans lesquels apparaissent les MCA. Nous avons utilisé un outil d’extraction de termes afin de comparer les candidats-termes relevés par l’outil et les MCA, puis nous avons étudié la distribution des MCA dans les éléments des articles scientifiques (titres, résumés et corps de texte). Ces analyses nous ont permis de vérifier notre hypothèse selon laquelle les MCA ont des caractéristiques de termes, et sont en ce sens pertinents et exploitables en terminologie.
Résumé dans une autre langue: This work is part of the terminology field, and we particularly study the contribution of keywords given by authors about content and issues they raised in order to create or update terminology resources. More specifically, this study is about keywords freely assigned by authors to TALN’s scientific articles and their relevance to create a French NLP terminology resource. The aim is to understand if keywords given by authors of TALN’s articles have terms’ characteristics, according to the definition of L’Homme (2004). To achieve this, we have developed a two-step analysis. First, we studied the characteristics of keywords assigned by authors, with their structures and morphological characteristics. Then, we were interested in the context where author keywords appear. We used a term extractor tool to compare terms candidates recorded by this tool and then we studied author keywords’ distribution in the different elements of scientific articles (titles, summary, body text). These analyses allowed us to confirm our hypothesis : keywords given by authors have terms’ characteristics and are relevant and exploitable in terminology.
URI: http://dante.univ-tlse2.fr/id/eprint/10788