Analyse des marqueurs de relations conceptuelles en corpus spécialisé : recensement, évaluation et caractérisation en fonction du domaine et du genre textuel

Lefeuvre, Luce (2017) Analyse des marqueurs de relations conceptuelles en corpus spécialisé : recensement, évaluation et caractérisation en fonction du domaine et du genre textuel. [Thesis]

[img] Version de Diffusion
Text

Luce.Lefeuvre_these_8376.pdf


Accès : Registered users only

Télécharger (3MB) | Request a copy
Item Type: Thesis
Titre en anglais: Analysis of markers of conceptual relation in specialized corpora : identification, evaluation, and description based on domain and text genre
Creators: Lefeuvre, Luce
Directeur de recherche: Condamines, Anne
Doctoral school: CLESCO : Comportement, Langage, Éducation, Socialisation, Cognition
Research unit: Cognition, Langues, Langage, Ergonomie - CLLE
Diplôme: Doctorat en Sciences du Langage
Subjects: ARTS-LETTRES-LANGUES-PHILOSOPHIE > Langues
Uncontrolled Keywords: marqueurs de relations conceptuelles, corpus spécialisé, variation terminologique, genre textuel, extraction d’information
Mots-clés en anglais: markers of conceptual relation, specialized corpora, terminological variation, textual genre, information extraction
Abstract: L’intérêt d’utiliser des marqueurs de relations conceptuelles pour élaborer des ressources terminologiques à maintes fois été souligné, car ils permettent de passer d’un triplet repéré en corpus comme « Terme1 – Marqueur – Terme2 », à un triplet interprété comme « Terme1 – Relation – Terme2 » permettant une représentation sous forme relationnelle des connaissances. Le passage d’un triplet à l’autre soulève néanmoins la question de la stabilité d’un tel lien, indépendamment de tout corpus. Dans cette thèse, nous étudions la variation du fonctionnement des candidats-marqueurs de relation en prenant en compte le domaine et le genre textuel. Pour cela, nous avons constitué la liste des marqueurs des relations d’hyperonymie, de méronymie, et de cause en français et avons analysé le fonctionnement de chacune des occurrences de ces candidats-marqueurs dans un corpus traitant de deux domaines (volcanologie et cancer du sein) et relevant de deux genres textuels (scientifique et vulgarisé). La description systématique des contextes comportant un candidat-marqueur nous a permis de mesurer la précision de chacun des candidats-marqueurs, c’est-à-dire sa capacité à indiquer la relation attendue. Les analyses menées démontrent finalement la pertinence d’intégrer ces paramètres dans la description linguistique des candidats-marqueurs de relations.
English abstract: The use of markers of conceptual relation for building terminological resources has been frequently emphasized. Those markers are used in corpora to detect “Term1 – marker – Term2” triple, which are then interpreted as “Term1 - Conceptual Relation – Term2” triple allowing to represent knowledge as a relational system model. The transition from one triple to another questions the stability of this link, regardless of corpora. In this thesis, we study the variation of the “candidate-markers” of relation taking into account the domain and the text genre. To this end, we identified the French markers for the hyperonym, the meronym and the causal relation, and systematically analyzed their functioning within corpora varying according to the domain (breast cancer vs. volcanology) and the text genre (popular science vs. specialized texts). For each context containing a candidate-marker, we evaluated the capacity of the candidate-marker to really indicate the required relation. Our researches attest to the relevance of taking into account the domain and the text genre when describing the functioning of conceptual relation markers.
URI: http://dante.univ-tlse2.fr/id/eprint/7216