Découverte de patrons lexico-syntaxiques pour l'identification de la relation sémantique entre deux mots.

SIMOUNET, Mathilde (2020) Découverte de patrons lexico-syntaxiques pour l'identification de la relation sémantique entre deux mots. [Mémoire]

[img] Text

Mathilde.SIMOUNET_master1.pdf


Accès : Repository staff only

Télécharger (869kB) | Request a copy
Item Type: Mémoire
Titre dans une autre langue: Discovery of lexico-syntactic patterns for the identification of the semantic relation between two words.
Creators: SIMOUNET, Mathilde
Directeur de recherche: Tanguy, Ludovic
Divisions: UFR Langues, Littératures et Civilisations Etrangères > Département Sciences du langage
Diplôme: M1 Linguistique, Informatique, Technologies du Langage
Subjects: ARTS-LETTRES-LANGUES-PHILOSOPHIE > Langues > Linguistique générale
INFORMATIQUE MATHEMATIQUES TECHNOLOGIES > Informatique > Traitement du texte et du document
INFORMATIQUE MATHEMATIQUES TECHNOLOGIES > Informatique > Informatique et langage
SCIENCES HUMAINES ET SOCIALES > Statistiques
Uncontrolled Keywords: relation sémantique, patrons lexico-syntaxiques, données élicitées
Mots-clés dans une autre langue: semantic relation, lexicon-syntactic patterns, elicited data
Abstract: Ce mémoire s’intéresse à un protocole visant la caractérisation de la relation sémantique entre deux mots. Afin d’aborder la qualification du lien entre deux mots, nous disposons de paires de noms (stimulus–réponse) issues d’une tâche qui consiste à faire produire par des sujets les mots qui leur viennent spontanément à l'esprit à l'évocation d'un mot. La relation sémantique de ces paires a été annotée par des juges experts, mais il a été constaté que l’annotation a posteriori est une tâche difficile et artificielle. En effet, lorsqu’il y a une ambiguïté, il est impossible d’inférer la pensée du sujet qui a produit la réponse et donc de déduire la relation sémantique. Pour dominer cet obstacle, la mise en contexte des paires donne accès à un autre type de renseignement : l’organisation syntaxique, permettant de construire une représentation de la structuration du lexique. L'objectif de ce travail est de vérifier la possibilité de s'appuyer sur la structure de phrases artificielles – recueillies auprès de participants par enquête explicite – pour aborder les liens lexicaux qu’entretiennent deux mots en contexte. Nous proposons un protocole de découverte de patrons lexico-syntaxiques en appliquant deux méthodes indépendantes : déductive, afin de tester des patrons issus de la littérature, et inductive, en exploitant les dépendances syntaxiques qu’offrent les phrases pour extraire des schémas syntaxiques réguliers susceptibles d'être des marqueurs de la relation sémantique. Les résultats permettent d’observer des régularités d’utilisation de certains patrons pour gloser certaines relations sémantiques et indiquent que l’organisation syntaxique permet de désambiguïser l’annotation.
Résumé dans une autre langue: This paper focuses on a protocol aiming at characterising the semantic relation between two words. In order to tackle the semantic links between words, we have at our disposal pairs of words (stimulus – answer) collected from a generation task in which participants had to spontaneously give the words (answer) that would come to mind after hearing another word (stimulus). One or several semantic relation(s) have then been assigned to these pairs by experts. In the case of ambiguities (two or more possible relations for one pair), the annotators stated that the a posteriori annotation of semantic relations is a difficult and artificial task since it is impossible to infer the participant’s thoughts and to deduce the relation from the pair alone. In order to overcome this obstacle, the pairs were used to create sentences. These sentences give access to another type of information: the syntactic organisation, allowing us to build a representation of the structure of the lexicon. The objective of this study is to verify the possibility of using the structure of artificial sentences – gathered from participants during online questionnaires – to investigate the lexical links between two words in context. We propose a protocol to discover lexico-syntactic patterns by implementing two independent methods: deductive, as a means to investigate the distribution of patterns taken from previous studies, and inductive, by using the syntactic dependencies offered by sentences in order to extract regular syntactic patterns likely to indicate a semantic relation. The results show consistencies in the use of certain patterns to gloss certain semantic relations and prove that the syntactic organisation helps disambiguate the annotation of a semantic relation.
URI: http://dante.univ-tlse2.fr/id/eprint/11768