Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence

Federzoni, Silvia (2019) Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence. [Mémoire]

[img] Text

Silvia.Federzoni_master2.pdf


Accès : Repository staff only

Télécharger (3MB) | Request a copy
Item Type: Mémoire
Creators: Federzoni, Silvia
Directeur de recherche: Ho-Dac, Lydia-Mai
Divisions: UFR Langues, Littératures et Civilisations Etrangères > Département Sciences du langage
Diplôme: M2 Linguistique, Informatique, Technologies du Langage
Subjects: ARTS-LETTRES-LANGUES-PHILOSOPHIE > Langues > Linguistique générale
Uncontrolled Keywords: chaîne de référence, corpus annoté, coréférence, évaluation
Mots-clés dans une autre langue: referring chains, coreferential chains, annotated corpora, evaluation
Abstract: Notre mémoire de master 2 s’inscrit dans le contexte d’étude des chaînes de référence, des maillons qui les constituent et de leur fonctionnement textuel. Ces structures, qui jouent un rôle fondamental dans la structuration du discours et dans la création des liens de cohésion et de continuité référentielle, ont suscité l’intérêt de nombreux chercheurs. Certains se focalisent sur le rôle dans l’organisation du discours (Charolles, 1997), d’autres décrivent les chaînes de référence et plus particulièrement les expressions référentielles d’un point de vue linguistique (Corblin, 1995 ; Kleiber, 1994). Plusieurs études se focalisent sur les variations des chaînes de référence et des expressions référentielles en diachronie, en fonction de la langue, ou encore en fonction du genre textuel (Longo, 2013 ; Schnedecker, 2005, 2014). D’autres travaux encore portent sur la description des chaînes de référence pour proposer des modélisations à visée informatique, en vue d’une résolution automatique de la référence, qui reste un enjeu pour de nombreuses applications du TAL. Nous avons montré que ces études se fondent sur l’exploitation des corpus annotés par des experts. Contrairement à ces études, nous avons fondé notre étude sur l’exploitation d’une ressource annotée par des annotateurs naïfs : la Ressource ANNODIS 1 . Les principales caractéristiques qui différencient cette Ressource des autres corpus sont le niveau d’expertise des annotateurs (non-experts vs experts), la méthode d’annotation adoptée (descendante, avec un prémarquage automatique pouvant influencer les annotateurs vs ascendante), le degré de précision de la dé- finition de chaîne fournie aux annotateurs, le modèle d’annotation (simple vs complexe) et le caractère "intuitif" des annotations). Dans ce contexte spécifique, notre objectif était de proposer une description des chaînes topicales fournie par la Ressource ANNODIS afin d’évaluer et de comprendre si celles-ci possèdent des caractéristiques proches de celles de chaînes de référence décrites dans les travaux disponibles. Étant donné la divergence entre les annotations issues de la Ressource ANNODIS et la littérature, nous utilisons les termes de chaînes topicales et indices en gardant les termes utilisés dans le guide d’annotation.Notre travail s’est ainsi concentré sur l’évaluation du décalage entre les chaînes topicales et leurs indices dans la Ressource ANNO- DIS et les chaînes de référence et leurs maillons
URI: http://dante.univ-tlse2.fr/id/eprint/9175