Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence

Federzoni, Silvia (2019)

Mémoire

Non consultable

Titre en français: Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence
Auteur: Federzoni, Silvia
Directeur de recherche: Ho-Dac, Lydia-Mai
Co-directeur de recherche: Rebeyrolle, Josette
Date de soutenance: 21 juin 2019
Établissement: Université Toulouse-Jean Jaurès
UFR ou composante: Département Sciences du langage
Diplôme: M2 Linguistique, Informatique, Technologies du Langage
Sujet: Linguistique générale
Mots-clés en français: chaîne de référence; corpus annoté; coréférence; évaluation
Mots-clés: referring chains; coreferential chains; annotated corpora; evaluation
Résumé en français: Notre mémoire de master 2 s’inscrit dans le contexte d’étude des chaînes de référence, des
maillons qui les constituent et de leur fonctionnement textuel. Ces structures, qui jouent un rôle
fondamental dans la structuration du discours et dans la création des liens de cohésion et de
continuité référentielle, ont suscité l’intérêt de nombreux chercheurs. Certains se focalisent sur le
rôle dans l’organisation du discours (Charolles, 1997), d’autres décrivent les chaînes de référence
et plus particulièrement les expressions référentielles d’un point de vue linguistique (Corblin,
1995 ; Kleiber, 1994). Plusieurs études se focalisent sur les variations des chaînes de référence
et des expressions référentielles en diachronie, en fonction de la langue, ou encore en fonction
du genre textuel (Longo, 2013 ; Schnedecker, 2005, 2014). D’autres travaux encore portent sur
la description des chaînes de référence pour proposer des modélisations à visée informatique,
en vue d’une résolution automatique de la référence, qui reste un enjeu pour de nombreuses
applications du TAL. Nous avons montré que ces études se fondent sur l’exploitation des corpus
annotés par des experts.
Contrairement à ces études, nous avons fondé notre étude sur l’exploitation d’une ressource
annotée par des annotateurs naïfs : la Ressource ANNODIS
1
. Les principales caractéristiques
qui différencient cette Ressource des autres corpus sont le niveau d’expertise des annotateurs
(non-experts
vs
experts), la méthode d’annotation adoptée (descendante, avec un prémarquage
automatique pouvant influencer les annotateurs
vs
ascendante), le degré de précision de la dé-
finition de chaîne fournie aux annotateurs, le modèle d’annotation (simple
vs
complexe) et le
caractère "intuitif" des annotations). Dans ce contexte spécifique, notre objectif était de proposer
une description des chaînes topicales fournie par la Ressource ANNODIS afin d’évaluer et de
comprendre si celles-ci possèdent des caractéristiques proches de celles de chaînes de référence
décrites dans les travaux disponibles. Étant donné la divergence entre les annotations issues de
la Ressource ANNODIS et la littérature, nous utilisons les termes de chaînes topicales et indices
en gardant les termes utilisés dans le guide d’annotation.Notre travail s’est ainsi concentré sur
l’évaluation du décalage entre les chaînes topicales et leurs indices dans la Ressource ANNO-
DIS et les chaînes de référence et leurs maillons
Accès au document: Non consultable

Citation bibliographique

Federzoni, Silvia (2019), Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence [Mémoire]

Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence

Citation bibliographique

Ce document est en accès restreint