Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence
- Federzoni, Silvia (2019)
Mémoire
Non consultable
-
- Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence
-
- 21 juin 2019
-
- chaîne de référence
- corpus annoté
- coréférence
- évaluation
-
- referring chains
- coreferential chains
- annotated corpora
- evaluation
-
-
Notre mémoire de master 2 s’inscrit dans le contexte d’étude des chaînes de référence, des
maillons qui les constituent et de leur fonctionnement textuel. Ces structures, qui jouent un rôle
fondamental dans la structuration du discours et dans la création des liens de cohésion et de
continuité référentielle, ont suscité l’intérêt de nombreux chercheurs. Certains se focalisent sur le
rôle dans l’organisation du discours (Charolles, 1997), d’autres décrivent les chaînes de référence
et plus particulièrement les expressions référentielles d’un point de vue linguistique (Corblin,
1995 ; Kleiber, 1994). Plusieurs études se focalisent sur les variations des chaînes de référence
et des expressions référentielles en diachronie, en fonction de la langue, ou encore en fonction
du genre textuel (Longo, 2013 ; Schnedecker, 2005, 2014). D’autres travaux encore portent sur
la description des chaînes de référence pour proposer des modélisations à visée informatique,
en vue d’une résolution automatique de la référence, qui reste un enjeu pour de nombreuses
applications du TAL. Nous avons montré que ces études se fondent sur l’exploitation des corpus
annotés par des experts.
Contrairement à ces études, nous avons fondé notre étude sur l’exploitation d’une ressource
annotée par des annotateurs naïfs : la Ressource ANNODIS
1
. Les principales caractéristiques
qui différencient cette Ressource des autres corpus sont le niveau d’expertise des annotateurs
(non-experts
vs
experts), la méthode d’annotation adoptée (descendante, avec un prémarquage
automatique pouvant influencer les annotateurs
vs
ascendante), le degré de précision de la dé-
finition de chaîne fournie aux annotateurs, le modèle d’annotation (simple
vs
complexe) et le
caractère "intuitif" des annotations). Dans ce contexte spécifique, notre objectif était de proposer
une description des chaînes topicales fournie par la Ressource ANNODIS afin d’évaluer et de
comprendre si celles-ci possèdent des caractéristiques proches de celles de chaînes de référence
décrites dans les travaux disponibles. Étant donné la divergence entre les annotations issues de
la Ressource ANNODIS et la littérature, nous utilisons les termes de chaînes topicales et indices
en gardant les termes utilisés dans le guide d’annotation.Notre travail s’est ainsi concentré sur
l’évaluation du décalage entre les chaînes topicales et leurs indices dans la Ressource ANNO-
DIS et les chaînes de référence et leurs maillons
-
Notre mémoire de master 2 s’inscrit dans le contexte d’étude des chaînes de référence, des
Citation bibliographique
Federzoni, Silvia (2019), Évaluation et exploitation de la Ressource ANNODIS pour la détection des chaînes de référence [Mémoire]