Catégorisation automatique d’actes de communication Les fils de discussion des pages de discussion Wikipédia

Birski, Anouk (2017) Catégorisation automatique d’actes de communication Les fils de discussion des pages de discussion Wikipédia. [Mémoire]

[img]
Preview
Text

birski_anouk_M12017.pdf


Télécharger (1MB) | Preview
Item Type: Mémoire
Creators: Birski, Anouk
Directeur de recherche: Ho-dac, Lydia-Mai
Divisions: UFR Langues, Littératures et Civilisations Etrangères > Département Sciences du langage
Diplôme: M1 Linguistique, Informatique, Technologies du Langage
Subjects: INFORMATIQUE MATHEMATIQUES TECHNOLOGIES > Informatique > Informatique et langage
Uncontrolled Keywords: Wikipédia, discussion, interactions
Abstract: Ce mémoire s’intéresse aux différents profils d’interactions qui peuvent être générés dans un contexte collaboratif d’écriture dans les pages de discussion de la Wikipédia, sous la forme de fils de discussion. Nous proposons une méthodologie afin d’identifier et tenter de catégoriser semi automatiquement les différents types d’interactions. Cette méthodologie s’articule en deux grandes étapes : l’analyse outillée et l’observation. L’analyse outillée des fils de discussion consiste à établir un ensemble de traits, et de les calculer pour chaque fil de discussion. Les traits peuvent être relatifs à des caractéristiques quantitatives globales du fil (e.g. nombre de messages du fil, nombre d’utilisateurs du fil), à des caractéristiques quantitatives du contenu du fil (e.g. nombre total de mots du fil, nombre moyen de mots par message, nombre moyen de messages postés par utilisateur), ou bien à des caractéristiques plus spécifiques, linguistiques ou temporelles (e.g. symétrie de la répartition des tours de parole, taux de phrases exclamatives, étendue temporelle moyenne entre chaque message). Cette analyse facilite ensuite l’exploration des données à travers des sous ensembles établis à partir de certains seuils de traits. Ainsi, les fils de discussion compris dans certains intervalles de certains traits peuvent être isolés afin d’en annoter un échantillon, et de définir si il existe assez de similarités entre les fils de discussion annotés pour établir un profil particulier d’interaction En nous basant sur cette méthodologie nous avons fait ressortir onze profils d’interaction au fil des différentes observations, et à partir d’ensembles de traits, trois exactement, qui ont évolué tout au long de l’étude. Ces profils peuvent se répartir dans trois catégories : dépourvus d'interaction, peu d'interaction, et ébauche d'un profilage plus précis basé sur des traits plus fins.
URI: http://dante.univ-tlse2.fr/id/eprint/4529