Catégorisation automatique d’actes de communication Les fils de discussion des pages de discussion Wikipédia
- Birski, Anouk (2017)
Mémoire
Accès libre
-
-
Catégorisation automatique d’actes de communication
Les fils de discussion des pages de discussion Wikipédia
-
Catégorisation automatique d’actes de communication
-
- 29 juin 2017
-
- Wikipédia
- discussion
- interactions
-
-
Ce mémoire s’intéresse aux différents profils d’interactions qui peuvent être générés dans un contexte collaboratif d’écriture dans les pages de discussion de la Wikipédia, sous la forme de fils de discussion. Nous proposons une méthodologie afin d’identifier et tenter de catégoriser semi automatiquement les différents types d’interactions. Cette méthodologie s’articule en deux grandes étapes : l’analyse outillée et l’observation.
L’analyse outillée des fils de discussion consiste à établir un ensemble de traits, et de les calculer pour chaque fil de discussion. Les traits peuvent être relatifs à des caractéristiques quantitatives globales du fil (e.g. nombre de messages du fil, nombre d’utilisateurs du fil), à des caractéristiques quantitatives du contenu du fil (e.g. nombre total de mots du fil, nombre moyen de mots par message, nombre moyen de messages postés par utilisateur), ou bien à des caractéristiques plus spécifiques, linguistiques ou temporelles (e.g. symétrie de la répartition des tours de parole, taux de phrases exclamatives, étendue temporelle moyenne entre chaque message).
Cette analyse facilite ensuite l’exploration des données à travers des sous ensembles établis à partir de certains seuils de traits. Ainsi, les fils de discussion compris dans certains intervalles de certains traits peuvent être isolés afin d’en annoter un échantillon, et de définir si il existe assez de similarités entre les fils de discussion annotés pour établir un profil particulier d’interaction
En nous basant sur cette méthodologie nous avons fait ressortir onze profils d’interaction au fil des différentes observations, et à partir d’ensembles de traits, trois exactement, qui ont évolué tout au long de l’étude. Ces profils peuvent se répartir dans trois catégories : dépourvus d'interaction, peu d'interaction, et ébauche d'un profilage plus précis basé sur des traits plus fins.
-
Ce mémoire s’intéresse aux différents profils d’interactions qui peuvent être générés dans un contexte collaboratif d’écriture dans les pages de discussion de la Wikipédia, sous la forme de fils de discussion. Nous proposons une méthodologie afin d’identifier et tenter de catégoriser semi automatiquement les différents types d’interactions. Cette méthodologie s’articule en deux grandes étapes : l’analyse outillée et l’observation.
Citation bibliographique
Birski, Anouk (2017), Catégorisation automatique d’actes de communication Les fils de discussion des pages de discussion Wikipédia [Mémoire]