Caractérisation des sessions de recherche sur le Web : origine des mots ajoutés lors des reformulations

Ibarboure, Claire (2020) Caractérisation des sessions de recherche sur le Web : origine des mots ajoutés lors des reformulations. [Mémoire]

[img] Text

Claire.Ibarboure_master1.pdf


Accès : Repository staff only

Télécharger (1MB) | Request a copy
Item Type: Mémoire
Creators: Ibarboure, Claire
Directeur de recherche: Tanguy, Ludovic
Divisions: UFR Langues, Littératures et Civilisations Etrangères > Département Sciences du langage
Diplôme: M1 Linguistique, Informatique, Technologies du Langage
Subjects: ARTS-LETTRES-LANGUES-PHILOSOPHIE > Langues > Linguistique générale
INFORMATIQUE MATHEMATIQUES TECHNOLOGIES > Informatique > Recherche d'information
INFORMATIQUE MATHEMATIQUES TECHNOLOGIES > Informatique > Web
INFORMATIQUE MATHEMATIQUES TECHNOLOGIES > Informatique > Informatique et langage
SCIENCES HUMAINES ET SOCIALES > Psychologie > Sciences cognitives
Uncontrolled Keywords: Recherche d’information, Provenance, Expertise, Complexité, Reformulation
Mots-clés dans une autre langue: Information retrieval, Provenance, Expertise, Complexity, Reformulation
Abstract: Cette étude s’intéresse à l’analyse automatique de la provenance des termes ajoutés par l’utilisateur au cours d’une session de recherche d’information sur le Web. L’objectif est de définir si les documents visités par l’utilisateur (énoncé, pages de résultats ou encore les pages Web visitées) influencent les reformulations soumises au moteur de recherche en tenant compte de deux facteurs : l’expertise de l’individu et la complexité de la tâche. Une reformulation est définie comme la modification partielle ou totale d’une requête précédente dans l’objectif de répondre à un même besoin d’information. Le jeu de données est constitué à partir d’une étude expérimentale proposée à des groupes d’individus expérimentés et novices avec la consigne de répondre à des tâches de recherche de différentes complexités (simple, multicritère et de production). Les premiers résultats révèlent que les expérimentés utilisent moins les documents visités pour reformuler leurs requêtes, il est donc possible de dire que ces individus reformulent à partir de leurs connaissances. De plus, la complexité de la tâche influence également la reformulation, faisant varier la provenance des termes ajoutés. Pour la résolution des tâches multicritères, les individus expérimentés se servent moins des documents, alors que les novices s’appuient sur les pages de résultats. Les novices produisent des termes provenant des pages Web visitées, notamment pour les tâches de production. De manière générale, la provenance des mots ajoutés varie selon l’expertise de l’individu, mais également la complexité de la tâche.
Résumé dans une autre langue: This study aims to automatically analyse the provenance of added terms by the user during an information retrieval session in the Web. The goal is to define whether the documents visited by the user (wording, SERPs, or the visited Web pages) influence the reformulations submitted to the search engine considering two factors: the person’s expertise and the task’s complexity. A reformulation is defined as the partial or total modification of a precedent request for a same information need. The dataset is constituted from an experimental study submitted to experimented and inexperienced groups to resolve tasks of different complexities (simple tasks, multicriteria tasks and production tasks). The first results show that experienced individuals use fewer words from visited Web pages to rephrase their requests; it is possible to say that these individuals rephrase using their own knowledge. Moreover, the complexity of the task influence the reformulation, varying the provenance of added terms. To resolve multicriteria tasks, experimented individuals use fewer words from visited documents, whereas inexperienced individuals base their reformulations on SERPs. Inexperienced people product terms from visited Web pages, specifically for the production tasks. Generally, added words’ provenance varies according to the individual’s expertise and the task’s complexity.
URI: http://dante.univ-tlse2.fr/id/eprint/11252