Expansion de requêtes à base de motifs et de Word Embeddings pour améliorer la recherche de microblogs

Meryem Bendella, Mohamed Quafafou

COnférence en Recherche d'Informations et Applications - CORIA 2019, 16th French Information Retrieval Conference. Lyon, France, May 25-29, 2019.


RÉSUMÉ. Les services sociaux de microblogging jouent un rôle important dans notre société. Twitter est l'une des plateformes de microblogging les plus populaires, utilisées par les in- ternautes pour trouver des informations pertinentes (sujets d'actualité, tendances populaires, informations sur certains internautes, etc.). Dans ce contexte, la recherche d'information pro- venant de telles données a récemment gagné un intérêt majeur et ouvert de nouveaux défis. Cependant, la taille de ces données ainsi que des requêtes est généralement courte et peut avoir un impact sur le résultat de la recherche. Cette dernière peut être améliorée à l'aide de l'expan- sion de requêtes. En effet, les mots peuvent avoir plusieurs sens dont un seul est utilisé pour un contexte donné. Dans cet article, nous proposons une méthode d'expansion de requêtes prenant en compte le sens du contexte. Nous utilisons les motifs et les plongements de mots pour étendre les requêtes des utilisateurs. L'évaluation expérimentale de la méthode proposée est menée sur la collection TREC. Les résultats montrent l'efficacité de l'approche en combinant des motifs avec des plongements de mots pour améliorer significativement la recherche de microblogs.

ABSTRACT. Social microblogging services have an especially significant role in our society. Twit- ter is one of the most popular microblogging sites used by people to find relevant information (e.g., breaking news, popular trends, information about people of interest, etc). In this context, retrieving information from such data has recently gained growing attention and opening new challenges. However, the size of such data and queries is usually short and may impact the search result. Query Expansion (QE) has a main task in this issue. In fact, words can have different meanings where only one is used for a given context. In this paper, we propose a QE method by considering the meaning of the context. Thus, we use patterns and Word Embed- dings to expand users' queries. We experiment and evaluate the proposed method on the TREC dataset. Results show the effectiveness of the proposed approach and signify the combination of patterns and word embedding for enhanced microblog retrieval.

MOTS-CLÉS : Expansion de requêtes, Motifs, Plongements de mots, Recherche de microblogs

KEYWORDS: Query expansion, Patterns, Word Embeddings, Microblog retrieval


fichier Fichier

Identifiant : doi:10.24348/coria.2019.CORIA_2019_paper_16

Citation:

@inproceedings{coria/2019/CORIA_2019_paper_16,
author = {Meryem Bendella and Mohamed Quafafou},
title = {Expansion de requêtes à base de motifs et de Word Embeddings pour améliorer la recherche de microblogs},
booktitle = {COnférence en Recherche d'Informations et Applications - CORIA 2019, 16th French Information Retrieval Conference. Lyon, France, May 25-29, 2019. Proceedings},
pages = {},
year = {2019},
doi = {doi:10.24348/coria.2019.CORIA_2019_paper_16}
}