Auteurs
Résumé
Cet article décrit un cadre expérimental et des résultats obtenus pour la recherche de microblogs. Notre approche consiste à étudier de quelle manière l’apport de l’utilisation de plongements de mots, très populaire actuellement en recherche d’information, est dépendant de l’ensemble d’apprentissage de ces plongements. Nous étudions en particulier son utilisation pour étendre des requêtes sur des tweets culturels sur le corpus CLEF CMC 2016. Nos résultats montrent que l’utilisation de corpus spécifiques (au niveau sujet ou bien sujet+type de document) ne fournit pas forcément de meilleurs résultats.
Abstract
We describe here an experimental framework and the results obtained on microblogs retrieval. We study the contribution one popular approach, i.e., words embeddings, depends on the learning set used to train the embeddings. We focus on query expansion for the retrieval of tweets on the CLEF CMC 2016 corpus. We find that specific corpus regarding topicality and document types does not always lead to better results.