ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2017
PDF

Auteurs

Thiziri Belkacem, Mohand Boughanem, Taoufiq Dkaki, Jose G. Moreno

Résumé

Afin de calculer la similarité document-requête, la majorité des modèles en recherche d’information (RI) représentent les documents et les requêtes sous forme de u sacs de mots » (bag of words) pondérés ou un sac de concepts, issus d’une ontologie linguistique ou construits automatiquement par des techniques de type LSI ou LDA, pour combler l’écart entre le voca- bulaire utilisé par la requête et celui présenté dans les documents. D’autres approches dites word2vec proposent de modéliser les termes sous forme de vecteurs. Les approches word2vec permettent de capturer des relations au-delà de la co-occurrence, nous permettant ainsi de mo- déliser des relations sémantiques entre les termes. Dans cet article, nous présenterons l’état de l’art sur l’usage de ce type d’approches ainsi que notre contribution à l’exploitation de ce type d’approches dans les modèles de la RI.

Abstract

In order to perform the document-query similarity, many information retrieval (IR) models represent documents and queries as sets of weighted key words, called u bag of words », or a bag of concepts derived from a linguistic ontology, or constructed automatically by LSI or LDA techniques, to fill the gap between the query vocabulary and the one used in the doc- ument. Recent approaches propose to model the term as an embedded vector, called word2vec approaches, allowing to capture relations beyond the co-occurrence by modelling semantic re- lations between the terms. In this article, we present the state of the art about this topic, as well as our contribution to integrate these approaches within IR models.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.