ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2010
PDF

Auteurs

Lynda Said L'Hadj, Mohand Boughanem, Karima Amrouche

Résumé

La majorité des modèles de langue appliqués à la recherche d’information repose sur l’hypothèse d’indépendance des mots apparaissant dans les documents et les requêtes. Plus précisément, ces modèles sont estimés à partir des mots simples sans considérer les éventuelles relations sémantiques et conceptuelles. Pour pallier ce problème, deux grandes approches ont été explorées : la première intègre des dépendances d’ordre surfacique entre les mots (bi-grammes, bi-termes), et la seconde repose sur l’utilisation des ressources sémantiques pour capturer les dépendances entre les mots. Le modèle de langue que nous présentons dans cet article s’inscrit dans la seconde approche. Nous proposons de lever la contrainte d’indépendance des mots par une représentation des documents et requêtes intégrant les concepts qu’ils recèlent.

Abstract

The majority of language models applied to information retrieval is based on word independence hypothesis. More precisely, those models are estimated without considering semantic or conceptual relations between those words. To palliate this problem, two principal approaches have been explored: the first one integrates syntactic dependencies between words (bi-grams, bi-terms) and the second approach is based on the use of semantic resources to integrate words dependencies. The language model proposed in this paper is in the second approach. We propose to relax the independence terms constraint by representing both documents and queries with concepts.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.