ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2006
PDF

Auteurs

Siham Boulaknadel

Résumé

Dans un contexte riche, un système de recherche d’information doit être capable de trouver les meilleurs résultats possibles. Dans ce but, notre étude s’intéresse aux connaissances qui peuvent être extraites du contenu textuel des documents en associant la finesse d’analyse d’une approche linguistique à la capacité d’une approche statistique traitant des corpus de grandes tailles. L’approche statistique se base sur la fouille de données textuelles et principalement sur la technique d’analyse sémantique latente tandis que l’approche linguistique se base sur les syntagmes nominaux que nous considérons comme des entités textuelles plus susceptibles de représenter l’information contenue dans le texte que les termes simples. Par une expérimentation, sur une collection de documents arabes spécialisés dans le domaine de l’environnement nous montrons l’impact de l’utilisation des syntagmes nominaux sur la précision d’un système de recherche d’information.

Abstract

In a rich information context, an information retrieval system must be able to ensure the best results. For this, the aim of our study consists in extracting the knowledge based on document textual contents by associating the analysis smoothness of a linguistic approach to the statistical approach capacity treating large corpus. The statistical approach is based on text mining mainly on the latent semantic analysis technique, while the linguistic approach is based on the noun phrases which are more susceptible to be used like textual entities in representing the text information than the simple terms. By experimentation in Arabic documents, specialized in the environment field, we show the use of noun phrase impact on the information retrieval system precision.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.