ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2004
PDF

Auteurs

Haïfa Zargayouna

Résumé

Les documents semi-structurés comme les documents XML présentent l’avantage de posséder une structure explicite qui facilite leur présentation et leur exploitation dans dif- férents contextes. Cependant, très souvent, la majeure partie de l’information reste contenue dans les champs textuels. Il est donc devenu primordial de concevoir des méthodes permettant d’exploiter à la fois la structure et le contenu textuel de ces documents. Les techniques clas- siques de Recherche d’Information (RI) n’utilisent pas ou peu la structure des documents alors que les langages de requête issus de la communauté Bases de Données (BD) n’exploitent pas le contenu textuel et ne permettent pas une présentation des résultats par ordre de pertinence. De plus en plus de chercheurs essaient de combiner les approches de RI et de BD pour pallier leurs limites respectives. Dans ce travail, nous présentons une structure d’index qui permet des requêtes structurées et une présentation des résultats par ordre de pertinence. Pour cela, nous avons étendu le modèle vectoriel de Salton pour une vue bi-dimensionnelle du document en adaptant le calcul du TF-IDF. Par ailleurs, nous proposons d’utiliser une ontologie reliée aux termes du corpus pour modéliser la notion de voisinage sémantique à l’aide d’un calcul de simi- larité entre termes. Cette indexation permet donc une recherche contextuelle (par la structure) et sémantique (par l’ontologie).

Abstract

None

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.