ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2013
PDF

Auteurs

Christian Kuoman, Sabrina Tollari, Marcin Detyniecki

Résumé

La recherche d’images est de plus en plus efficace, mais les résultats similaires ont tendance à se regrouper. Dans cet article, nous montrons comment améliorer la diversité des résultats en prenant en compte la nature intrinsèquement hiérarchique de la diversité. Afin d’ex- ploiter les différents niveaux de granularité de la diversité, nous utilisons une approche basée sur une classification ascendante hiérarchique (CAH). De plus, nous introduisons une nouvelle approche qui exploite une arborescence de concepts. Pour éviter le conflit entre pertinence et diversité, les différentes approches sont comparées sur un corpus dédié annoté manuellement où tous les documents sont pertinents, et sur un corpus de l’état de l’art (ImageClef photo 2008). Les résultats montrent que l’approche hiérarchique améliore la diversité des résultats.

Abstract

Current search engines return relevant, but often similar results. In this paper we propose not only to show how to increase the diversity, but also how to address the hierarchical nature of the diversity. To address this challenge, we propose innovative image ordering strate- gies based on an agglomerative hierarchical classification (AHC). Moreover, we introduce a novel approach for exploiting richer description resources, such as “concept trees”. The dif- ferent approaches are compared on a highly relevant and manually annotated benchmark: the Xilopix benchmark; and on the, more general but less adapted, ImageClef2008 benchmark. Any of the proposed approaches increase the diversity (CR20) compared to search engine’s standard output and outperform an average random shuffling (baseline). Furthermore, hierar- chical ordering increases the diversity in all cases, in particular compared to a flat ordering.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.