ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2008
PDF

Auteurs

Sabrina Tollari, Hervé Glotin

Résumé

Dans cet article, nous proposons une méthode pour améliorer la recherche d’images sur le web dans le cas de requêtes bimodales composées de quelques mots et de quelques images. Pour chaque page web et chaque requête, une moyenne pondérée fusionne les distances textuelles basées sur tfidf et les distances visuelles. Nous montrons alors que cette recherche bi- modale d’images peut être optimisée en analysant simplement des images récupérées en ligne par des requêtes purement textuelle sur un moteur classique de recherche d’images sur le web. Nous approximons alors une Analyse Linéaire Discriminante (ALDA) sur ces images de déve- loppement pour estimer le sous-ensemble de traits optimaux de chaque requête traitée. Nous testons notre méthode sur la campagne Techno-Vision ImagEVAL (notre équipe s’y est classée 2nde sur 4), avec 700 URLs (700 pages web et 10k images). Nous discutons le comportement des résultats des requêtes en fonction du taux de texte dans la fusion. Les résultats montrent alors que nous pouvons automatiquement réduire le nombre de dimensions afin d’obtenir une réduction du temps de calcul de 35% sans dégradation des scores de Mean Average Precison.

Abstract

In this article we propose a method to improve web image retrieval in the case of bimodal query composed of few words and few images. For each web image and multimodal query, a simple weighted distance merges the tfidf web page analysis and the visual features distance. We then apply an approximate linear discriminante analysis (ALDA) using web sam- pling to select the most discriminant visual feature. We check our method on the ImagEVAL official test set (our team was 2nd on 4 teams). This test set contains 700 URLs (700 web pages and 10k images). We study query behavior in fonction of the text rate int the fusion of the visual and textual distances, and we discuss of the “visualness” of each query. We show that we can reduce the number of dimensions to obtain a time reduction of 35%, without Mean Average Precison (MAP) degradation.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.