ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2015
PDF

Auteurs

Thibault Gisselbrecht, Ludovic Denoyer, Patrick Gallinari, Sylvain Lamprier

Résumé

Dans cet article nous nous intéressons à la collecte d’information dans les réseaux sociaux. Cette tâche, primordiale pour de nombreuses applications, se heurte souvent à diverses contraintes liées aux ressources à disposition ou à des restrictions imposées par les API des médias considérés. Nous formulons cette tâche comme un problème de sélection dynamique de sources, pour lequel nous proposons une méthode d’apprentissage pour orienter la collecte vers les données les plus pertinentes en fonction d’un besoin spécifié. Notre méthode est basée sur une extension d’un algorithme de bandit combinatoire récemment proposé. Nous fournissons des garanties théoriques sur le comportement de l’algorithme, que nous évaluons ensuite sur différents jeux de données Twitter, à la fois hors ligne et en ligne, pour différents besoins de données exprimés.

Abstract

We consider the problem of capturing information on social media under bounded resource. The latter may correspond to real time constraints such as response time limitation, limited computing resources, or social media API restrictions. We formulate this problem as a dynamic source selection problem. We then propose a machine learning methodology for dynamically selecting the most relevant information sources for a given information need. This method is based on an extension of a recently proposed combinatorial bandit algorithm. We provide theoretical guarantees on the behavior of the algorithm. We then evaluate the algorithm on different Twitter datasets for both offline and online settings.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.