ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2015
PDF

Auteurs

Nicolas Voiron, Alexandre Benoit, Andrei Filip, Patrick Lambert, Bogdan Ionescu

Résumé

Dans un monde guidé par les données, la classification est un outil essentiel pour ai- der les utilisateurs à appréhender la structure de ces données. Les techniques d’apprentissage supervisé permettent d’obtenir de très bonnes performances lorsque l’on dispose d’une base an- notée, mais un risque de sur-apprentissage existe toujours. Il existe de nombreuses techniques de classification non supervisée qui cherchent à construire la structure des données sans dispo- ser de données d’entraînement. Mais dans des contextes difficiles les résultats sont moins bons que ceux de l’apprentissage supervisé. Pour améliorer les performances, un bon compromis est d’apporter de la connaissance seulement sur les éléments (classes et objets) ambigües. Dans ce contexte, cet article s’intéresse au Clustering Spectral et à l’ajout de contrainte par paires. Nous introduisons une nouvelle généralisation de la propagation des contraintes qui maximise la qualité de partitionnement tout en réduisant les coûts d’annotation.

Abstract

In our data driven world, clustering is of major importance to help end-users and decision makers understanding information structures. Supervised learning techniques rely on ground truth to perform the classification and are usually subject to overtraining issues. On the other hand, unsupervised clustering techniques study the structure of the data without disposing of any training data. Given the difficulty of the task, unsupervised learning tends to provide inferior results to supervised learning. To boost their performance, a compromise is to use learning only for some of the ambiguous classes or objects. In this context, this paper studies the impact of pairwise constraints to unsupervised Spectral Clustering. We introduce a new generalization of constraint propagation which maximizes partitioning quality while reducing annotation costs.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.