Auteurs
Résumé
Dans cet article, nous comparons les résultats produits par différentes approches de résumé multi-documents. Nous opposons deux approches classiques à la nôtre qui place la modélisation de la diversité informationnelle du corpus au centre du processus. Nous évaluons également l’impact de différentes mesures de similarité entre phrases. Les expériences, menées sur le corpus RPM2, montrent qu’un regroupement des phrases en classes sémantiques améliore la qualité des résumés.
Abstract
This paper introduces the experiences we led in order to evaluate the impact of a sentence unsupervised clustering algorithm on a multi-document summarization system. We compared this system to two others which implement classic summarization methods. We also evaluated the impact of different sentence similarity measures on the quality of the summaries. The experiences show that a clustering prior to sentence selection does improve the quality of the summaries.