ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA-TALN 2018
PDF

Auteurs

Delphine Charlet, Géraldine Damnati

Résumé

Cet article étudie l’association de documents journalistiques issus de la presse en ligne et de journaux télévisés, en utilisant des similarités sémantiques textuelles. Les associations de documents sont étudiées dans des configurations intramedia et intermedia. Les expériences menées montrent que les métriques de similarité sémantique qui s’avéraient efficaces dans le contexte de similarité entre questions posées sur un forum sont également efficaces pour l’association de documents, quelle que soit la configuration d’association média. L’influence de la longueur des documents requêtes et cibles est étudiée de façon approfondie et montre des comportements contrastés des métriques selon la longueur.

Abstract

This article explores the linking of written and audiovisual news, based on the use of semantic textual similarity metrics. It presents a comprehensive study of different linking approaches with various configurations of intermedia or intramedia association. It is shown that textual similarity metrics that have proved to perform very well in the context of community question answering can provide efficient news linking metrics, whatever the media association configuration. The influence of document length and request length is also explored for several similarity metrics. The results highlight contrasted behaviors regarding request and document lengths.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.