ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2017
PDF

Auteurs

Hani Daher, Romaric Besançon, Olivier Ferret, Hervé Le Borgne, Anne-Laure Daquo, Youssef Tamaazousti

Résumé

La désambiguïsation d’entités consiste à lier automatiquement des mentions d’entités identifiées dans un texte et des entités présentes dans une base de connaissances. L’approche générale consiste à produire, pour une mention donnée, des entités candidates puis à sélection- ner la meilleure parmi celles-ci, selon un ensemble de critères. Notre travail se focalise sur cette dernière étape, avec une méthode fondée sur l’apprentissage de modèles permettant d’opérer une discrimination entre une entité et les entités qui lui sont ambiguës. Un verrou majeur dans ce contexte réside dans la capacité à gérer de grandes bases de connaissances nécessitant l’ap- prentissage de dizaines de millions de modèles. Nous proposons trois stratégies permettant d’y répondre, offrant différents compromis entre efficacité et qualité de reconnaissance. Nous les validons expérimentalement sur six bases provenant des campagnes TAC en utilisant les bases de connaissances Freebase et DBpedia.

Abstract

The objective of Entity Linking is to connect an entity mention in a text to a known entity in a knowledge base. The general approach for this task is to generate, for a given mention, a set of candidate entities from the base and determine, in a second step, the best one. This paper focuses on this last step and proposes a method based on learning a function that discriminates an entity from its most ambiguous ones. We adopt a model that is able to deal with large knowledge bases. Thus our contribution lies in the strategy to learn efficiently such a model. We propose three strategies with different efficiency/performance tradeoff. The approach is experimentally validated on six datasets of the TAC evaluation campaigns by using Freebase and DBpedia as reference knowledge bases.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.