Auteurs
Résumé
La reconnaissance qu’une relation existe entre deux entités mentionnées dans un texte joue un rôle vital en extraction d’information (EI). Pour répondre à la nécessité d’annoter ma- nuellement de nombreux exemples, des paradigmes de supervision distante et d’EI non super- visée ont été proposés. Le point crucial dans ces approches est de pouvoir évaluer la validité des relations extraites. Dans cet article, nous proposons une nouvelle architecture neuronale pour modéliser la validation de relations, inspirée des modèles neuronaux pour l’implication textuelle. Nous encodons le texte et le triplet correspondant à la relation dans une architecture siamoise afin de décider si le texte supporte ou non la relation. Nous proposons différentes re- présentations d’une relation qui tirent profit de l’apprentissage joint de mots et d’entités dans un espace commun.
Abstract
Recognizing if a relation holds between two entities in a text plays a vital role in information extraction (IE). To overcome the need to annotate many examples manually, open IE and distant supervision paradigms were proposed. In these two last settings, the crucial point is to be able to assess the validity of the extracted relations. In this paper, we propose a new NN architecture for modelling relation validation, inspired by NN entailment models, that encodes the text and the relation triplet in a siamese architecture in order to decide whether or not the text supports the relation. We propose different representations of a relation that take advantage of learning word and entity embeddings in a common space.