ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2009
PDF

Auteurs

Azeddine Zidouni, Hervé Glotin, Mohamed Quafafou

Résumé

Ce papier présente une approche pour la recherche d’entités nommées dans des transcriptions radiophoniques. Nous allons utiliser les structures des entités nommées afin d’améliorer le taux de leur reconnaissance. En effet, l’espace des entités peut être représenté par une structure hiérarchique (arbre). Ainsi, un concept peut être vu comme un noeud dans l’arbre, et une entité comme un parcours dans la structure de l’espace. Nous allons montrer l’apport de cette représentation en utilisant le modèle des Champs Aléatoires Conditionnels (CAC). La comparaison de notre approche avec la méthode des Modèles de Markov Cachés (MMC) montre une amélioration de la reconnaissance en utilisant les CAC Combinés. Nous montrons également l’impact de l’utilisation des informations a priori dans le processus en incluant les informations syntaxiques des transcriptions comme nouveau contexte.

Abstract

This paper focuses on the role of structures in the Named Entity retrieval inside audio transcription. We consider the transcription documents strucure that guides the parsing process, and from which we deduce an optimal hierarchical structure of the space of concepts. Therefore, a concept is represented by a node or any sub-path in this hierarchy. We show the in- terest of such structure in the recognition of the Named-Entities using the Conditional Random Fields (CRF). The comparison of our approach to the Hiden Markov Model (HMM) method shows an important improvement of recognition using Combining CRFs. We also show the impact of the Part-of-Speech tagging (POS tagging) in the prediction quality.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.