ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2017
PDF

Auteurs

Charles-Emmanuel Dias, Vincent Guigue, Patrick Gallinari

Résumé

L’extraction, la structuration et l’exploitation d’informations à partir de données textuelles brutes est une tâche complexe. L’apprentissage de représentation permet de dépasser la barrière syntaxique que représente le codage textuel et d’encoder les informations selon des règles définies. Les dernières avancées en apprentissage statistique ont permis d’améliorer considérablement l’analyse sémantique des textes. Dorénavant, le principal verrou technolo- gique se déplace vers le raisonnement afin d’extrapoler des connaissances non-explicites. Dans cet article, nous nous intéressons à l’apprentissage d’un espace latent sur un large corpus de CV pour l’induction de carrières professionnelles. Nous proposons d’abord un modèle de nor- malisation sémantique basé sur une architecture encodeur/décodeur pour réduire la diversité de dénomination des métiers puis nous développons des opérateurs de raisonnement pour mo- déliser la hiérarchie dans les organigrammes d’entreprises et prédire les enchaînements de postes dans les CV.

Abstract

Extracting, structuring and exploiting information from freeform text is a difficult task. Learning embeddings with chosen properties and going beyond simple syntax encoding contributed to significant improvements in semantic analysis. Recently, the focus has shifted from word and document embeddings to reasoning in order to infer or predict new knowledge. In this paper, we focus on job & educational background embeddings that are learned from a large CV corpus. We aim at modeling users careers and forecasting their choices. Inspired by recent work in machine translation, we design a Recurrent Neural Network architecture to normalize job & qualification titles. Once this semantic step achieved, we build another RNN to predict position chaining in CV.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.