ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA-TALN 2018
PDF

Auteurs

Edouard Delasalles, Sylvain Lamprier, Ludovic Denoyer

Résumé

Les modèles de langue sont au coeur de nombreux de travaux, notamment dans les domaines de la recherche d’information et de la fouille de texte. Plutôt qu’une analyse fine de la sémantique des textes, ces modèles statistiques visent à extraire des distributions d’occurrence de mots dans différents contextes. Divers types d’approches ont été proposés dans la littérature, du simple modèle multinomial unigramme à des modèles à variables latentes pour la prise en compte de dépendances complexes dans les textes. Néanmoins, peu de travaux se sont portés sur la prise en compte conjointe des dépendances structurelles et temporelles dans des distributions de textes observés au cours du temps. Nous établissons ici un modèle dynamique de l’évolution langagière d’une communauté d’auteurs. En apprenant un modèle neuronal d’évolution sur des ensembles de textes produits par différents auteurs d’une communauté à différents instants, nous sommes capables d’en exploiter les dépendances latentes à des fins de prédiction des publications à venir.

Abstract

Language models are at the heart of numerous works, specifically in the information retrieval domain. Instead of fine grained semantical analysis, theses statistical models aim at extracting words occurrence distributions in different contexts. Several approaches have been considered among the community, from simple unigram models to complex latent variables aiming at capturing subtle dependencies in texts. Nevertheless, only few works focused both on structural and temporal dependencies in text distributions observed through time. We propose a dynamic model of the stylistic evolutions of authors. By capturing influence relationships between authors, we are able to learn a dynamic language model for the prediction of distributions of texts that will publish a considered community of authors in the future time-steps.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.