Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2019


Robin Brochier


La littérature scientifique forme un large réseau d’information reliant des acteurs va- riés (laboratoires, entreprises, institutions, etc.). La vaste quantité de données générées par ce réseau constitue un graphe hétérogène attribué dynamique, dans lequel de nouvelles informa- tions sont constamment produites et dont il est de plus en plus difficile d’extraire du contenu d’intérêt. Dans cet article, je présente mes premiers travaux de thèse réalisés en partena- riat avec un acteur industriel. Celui-ci propose un outil de veille scientifique abordant diffé- rentes problématiques, telles que la recommandation d’articles et la recherche d’experts. Tout d’abord, je détaille les données habituellement associées à la littérature scientifique. Ensuite, j’aborde le problème de la recherche d’experts, son évaluation et propose une nouvelle méthode pour juger de la qualité d’un algorithme. Enfin, j’introduis un algorithme d’apprentissage de représentations abordant le problème du plongement des noeuds d’un graphe dans un espace de faible dimension, étendu pour intégrer l’information textuelle liée à ces noeuds.


The scientific literature is a large information network linking various actors (la- boratories, companies, institutions, etc.). The vast amount of data generated by this network constitutes a dynamic attributed heterogeneous network, in which new information is constantly produced and from which it is increasingly difficult to extract content of interest. In this article, I present my first thesis works in partnership with an industrial company. This later offers a scientific watch tool addressing various issues, such as the recommendation of articles and the search for experts. First, I detail the data usually associated with the scientific literature. Then I present the problem of expert finding, its evaluation and I suggest a new method to juge the quality of an algorithm. Finally, I introduce a representation learning algorithm for the problem of embedding the nodes of a graph in a vector space of small dimension, extended to integrate the textual information related to these nodes.

