Auteurs
Résumé
Les avancées de l’initiative Linked Open Data (LOD) ont permis de mieux structurer le Web des données. En effet, quelques jeux de données servent de centralisateurs (par exemple, DBpedia) et permettent ainsi de maintenir les différentes sources de données du LOD liées entre elles. Ces jeux de données ont également permis le développement de services de détection des entités du Web des données dans une page du Web des documents (par exemple, DBpedia Spot- light). Ainsi, pour permettre l’émergence de nouveaux usages qui combineront les deux Webs, nous proposons un algorithme qui ordonne les entités détectées dans une page Web en fonc- tion d’une requête exprimant un besoin d’information. Nous montrons que cet algorithme est significativement meilleur que les approches de l’état de l’art. Enfin, nous utilisons cet algo- rithme pour construire un système de génération de snippets sémantiques dont nous montrons expérimentalement l’utilité et l’utilisabilité.
Abstract
The advances of the Linked Open Data (LOD) initiative are giving rise to a more structured Web of data. Indeed, a few datasets act as hubs (e.g., DBpedia) connecting many other datasets. They also made possible new Web services for entity detection inside plain text (e.g., DBpedia Spotlight), thus allowing for new applications that will benefit from a combina- tion of the Web of documents and the Web of data. To ease the emergence of these new use-cases, we propose an algorithm for the ranking of entities, detected inside a Web page, by taking into account an information need expressed as a query. We show that this algorithm is significantly more efficient than the state of the art. Finally, we use this algorithm for the construction of semantic snippets for which we evaluate the usability and the usefulness on a panel of users.