Auteurs
Résumé
L’indexation sémantique de documents à partir d’ontologies est un domaine qui prend de l’essor, malgré les difficultés d’une indexation automatique ou même semi-automatique, sans parler d’indexation manuelle. Il est possible désormais d’avoir des caractérisations séman- tiques de documents textuels ou non textuels basées sur des ontologies. Partant de ce fait, nous avons mis en place un objet, le focus, qui représente un document ou une requête en pondé- rant les concepts d’une ontologie de manière à indiquer l’importance de chaque concept dans le document. Néanmoins, pour être utilisable, cette solution doit définir précisément ce qu’est une normalisation pour un focus.C’est ce que nous avons fait, en introduisant les notions de normalisation par le maximum et de normalisation par la somme. Ensuite nous avons étudié les propriétés que nous désirons pour une mesure de comparaison entre focus, ce qui nous a permis de définir la pertinence relative d’un focus par rapport à un autre, mesure qui n’est pas une distance.
Abstract
Semantic indexing of documents using ontologies is a growing field, despite difficulties with automatic or semiautomatic indexing, not to mention manual indexing. Nowadays we have semantic characterizations of textual or non textual documents based on ontologies.Hence, we developped an entity, the focus, that represents a document or a query with wheightings on concepts of an ontology in order to indicate the importance of each concept within the doc- ument. Nevertheless, that solution needs for precise definition of focus normalization. Intro- ducing notions of normalization by the maximum and normalization by the sum enabled us to accomplish this. Thus, we study the properties we want for a similarity measure between fo- cusses, which allows us to define the relative relevance of a focus in comparison with another one.