<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>ARIA on Association Francophone de Recherche d&#39;Information et Applications</title>
    <link>http://www.asso-aria.org/</link>
    <description>Recent content in ARIA on Association Francophone de Recherche d&#39;Information et Applications</description>
    <generator>Hugo</generator>
    <language>fr</language>
    <lastBuildDate>Fri, 10 Apr 2026 13:00:00 +0100</lastBuildDate>
    <atom:link href="http://www.asso-aria.org/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Apprentissage par renforcement dans un système de filtrage adaptatif.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.27/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.27/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une méthode incrémentale d&amp;rsquo;apprentissage des profils dans les systèmes de filtrage d&amp;rsquo;information. Cette méthode est basée sur le principe de renforcement. L&amp;rsquo;idée de base consiste à construire, à chaque arrivée d&amp;rsquo;un document pertinent, un profil &amp;rsquo; provisoire &amp;rsquo; permettant de sélectionner le document en question avec un score &amp;rsquo; fort &amp;lsquo;, puis intégrer ce profil, grâce à une descente de gradient, dans le profil global. Cette méthode est comparée à une version incrémentale de l&amp;rsquo;algorithme de Rocchio adapté au filtrage d&amp;rsquo;information. Des expérimentations effectuées sur la collection de test de référence TREC, montrent que les résultats obtenus par la&lt;/p&gt;</description>
    </item>
    <item>
      <title>CLEF MC2 Lab: Évaluation, Résultats, et Perspectives</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_28/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_28/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le Lab MC21 2018 est une tâche de recherche d’information (RI) au sein de la campagne&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;MC2 CLEF Lab is a task in CLEF centered on mining the social media sphere surrounding cultural events. The objective of this task is to develop processing methods and resources to mine the social media (SM). The task focuses on the microblog collection of the GAFES. Running for three years, the organizers have been able to propose over time many&lt;/p&gt;</description>
    </item>
    <item>
      <title>Considérations sur l&#39;évaluation de la robustesse en recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cette communication évalue et compare l&amp;rsquo;efficacité de modèles vectoriels, probabilistes ou de langue afin de dépister des articles de presse rédigés en langue française. En se basant sur un corpus créé durant trois campagnes d&amp;rsquo;évaluation CLEF et comprenant&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper describes and evaluates vector-space, probabilistic and language IR models used to retrieve news articles from a corpus written in the French language. Based on three CLEF test-collections and 151 topics, we analyze the retrieval effectiveness of these approaches and analyze the poor retrieval results of hard topics.  An appropriate robust evaluation is not easy because both the mean average precision (MAP) or the geometric mean (GMAP) present some drawbacks. In order to obtain a better picture, we suggest using the First Relevant Score (or FRS, based on the rank of the first relevant item). We evaluate and compare these three measures in particular when using blind query expansion technique. MOTS-CLÉS : Evaluation de recherche robuste ; expansion aveugle ; requêtes difficiles. KEY WORDS : Robust evaluation; blind query expansion; hard queries.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Résumé automatique de texte avec un algorithme d&#39;ordonnancement.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.47/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.47/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons une nouvelle approche pour le résumé automatique de textes utilisant un algorithme d&amp;rsquo;apprentissage numérique spécifique à la tâche d&amp;rsquo;ordonnancement. L&amp;rsquo;objectif est d&amp;rsquo;extraire les phrases d&amp;rsquo;un document qui sont les plus représentatives de son contenu. Pour se faire, chaque phrase d&amp;rsquo;un document est représentée par un vecteur de scores de pertinence, où chaque score est un score de similarité entre une requête particulière et la phrase considérée. L&amp;rsquo;algorithme d&amp;rsquo;ordonnancement effectue alors une combinaison linéaire de ces scores, avec pour but d&amp;rsquo;affecter aux phrases pertinentes d&amp;rsquo;un document des scores supérieurs à ceux des phrases non pertinentes du même document. Les algorithmes d&amp;rsquo;ordonnancement ont montré leur efficacité en particulier dans le domaine de la méta-recherche, et leur utilisation pour le résumé est motivée par une analogie qui peut être faite entre la méta-recherche et le résumé automatique qui consiste, dans notre cas, à considérer les similarités des phrases avec les différentes requêtes comme étant des sorties de différents moteurs de recherche. Nous montrons empiriquement que l&amp;rsquo;algorithme d&amp;rsquo;ordonnancement a de meilleures performances qu&amp;rsquo;une approche utilisant un algorithme de classification sur deux corpus distincts.&lt;/p&gt;</description>
    </item>
    <item>
      <title>RNN et modèle d’attention pour l’apprentissage de profils textuels personnalisés</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous nous intéressons dans cet article à la construction de profils issus à la fois des données d&amp;rsquo;interaction des utilisateurs (notes sur les produits) et des données textuelles associées (revues). L&amp;rsquo;enjeu est de s&amp;rsquo;éloigner des approches de factorisation matricielle pour mieux exploiter les données textuelles. Nous proposons de personnaliser une architecture de réseau de neurones hiérarchique dédiée à la classification de sentiments en apprenant des paramètres d&amp;rsquo;attention spécifiques pour les différents utilisateurs. Nous démontrons ensuite l&amp;rsquo;intérêt de ces paramètres pour établir des profils de recommandation pertinents. Non seulement les prédictions proposées par notre système dépassent les performances des systèmes de factorisation matricielle, mais le fait de travailler dans un espace latent textuel nous permet en plus de proposer des explications autour des recommandations pour sortir des boîtes noires habituelles du filtrage collaboratif.&lt;/p&gt;</description>
    </item>
    <item>
      <title>« Hé Manu, tu descends ? » : identification nommée du locuteur dans les dialogues</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_14/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_14/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;identification du locuteur est la tâche qui consiste à associer un locuteur à chaque tour de parole d&amp;rsquo;un dialogue, utilisée notamment pour enrichir les corpus de transcriptions automatiques.Le traitement de la tâche peut totalement différer selon le média : vidéo (films, séries, etc.), audio (séries, radio, etc.) ou textuel (scripts, transcriptions, etc.). Dans cet article, nous proposons une méthode d&amp;rsquo;identification du locuteur à partir des scripts et transcriptions de séries. Dans un dialogue de série, il est courant que les personnages mentionnent le nom des autres personnages à travers les discussions. Ces mentions peuvent servir d&amp;rsquo;indices afin d&amp;rsquo;identifier les locuteurs des tours de parole par leur nom. Nous proposons donc une approche d&amp;rsquo;identification du locuteur neuronale fondée sur la propagation des mentions à travers le dia- logue. Cette approche parvient à trouver correctement le locuteur de 34% tours de parole pour la série The Big Bang Theory, et 34% pour la série Friends.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage d&#39;ordonnancements en recherche d&#39;information structurée.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.17/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.17/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons un modèle d&amp;rsquo;apprentissage pour la Recherche d&amp;rsquo;Information Struc- turée qui ajuste automatiquement ses paramètres grâce à un ensemble d&amp;rsquo;exemples étiquetés composé de requêtes et de jugements de pertinence sur un ensemble de parties de documents. Notre modèle améliore la performance d&amp;rsquo;un système de base de Recherche d&amp;rsquo;Information en optimisant un critère de coût d&amp;rsquo;ordonnancement et en combinant des scores calculés sur des parties de documents et leur contexte structurel. Nous analysons la performance de notre algo- rithme sur la collection INEX et nous le comparons au modèle de base qui est une adaptation d&amp;rsquo;Okapi pour la Recherche d&amp;rsquo;Information Structurée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Co-citations sur le Web : Recherche de Similarité entre les Articles Scientifiques.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.21/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.21/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous introduisons une nouvelle méthode pour estimer la similarité entre les articles scientifiques en utilisant un moteur de recherche sur le Web. Dans cette mé- thode, la similarité entre deux articles est basée sur le nombre de fois où ils sont mentionnés ensemble sur le Web. Cette méthode est appelée la méthode des co-citations sur le Web. Nous avons fait des expérimentations pour comparer la performance de différentes méthodes de cita- tions: couplage bibliographique, co-citation traditionnelle avec la base de données de citation Web of Science, et notre méthode co-citations sur le Web avec le moteur de recherche Google. Les résultats des expérimentations ont montré que notre approche est efficace pour découvrir la similarité entre les articles scientifiques.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Nommage non-supervisé des personnes dans les émissions de télévision : une revue du potentiel de chaque modalité.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_13/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_13/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;identification de personnes dans les émissions de télévision est un outil précieux pour l&amp;rsquo;indexation de ce type de vidéos. Mais l&amp;rsquo;utilisation de modèles biométriques n&amp;rsquo;est pas une op- tion viable sans connaissance a priori des personnes présentes dans les vidéos. Les noms cités à l&amp;rsquo;oral ou écrits à l&amp;rsquo;écran peuvent nous fournir une liste de noms hypothèses. Nous proposons une comparaison du potentiel de ces deux modalités (noms cités ou écrits) afin d&amp;rsquo;extraire le nom des personnes parlant et/ou apparaissant. Les noms cités à l&amp;rsquo;oral proposent un plus grand nombre d&amp;rsquo;occurrences de citation mais les erreurs de transcriptions et de détections de ces noms réduisent de moitié le potentiel de cette modalité. Les noms écrits à l&amp;rsquo;écran bénéficient d&amp;rsquo;une amélioration croissante de la qualité des vidéos et sont plus facilement détectés. L&amp;rsquo;affiliation aux locuteurs/visages des noms écrits reste plus simple que pour les noms cités à l&amp;rsquo;oral.&lt;/p&gt;</description>
    </item>
    <item>
      <title>On the use of Clustering and the MeSH Controlled Vocabulary to Improve MEDLINE Abstract Search.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.18/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.18/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les bases de données génomiques contiennent de l&amp;rsquo; information structurée en plus de l&amp;rsquo;information textuelle que l&amp;rsquo;on trouve dans les titres et les résumés d&amp;rsquo;articles. Les techniques de recherche d&amp;rsquo;information non-structurée ne sont pas adaptées à l&amp;rsquo;exploitation de cette information structurée. Cet article décrit une technique d&amp;rsquo;amélioration des méthodes de recherche traditionnelles qui sépare un résultat initial de recherche en deux groupes à l&amp;rsquo;aide de l&amp;rsquo;information structurée disponible. L&amp;rsquo;hypothèse avancée est que les documents les plus pertinents se trouveront dans le groupe le plus densément peuplé, conformément à l&amp;rsquo;hypothèse de groupement de van Rijsbergen. Nous présentons une évaluation expérimentale de ces idées qui se base sur les documents jugés de l&amp;rsquo;atelier génomique de TREC 2004 et sur le logiciel de groupement CLUTO.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Regroupements non-disjoints de mots pour la classification de documents.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.41/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.41/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La classification automatique de documents est un domaine d&amp;rsquo;étude en plein essor dans le domaine du Traitement et de la Recherche d&amp;rsquo;Information (RI). Dans un cadre supervisé, il s&amp;rsquo;agit alors d&amp;rsquo;entraîner un modèle de classifieur sur un corpus de documents étiquetés. La difficulté majeure consiste à représenter les documents par un nombre limité et suffisant d&amp;rsquo;attributs. Dans cet article, nous proposons une méthode de regroupement de mots, basée sur l&amp;rsquo;algorithme PoBOC (Pole-Based Overlapping Clustering) autorisant les recouvrements entre les groupes. Ainsi, chaque mot initial peut appartenir à un ou plusieurs attributs terminaux. Les expérimentations menées sur le corpus Reuters-21578 ont permis de montrer que cette méthode de regroupements non-disjoints induit, sous de bonnes conditions, une amélioration de la précision du classifieur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Similarité textuelle pour l’association de documents journalistiques</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper13/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper13/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article étudie l&amp;rsquo;association de documents journalistiques issus de la presse en ligne et de journaux télévisés, en utilisant des similarités sémantiques textuelles. Les associations de documents sont étudiées dans des configurations intramedia et intermedia. Les expériences menées montrent que les métriques de similarité sémantique qui s&amp;rsquo;avéraient efficaces dans le contexte de similarité entre questions posées sur un forum sont également efficaces pour l&amp;rsquo;association de documents, quelle que soit la configuration d&amp;rsquo;association média. L&amp;rsquo;influence de la longueur des documents requêtes et cibles est étudiée de façon approfondie et montre des comportements contrastés des métriques selon la longueur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation de la syntaxe pour valider les réponses à des questions par plusieurs documents.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente FIDJI, un système de questions-réponses pour le français, com- binant des informations syntaxiques sur la question et les documents avec des techniques plus traditionnelles du domaine, telles que la reconnaissance des entités nommées et la pondération des termes. Notamment, nous expérimentons dans ce système la validation des réponses dans plusieurs documents, ainsi que des techniques spécifiques permettant de répondre à différents types de questions (comme les questions attendant des réponses multiples (liste) ou une réponse booléenne).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apport des services Web dans l&#39;amélioration de l&#39;accès à l&#39;information sur le Web ?</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.35/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.35/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La difficulté à trouver de l&amp;rsquo;information sur le Web croît et ceci même pour les plus experts des utilisateurs. Afin de mieux comprendre comment recherchent les internautes, nous avons observé cinq adultes et quatre enfants. Des protocoles d&amp;rsquo;observation différents, présentant tous deux des recherches imposées et libres, ont été définis pour les enfants et les adultes. Nous avons pu définir un certain nombre de comportements, d&amp;rsquo;attitudes et de difficultés. Le résultat de ces observations ainsi que l&amp;rsquo;analyse des comportements sont présentés dans ce papier dans le but d&amp;rsquo;introduire la contribution des services Web dans l&amp;rsquo;aide à l&amp;rsquo;accès à l&amp;rsquo;information et à la recherche sur le Web.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de Relations entre Concepts - Génération Automatique d&#39;une Structuration Hiérarchique à partir de Corpus.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.57/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.57/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous étudions comment apprendre automatiquement à partir de corpus, des hiérarchies de concepts obéissant à une relation du type généralisation / spécialisation. Nous proposons une méthode qui permet à partir de concepts identifiés automatiquement sur un corpus de documents, d&amp;rsquo;apprendre des relations généralisation / spécialisation à partir de cooccurrence de ces concepts, puis de construire une hiérarchie ordonnée suivant cette même relation. A titre d&amp;rsquo;application, nous montrons comment utiliser cette hiérarchie de concepts pour construire une hiérarchie de documents. Nous introduisons des critères originaux qui permettent d&amp;rsquo;évaluer la qualité des hiérarchies ainsi construite et de les comparer entre elles ou avec des hiérarchies manuelles. Nous décrivons une série de tests réalisés sur des corpus de documents provenant de portails internet, ces corpus sont extraits des hiérarchies LookSmart et NewScientist.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage en temps réel pour la collecte d&#39;information dans les réseaux sociaux.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.34/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.34/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous nous intéressons à la collecte d&amp;rsquo;information dans les réseaux sociaux. Cette tâche, primordiale pour de nombreuses applications, se heurte souvent à diverses contraintes liées aux ressources à disposition ou à des restrictions imposées par les API des médias considérés. Nous formulons cette tâche comme un problème de sélection dynamique de sources, pour lequel nous proposons une méthode d&amp;rsquo;apprentissage pour orienter la collecte vers les données les plus pertinentes en fonction d&amp;rsquo;un besoin spécifié. Notre méthode est basée sur une extension d&amp;rsquo;un algorithme de bandit combinatoire récemment proposé. Nous fournissons des garanties théoriques sur le comportement de l&amp;rsquo;algorithme, que nous évaluons ensuite sur différents jeux de données Twitter, à la fois hors ligne et en ligne, pour différents besoins de données exprimés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Architecture basée sur les mécanismes d&#39;attention: le cas de la génération de questions neuronales</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les architectures neuronales basées sur l&amp;rsquo;attention, telles que le Transformer, ont ré- cemment suscité l&amp;rsquo;intérêt de la communauté scientifique et ont permis d&amp;rsquo;obtenir des progrès im- portants par rapport à l&amp;rsquo;état de l&amp;rsquo;art dans plusieurs domaines. L&amp;rsquo;adaptation des Transformers à la tâche de la génération de questions n&amp;rsquo;est pas simple car les données sont ici relativement peu volumineuses. Nous explorons, par conséquent, comment un Transformer peut être adapté et, en particulier, étudions l&amp;rsquo;effet des mécanismes de copie, de remplacement d&amp;rsquo;entité nommée ainsi que l&amp;rsquo;intégration de représentations de mots contextualisées. Ces mécanismes sont parti- culièrement utiles pour le traitement des mots hors vocabulaire, qui sont les plus susceptibles d&amp;rsquo;affecter les performances dans le cadre de tâches pour lesquelles les données sont relative- ment moins disponibles. Les expériences rapportées montrent des résultats encourageants dans le scénario où la réponse n&amp;rsquo;est pas connue (mode non guidé). On obtient, par ailleurs, une amélioration par rapport à l&amp;rsquo;état de l&amp;rsquo;art quand elle ne l&amp;rsquo;est pas (mode guidé).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Auto-complétion de requêtes par une base générique de règles d&#39;association triadiques.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;exploitation des réseaux sociaux et systèmes collaboratifs dans le cadre d&amp;rsquo;un pro- cessus de recherche d&amp;rsquo;information est un phénomène qui peu à peu est intégré aux pratiques de la recherche sur Internet. Ces systèmes, émergeants de l&amp;rsquo;ère du Web 2.0, permettent aux parti- cipants de collaborer via l&amp;rsquo;indexation libre du contenu à l&amp;rsquo;aide de mots-clés, les tags ; créant ainsi des structures légères représentées comme des hypergraphes tripartites d&amp;rsquo;utilisateurs, de tags et de ressources, appelées folksonomies. Dans ce papier, nous exploitons ces triplets (Res- sources, Utilisateurs, Tags) pour introduire une nouvelle définition d&amp;rsquo;une base générique de règles d&amp;rsquo;association triadiques, appelée BGRT . Nous montrons que l&amp;rsquo;utilisation de ces règles génériques non redondantes pour l&amp;rsquo;auto-complétion de requêtes permet de mettre en exergue la pertinence des folksonomies et leur intérêt réel dans le cas de la recherche d&amp;rsquo;information. Les premiers résultats obtenus sur une folksonomie réelle, collectée à partir du réseau social DELICIOUS, s&amp;rsquo;avèrent prometteurs et ouvrent de nombreuses perspectives.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Catégorisation libre d’extraits musicaux et analyse automatique</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper16/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper16/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit le protocole expérimental et les résultats obtenus lors d&amp;rsquo;une expérience de catégorisation. Cette expérience s&amp;rsquo;inscrit dans le cadre de travaux de recherche sur la recommandation musicale personnalisée et basée sur le contenu. Durant cette expérience, les volontaires ont dû catégoriser librement des extraits musicaux sélectionnés selon des critères musicologiques. Cette catégorisation est analysée via un dendrogramme représentant la u classification moyenne des participants ». Une analyse automatique des résultats menée a posteriori vise à identifier les paramètres acoustiques déterminants dans cette classification moyenne.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Étude sur l&#39;impact du sous-langage dans la classification automatique d&#39;appels d&#39;offres.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.50/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.50/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous évaluons diverses approches pour filtrer le contenu u procédural » d&amp;rsquo;un document, et mesurons leur impact sur la classification d&amp;rsquo;une collection d&amp;rsquo;appels d&amp;rsquo;offres. Deux types d&amp;rsquo;approches sont testées : la sélection de termes à partir d&amp;rsquo;un vocabulaire de référence, constitué à partir des descriptions du schéma de classification, et le filtrage de phrases. Nous ne trouvons pas de différence significative entre le vocabulaire de référence et celui de la collection d&amp;rsquo;entraînement. Par contre le filtrage par phrases donne d&amp;rsquo;excellents résultats sur notre collection, et peu même avantageusement être combiné à d&amp;rsquo;autres techniques de sélection.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Evaluation de diverses stratégies de désambiguïsation lexicale.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.19/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.19/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans la campagne d&amp;rsquo;évaluation CLEF-2008, la tâche u robuste » fournissait un corpus enrichi en langue anglaise.  Pour chaque mot, le lemme, la partie du discours et le numéro Synsets de WordNetTM (numéro de classe d&amp;rsquo;un thésaurus) étaient fournis. Sur cette base, nous avons testé plusieurs approches afin de lever, en partie pour le moins, l&amp;rsquo;ambiguïté lexicale. Recourant au modèle vectoriel tf idf, ainsi qu&amp;rsquo;à trois approches probabilistes et un modèle de langue, cet article évalue leur performance en fonction de diverses techniques d&amp;rsquo;enracineur.  Un enracineur léger permet d&amp;rsquo;obtenir des performances similaires à des approches plus agressives ou à celle obtenue par une analyse morphologique. L&amp;rsquo;indication de la partie du discours permet d&amp;rsquo;améliorer significativement la qualité de la réponse tandis que les numéros de classes d&amp;rsquo;un thésaurus n&amp;rsquo;ont pas permis une amélioration.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Exploitation de l&#39;échelle d&#39;écriture pour améliorer la reconnaissance automatique des textes manuscrits arabe.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-12/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-12/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les documents manuscrits arabes présentent des défis spécifiques pour la&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Filtrage collaboratif et intégration de la polarité des jugements.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous nous intéressons à la recommandation par des systèmes de filtrage collaboratif. Nous proposons de combiner une approche globale basée sur une factorisation matricielle et une approche locale basée sur l&amp;rsquo;exploitation directe d&amp;rsquo;un voisinage de l&amp;rsquo;utilisateur. L&amp;rsquo;hypothèse explorée dans l&amp;rsquo;article est que les jugements utilisateurs ont une sémantique et donc une utilité différente suivant qu&amp;rsquo;ils sont positifs ou négatifs. Nous proposons un modèle qui exploite cette polarité et apprend à pondérer l&amp;rsquo;influence de ses voisins en se basant sur des caractéristiques de polarité. Des expériences effectuées sur deux corpus permettent d&amp;rsquo;évaluer la validité de ce modèle.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèles d&#39;information pour la recherche multilingue.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons dans cet article plusieurs extensions multilingues des modèles d&amp;rsquo;infor- mation, en particulier le modèle log-logistique (LL) et le modèle Smoothed Power Law (SPL), récemment introduits en recherche d&amp;rsquo;information (Clinchant et al., 2010). Ces extensions sont fondées sur (a) une généralisation de la notion d&amp;rsquo;information utilisée dans ces modèles, (b) une généralisation des variables aléatoires utilisées et (c) une expansion de la requête utilisant l&amp;rsquo;en- semble des traductions de chaque mot. Nous analysons ensuite ces extensions d&amp;rsquo;un point de vue théorique, par l&amp;rsquo;intermédiaire d&amp;rsquo;une condition que doivent satisfaire les systèmes de recherche d&amp;rsquo;information multilingue. Cette nouvelle condition permet d&amp;rsquo;étendre le champ de l&amp;rsquo;approche axiomatique de la recherche d&amp;rsquo;information au cadre multilingue. Les résultats expérimentaux, obtenus sur trois collections et trois couples de langue, sont en accord avec l&amp;rsquo;analyse théo- rique et montrent que le modèle LL fournit les meilleurs résultats en recherche d&amp;rsquo;information multilingue.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Phrases Visuelles pour l&#39;annotation automatique d&#39;images.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;annotation automatique d&amp;rsquo;images photographiques est un problème complexe. En ef- fet, les caractéristiques visuelles des objets d&amp;rsquo;une classe varient selon l&amp;rsquo;instance considérée et les conditions de prise de vue. Nous proposons dans cet article une caractérisation visuelle des parties d&amp;rsquo;objets appelées &amp;lsquo;Phrases Visuelles&amp;rsquo;, robuste à ces variations. Une Phrase Visuelle est un ensemble de régions d&amp;rsquo;intérêts construit suivant des critères prédéfinis; un critère proposé et étudié ici est de nature topologique. Basé sur notre définition et caractérisation de Phrases Visuelles, nous proposons une méthode d&amp;rsquo;annotation d&amp;rsquo;images. Une expérimentation sur le cor- pus VOC2009 est présentée, et nous montrons que fusionner notre approche avec une approche standard à base de sac de mots visuels sur les images complètes fournit de meilleurs résultats qu&amp;rsquo;une annotation obtenue par approche standard seule.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Propositions pour la pondération des termes et l&#39;évaluation de la pertinence des éléments en recherche d&#39;information structurée.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.29/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.29/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;information dans des corpus de documents structurés doit faire face à de nombreuses problématiques. L&amp;rsquo;une d&amp;rsquo;elles concerne l&amp;rsquo;évaluation de la pertinence des élé- ments : le but est de renvoyer à l&amp;rsquo;utilisateur une liste triée de résultats. Cette évaluation repose sur la pondération des termes d&amp;rsquo;indexation utilisée ainsi que sur le modèle suivi pour la mise en correspondance de la requête et des éléments. Dans cet article, nous nous proposons d&amp;rsquo;explorer diverses pistes pour répondre à ce problème, parmi lesquelles on peut citer l&amp;rsquo;introduction du contexte des éléments à divers niveaux de granularité. Nos expérimentations utilisent le système XFIRM sur la campagne d&amp;rsquo;évaluation INEX 2005, et permettent de montrer l&amp;rsquo;importance de la spécificité des éléments pour les mesures de pertinence utilisées. La pertinence contextuelle semble quant à elle n&amp;rsquo;avoir que peu d&amp;rsquo;impact sur la pertinence des éléments, ce qui contre- dit de précédents résultats. Ceci met en lumière les contradictions obtenues par les différentes mesures de pertinence utilisées dans le cadre de la campagne d&amp;rsquo;évaluation INEX.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche visuo-textuelle d&#39;images sur le Web améliorée par sélection de la dimension.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons une méthode pour améliorer la recherche d&amp;rsquo;images sur le web dans le cas de requêtes bimodales composées de quelques mots et de quelques images. Pour chaque page web et chaque requête, une moyenne pondérée fusionne les distances textuelles basées sur tfidf et les distances visuelles. Nous montrons alors que cette recherche bi- modale d&amp;rsquo;images peut être optimisée en analysant simplement des images récupérées en ligne par des requêtes purement textuelle sur un moteur classique de recherche d&amp;rsquo;images sur le web. Nous approximons alors une Analyse Linéaire Discriminante (ALDA) sur ces images de déve- loppement pour estimer le sous-ensemble de traits optimaux de chaque requête traitée. Nous testons notre méthode sur la campagne Techno-Vision ImagEVAL (notre équipe s&amp;rsquo;y est classée 2nde sur 4), avec 700 URLs (700 pages web et 10k images). Nous discutons le comportement des résultats des requêtes en fonction du taux de texte dans la fusion. Les résultats montrent alors que nous pouvons automatiquement réduire le nombre de dimensions afin d&amp;rsquo;obtenir une réduction du temps de calcul de 35% sans dégradation des scores de Mean Average Precison.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers une détection en temps réel de documents Web centrés sur une entité donnée.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_55/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_55/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La tâche de désambiguïsation des entités nommées consiste à lier une mention ambiguë d&amp;rsquo;une entité dans un document à l&amp;rsquo;entité correspondante dans une base de connaissances. Dans ce travail, nous nous plaçons dans un cadre applicatif &amp;lsquo;inverse&amp;rsquo; et nous ajoutons une contrainte temporelle : nous souhaitons surveiller un flux de nouveaux documents Web et déterminer quels sont ceux mentionnant une entité donnée tout en mesurant l&amp;rsquo;importance de l&amp;rsquo;information conte- nue. Une telle approche peut servir à recommander des documents à des contributeurs si une information mérite d&amp;rsquo;être ajoutée dans la base de connaissances cible. Notre approche repose sur l&amp;rsquo;utilisation de deux classifieurs prenant en compte, pour déterminer l&amp;rsquo;intérêt d&amp;rsquo;un docu- ment du flux, des indices comme la fréquence de mentions de l&amp;rsquo;entité dans le temps ou dans le document, sa position ou encore la présence d&amp;rsquo;entités liées connues. Notre approche et l&amp;rsquo;impact des paramètres utilisés ont été évalués via une participation à la tâche &amp;lsquo;Knowledge Base Acce- leration&amp;rsquo; de TREC 2012 et a positionné notre équipe au rang 3 sur 11 (Bonnefoy et al., 2012).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apport du Web et du Web de Données pour la recherche d&#39;attributs.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_91/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_91/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous nous intéressons dans cet article aux requêtes de type entité pour lesquelles on souhaite renvoyer un ensemble d&amp;rsquo;attributs (propriétés). Ces attributs peuvent être collectés à partir de plusieurs sources et agrégés dans un seul document. Par exemple, l&amp;rsquo;entité &amp;lsquo;France&amp;rsquo; peut avoir les attributs &amp;lsquo;Langue officielle: Français&amp;rsquo;, &amp;lsquo;Villes:Paris, Toulouse, Lyon, &amp;hellip;&amp;rsquo; et &amp;lsquo;Population: 65350000 (en 2012)&amp;rsquo;. Un attribut peut être monovalué ou multivalué, et peut éven- tuellement dépendre d&amp;rsquo;autres dimensions. Pour chercher les attributs d&amp;rsquo;une entité, nous avons exploité deux sources: les tables relationnelles du Web (issues du HTML) et le Web de Données. Afin d&amp;rsquo;évaluer le potentiel de ces sources, nous avons mis en place une évaluation utilisateur. Les analyses ont montré l&amp;rsquo;utilité de combiner ces deux sources pour répondre aux requêtes de type entité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Architecture siamoise et embeddings de triplet pour la validation de relations</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_19/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_19/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La reconnaissance qu&amp;rsquo;une relation existe entre deux entités mentionnées dans un texte joue un rôle vital en extraction d&amp;rsquo;information (EI). Pour répondre à la nécessité d&amp;rsquo;annoter ma- nuellement de nombreux exemples, des paradigmes de supervision distante et d&amp;rsquo;EI non super- visée ont été proposés. Le point crucial dans ces approches est de pouvoir évaluer la validité des relations extraites. Dans cet article, nous proposons une nouvelle architecture neuronale pour modéliser la validation de relations, inspirée des modèles neuronaux pour l&amp;rsquo;implication textuelle. Nous encodons le texte et le triplet correspondant à la relation dans une architecture siamoise afin de décider si le texte supporte ou non la relation. Nous proposons différentes re- présentations d&amp;rsquo;une relation qui tirent profit de l&amp;rsquo;apprentissage joint de mots et d&amp;rsquo;entités dans un espace commun.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Corpus-Based vs. Model-Based Selection of Relevant Features.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.75/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.75/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le travail que nous présentons ici a pour but la comparaison de méthodes de sélection&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this contribution, we review a number of approaches to feature selection, divided in two broad classes. Some are corpus-based, ie they use only the data to assess the relevance of each feature, and aim at identifying a small subset of relevant features on which to train categorisation models. Others are model-based, ie they assess the relevance of each feature on the basis of the model used for categorisation. This second class of measures allows to better understand the model decisions. Furthermore, comparing the two classes provide insight on whether or not corpus-based feature extraction is selective enough, and does not overgener- ate compared to model-based selection. Our experimental comparison is mainly based on a collection of medical abstracts, provided by the Swiss Institute of Bioinformatics.&lt;/p&gt;</description>
    </item>
    <item>
      <title>De l&#39;importance des synonymes pour la sélection de passages en question-réponse.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de question-réponse développés actuellement adoptent pour la plupart et à peu de chose près le même type d&amp;rsquo;architecture que l&amp;rsquo;on peut schématiser en trois modules : l&amp;rsquo;analyse de la question, la sélection des documents, l&amp;rsquo;extraction de la réponse. Mais ce en quoi ils diffèrent, ce sont les outils (moteur d&amp;rsquo;indexation, analyseurs&amp;hellip;) et les bases de connaissances qu&amp;rsquo;ils utilisent. Pour chacun de ces systèmes, il est donc important d&amp;rsquo;évaluer l&amp;rsquo;apport de ces outils ou bases de connaissances. Dans le cadre de la campagne Equer (campagne d&amp;rsquo;évaluation des systèmes de question-réponse pour le français), notre système FRASQUES a produit deux jeux de résultats : l&amp;rsquo;un utilise des synonymes dans les bi-termes, l&amp;rsquo;autre pour les mono-termes aussi. La comparaison de ces deux tests et l&amp;rsquo;étude d&amp;rsquo;un corpus plus large, en français et en anglais, permet de mesurer l&amp;rsquo;apport de ces connaissances sémantiques.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Distinguer les requêtes pour améliorer la recherche d&#39;information XML.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.41/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.41/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;appuie sur une méthode de recherche d&amp;rsquo;information dans des collections de documents XML. Cette approche est configurable dans le but de pouvoir s&amp;rsquo;adapter à différents contextes de recherche. Au regard des résultats obtenus lors de différentes campagnes d&amp;rsquo;évaluations, l&amp;rsquo;efficacité de la méthode est inégale d&amp;rsquo;une requête à l&amp;rsquo;autre. De plus, différentes configurations de la méthode ne conduisent pas à la même efficacité pour la même requête. Nous introduisons dans cet article différents critères pour distinguer différents types de requête. Nous tentons de recenser des critères ayant une influence sur la méthode et de définir la configuration la plus adaptée à un type de requête. Cet article s&amp;rsquo;appuie sur des expérimentations menées sur les jeux de tests proposés lors des campagnes INEX d&amp;rsquo;évaluations des systèmes de recherche d`information XML.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Kodex ou comment organiser les résultats d&#39;une recherche d&#39;information par détection de communautés sur un graphe biparti?</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.25/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.25/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les Systèmes de Recherche d&amp;rsquo;Information structurent en général leurs résultats sous la forme d&amp;rsquo;une liste de documents. Nous pensons qu&amp;rsquo;il existe une structure plus riche dans ces résultats. En effet, la plupart des graphes obtenus à partir de données réelles (entre autre, les graphes de documents) partagent certaines propriétés structurelles, en particulier une organisation en communautés que nous proposons d&amp;rsquo;exploiter afin de mieux organiser l&amp;rsquo;ensemble des documents restitués pour une requête. Pour ce faire, l&amp;rsquo;ensemble des documents restitués est modélisé par un graphe biparti (Documents Termes) sur lequel est appliqué notre algorithme Kodex de détection de communautés. Cet article présente Kodex et son évaluation : sur la mesure F1, Kodex améliore significativement la baseline Okapi BM25 de 22 %.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Pertinence a Priori Basée sur la Diversit et la Temporalité des Signaux Sociaux.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.58/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.58/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les signaux sociaux associés aux ressources web peuvent être considérés comme une information additionnelle qui peut jouer un rôle pour mesurer une importance a priori de la ressource indépendamment de la requête. Dans cet article, nous nous intéressons particuliè- rement à la temporalité associée à ces signaux ainsi qu&amp;rsquo;à leur diversité. Nous supposons que l&amp;rsquo;importance a priori d&amp;rsquo;un document (ressource) dépend non seulement de la qualité de ces si- gnaux mais aussi de la date de leur création, leur diversité ainsi que la date de publication de la ressource. De ce fait, plutôt que d&amp;rsquo;estimer cette importance (probabilité) a priori par un simple comptage des signaux liés au document, nous intégrons également la date de publication de la ressource, pour ne pas pénaliser les nouvelles ressources, les dates des signaux pour privilé- gier les signaux récents, ainsi que la diversité de ces signaux. Nous évaluons la performance de notre approche sur la collection d&amp;rsquo;IMDb contenant 167438 ressources et leurs données so- ciales collectées à partir de plusieurs réseaux sociaux. Nos résultats montrent l&amp;rsquo;intérêt des signaux temporellement sensibilisés à la sélection des ressources pertinentes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;images par l&#39;analyse factorielle des correspondances.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.23/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.23/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;On utilise l&amp;rsquo;analyse factorielle des correspondances (AFC) pour la recherche d&amp;rsquo;images par le contenu en s&amp;rsquo;inspirant directement de son utilisation en analyse des données textuelles (ADT). En ADT, l&amp;rsquo;AFC est appliquée à un tableau de contingence croisant mots et documents. La première étape consiste donc à établir des u mots visuels » dans les images (analogue des mots dans les textes). Ces mots sont construits à partir des descripteurs locaux (SIFT) des images. La méthode a été testée sur la base Caltech4 (Sivic et al., 2005) et elle fournit de meilleurs résultats (qualité des résultats de recherche et temps d&amp;rsquo;exécution) que des méthodes plus classiques comme TF*IDF/Rocchio (Rocchio, 1971) ou pLSA (Hofmann, 1999b). Enfin, pour passer à l&amp;rsquo;échelle, nous proposons un nouveau prototype de recherche utilisant des fichiers inversés basés sur la contribution des images à l&amp;rsquo;inertie des axes à l&amp;rsquo;issue d&amp;rsquo;une AFC. Chaque fichier inversé est associé à une partie d&amp;rsquo;un axe et contient des images ayant une contribution forte à l&amp;rsquo;inertie de cet axe. Les tests réalisés montrent que ce nouveau prototype réduit le temps de recherche sans perte de qualité de résultat.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recommandation de séquences d’activités lors d&#39;événements distribués</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le nombre d&amp;rsquo;événements sociaux augmente de manière significative et les services basés sur la localisation deviennent partie intégrante de notre vie. Ainsi la recommandation de séquences d&amp;rsquo;activities devient une application émergente importante. Ce problème est crucial dans le cas d&amp;rsquo;événements distribués (e.g. festival ou croisière) qui rassemblent plusieurs activités concurrentes. Un participant à de tels événements est submergé par le choix de nombreuses activités possibles et fait face au problème de sélection d&amp;rsquo;activités. Dans cet article, nous formulons le problème de recommandation de séquences d&amp;rsquo;activités comme la combinaison du problème de recommandation d&amp;rsquo;événements et du problème de planification. Nous proposons une nouvelle approche qui évalue l&amp;rsquo;intérêt de l&amp;rsquo;utilisateur pour une activité fondée sur diverses facettes, explore l&amp;rsquo;historique de l&amp;rsquo;utilisateur pour extraire leurs motifs comportementaux et les utilise dans la construction de l&amp;rsquo;itinéraire. Une évaluation sur un jeu de données construit à partir du programme d&amp;rsquo;une croisière montre une amélioration moyenne de 9.7% par rapport à l&amp;rsquo;état de l&amp;rsquo;art. Ce travail a été présenté à la conférence ICCS 2017 (Nurbakova et al., 2017).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recommandation par combinaison de filtrage collaboratif et d&#39;analyse de sentiments.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les domaines de la recommandation et de la classification de sentiments sont restés complètement disjoints jusqu&amp;rsquo;ici: d&amp;rsquo;un coté, la recommandation exploite les matrices d&amp;rsquo;inter- action entre les utilisateurs et les produits, sous la forme de notes en faisant l&amp;rsquo;impasse sur les données textuelles, de l&amp;rsquo;autre, la fouille d&amp;rsquo;opinion exploite les revues/notes de consomma- teurs pour construire des modèles d&amp;rsquo;analyse de documents. Nous proposons dans cet article un modèle exploitant aussi des données d&amp;rsquo;interaction textuelles présentes dans les revues de consommateurs pour construire un modèle de recommandation novateur et performant.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Reconnaissance de critères de comparabilité dans un corpus multilingue spécialisé.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.33/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.33/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Notre objectif est d&amp;rsquo;automatiser la construction de corpus comparables spécialisés à partir du Web. La comparabilité se base sur trois niveaux : le domaine, le thème et le type de discours. Le domaine et le thème peuvent être filtrés grâce aux mots-clés utilisés lors de la re- cherche. Nous présentons dans cet article la reconnaissance automatique du type de discours dans des documents spécialisés français et japonais, qui nécessite une analyse linguistique poussée. Une analyse contrastive des documents nous permet de déterminer quelles informa- tions paraissent discriminantes. En s&amp;rsquo;inspirant des travaux classiques de recherche d&amp;rsquo;informa- tion, nous créons une typologie robuste et linguistiquement motivée basée sur trois niveaux d&amp;rsquo;analyse : structurel, modal et lexical. Cette typologie nous permet d&amp;rsquo;apprendre des modèles de classification qui donnent de bons résultats, ce qui montre l&amp;rsquo;efficacité de cette typologie.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Retrieval effectiveness study with Farsi language.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.25/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.25/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans  le  but  d&amp;rsquo;utiliser  le  persan  comme  langue  de  référence,  et  en  utilisant  une&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Having Farsi as the underlying language and using a test collection of 166,774 documents and 100 topics, this experiment evaluates the retrieval effectiveness of different IR models while using a light and a plural stemmer as well as n-grams and trunc-n indexing strategies. Moreover the impact of stoplist removal is evaluated. According to the obtained&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un gestionnaire de dialogue oral arabe Homme-machine : Réalisation et évaluation.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.19/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.19/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le présent papier, nous proposons un gestionnaire de dialogue oral arabe Homme-machine. Ce travail entre dans le cadre de la réalisation du serveur vocal interactif SARF (Bahou et al., 2008) qui offre des renseignements sur le transport ferroviaire tunisien en langue arabe standard moderne. Le gestionnaire de dialogue, que nous proposons, se base sur une approche structurelle et utilise une grammaire formelle transformée en un automate fini déterministe afin d&amp;rsquo;assurer le suivi et le maintien du dialogue avec l&amp;rsquo;utilisateur. Les résultats d&amp;rsquo;évaluation de ce gestionnaire de dialogue sont très encourageants. Ainsi, les taux de réussite des tâches et d&amp;rsquo;identification des actes de dialogue sont respectivement de 89.65% et 98.31%, le temps moyen d&amp;rsquo;exécution des tâches est de 0.0779 secondes et les dialogues sont maintenus avec une moyenne de 13 tours de parole par dialogue.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle syllabique pour la reconnaissance de l&#39;écriture.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous introduisons un nouveau modèle syllabique pour la reconnaissance de l&amp;rsquo;écriture. Une méthode de syllabation orthographique supervisée du Français est proposé pour la construction d’un vocabulaire de syllabes. Un modèle de langage statistique en n-gram combinant syllabes et caractères est appris sur un corpus Wikipedia. Le système de reconnaissance d’écriture fondé sur des modèles optiques HMM de caractères procède à un décodage en deux passes en exploitant le modèle syllabique proposé. L’évaluation est réalisée sur la base RIMES en analysant les performances pour différents taux de couverture du modèle syllabique. Nous comparons le modèle proposé à un modèle lexical ainsi qu’à un modèle de caractères. L’approche proposée permet d’atteindre des performances intéressantes grâce à sa capacité à couvrir une proportion importante des mots hors lexique en travaillant avec un lexique de syllabes de taille limitée combiné à un modèle de n-gram d’ordre raisonnable.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une approche d&#39;extraction et de recherche d&#39;information spatiale dans les documents textuels - évaluation.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.53/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.53/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier propose une approche d&amp;rsquo;Extraction d&amp;rsquo;Information (EI) et de Recherche d&amp;rsquo;Information (RI) spatiales dans le cadre de bibliothèques numériques liées au patrimoine culturel local. L&amp;rsquo;approche proposée (implémentée dans le prototype PIV) est construite autour d&amp;rsquo;une analyse sémantique de tels corpus et de&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper deals with Information Extraction and Retrieval in a Geographic oriented Digital Libraries environment. The proposed approach (implemented within PIV prototype) is based on a semantic analysis of digital corpora and free text queries. First, we&lt;/p&gt;</description>
    </item>
    <item>
      <title>Variations axiomatiques pour la recherche d’information personnalisée.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.12/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.12/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;intéresse à l&amp;rsquo;exploitation du profil des utilisateurs pour la recherche d&amp;rsquo;information dans un réseau social d&amp;rsquo;annotation (tagging). Nous faisons l&amp;rsquo;hypothèse que le profil doit être filtré de manière adéquate pour permettre une personnalisation efficace de la requête. Afin d&amp;rsquo;étudier cette personnalisation d&amp;rsquo;un point de vue axiomatique, la contrainte d&amp;rsquo;expansion de requête basée sur le profil est alors définie. Elle décrit le comportement attendu des termes du profil utilisateur qui permettront de personnaliser la requête. Nous fixons un exemple d&amp;rsquo;in- tégration de cette contrainte dans le cadre d&amp;rsquo;un modèle probabiliste, avant d&amp;rsquo;étudier l&amp;rsquo;impact de la requête dans le filtrage du profil d&amp;rsquo;un utilisateur. Les expérimentations effectuées sur le corpus Bibsonomy montrent que même une mise en oeuvre simple de la contrainte donne de bons résultats pour la personnalisation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Analyse morphologique fine pour la recherche d&#39;information biomédicale.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.41/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.41/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le domaine biomédical, l&amp;rsquo;emploi de termes spécialisés est la clef de l&amp;rsquo;accès à l&amp;rsquo;in- formation. Mais dans la plupart des langues indo-européennes, ces termes sont des construc- tions morphologiques complexes. Dans cet article, nous cherchons à identifier les différents éléments de sens composant ces termes et utilisons ces analyses pour améliorer la recherche d&amp;rsquo;information biomédicale. Nous présentons en particulier une approche automatique combi- nant alignement avec une langue pivot et apprentissage analogique permettant une analyse morphologique fine des termes. Ces analyses morphologiques sont utilisées pour améliorer l&amp;rsquo;indexation des documents médicaux. Les expériences rapportées dans cet article montrent le bien-fondé de cette approche avec des améliorations de MAP de +10% par rapport à un système de RI standard.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Construction et évaluation d’un corpus pour la recherche d’instances d’images muséales.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente la construction et l&amp;rsquo;évaluation deux collections d&amp;rsquo;images et de vidéos d&amp;rsquo;oeuvres. Ces données proviennent de deux musées : le musée de Grenoble (majoritai- rement des peintures) et le Musée de Lyon-Fourvière (des objets pré-romains et romains). Ces collections contiennent au total 4674 images annotées, correspondant à 784 objets, et 3 heures 7 minutes de vidéos de visites annotées prises à la première personne par 5 visiteurs. Ces collections sont accessibles pour la communauté de recherche afin d&amp;rsquo;évaluer les systèmes d&amp;rsquo;an- notation et de recherche d&amp;rsquo;images et de vidéos. Les images de ces collections sont partionnées en deux sous-ensembles : 361 requêtes évaluées sur un corpus de 4313 images. De plus, 2132 images supplémentaires, extraites des vidéos de visite, permettent d&amp;rsquo;évaluer les systèmes pour des images issues d&amp;rsquo;un autre protocole de capture. Nous avons expérimenté trois approches de l&amp;rsquo;état de l&amp;rsquo;art (ORB+RANSAC, SIFT+Sac-de-mots, apprentissage profond) sur ces collections.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Corpus d’entraînement sur les plongements de mots pour la recherche de microblogs culturels</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit un cadre expérimental et des résultats obtenus pour la recherche de microblogs. Notre approche consiste à étudier de quelle manière l&amp;rsquo;apport de l&amp;rsquo;utilisation de plongements de mots, très populaire actuellement en recherche d&amp;rsquo;information, est dépendant de l&amp;rsquo;ensemble d&amp;rsquo;apprentissage de ces plongements. Nous étudions en particulier son utilisation pour étendre des requêtes sur des tweets culturels sur le corpus CLEF CMC 2016. Nos résultats montrent que l&amp;rsquo;utilisation de corpus spécifiques (au niveau sujet ou bien sujet+type de document) ne fournit pas forcément de meilleurs résultats.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Detecting new word meanings: a comparison of word embedding models in Spanish</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_15/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_15/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les néologismes sémantiques (NS) sont définis comme des mots qui acquièrent une nou- velle signification tout en maintenant leur forme. Compte tenu de la nature de ce type de néolo- gisme, la tâche d&amp;rsquo;identifier ces nouveaux sens des mots est actuellement effectuée manuellement par des spécialistes des observatoires de néologie. Pour détecter les NS de manière semi- automatique, nous avons développé un système mettant en uvre une combinaison des stratégies suivantes: modélisation de sujets, extraction de mots-clés et désambiguïsation du sens des mots. Le rôle de la modélisation des sujets est de détecter les thèmes traités dans le texte dentrée. Les thèmes d&amp;rsquo;un texte donnent des indications sur le sens particulier des mots utilisés. Par exemple, viral a un sens dans un contexte informatique (CS) et un autre lorsqu&amp;rsquo;il est question de santé. Pour extraire des mots-clés, nous avons utilisé TextRank avec filtrage des balises POS. Avec cette méthode, nous pouvons obtenir des mots pertinents qui font déjà partie du lexique espagnol. Nous utilisons un modèle d&amp;rsquo;apprentissage profonde pour déterminer si un mot-clé donné peut avoir une nouvelle signification. Des word embbeding différentes de toutes les significations connues (ou sujets) indiquent qu&amp;rsquo;un mot peut être un candidat NS valide. Dans cette étude nous examinons les modèles word embbeding suivants: Word2Vec, Sense2Vec et FastText. Les modèles ont été formés avec des paramètres équivalents en utilisant Wikipédia en espagnol en tant que corpus. Nous avons ensuite utilisé une liste de mots et leurs concor- dances (obtenus à partir de notre base de données de néologismes) pour montrer les différentes imbrications générées par chaque modèle. Enfin, nous présentons une comparaison de ces ré- sultats avec les concordances de chaque mot pour montrer comment nous pouvons déterminer si un mot peut être un candidat valide pour NS.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Diversité hiérarchique et utilisation d&#39;arbres de concepts pour la recherche d&#39;images.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_14/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_14/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;images est de plus en plus efficace, mais les résultats similaires ont tendance à se regrouper. Dans cet article, nous montrons comment améliorer la diversité des résultats en prenant en compte la nature intrinsèquement hiérarchique de la diversité. Afin d&amp;rsquo;ex- ploiter les différents niveaux de granularité de la diversité, nous utilisons une approche basée sur une classification ascendante hiérarchique (CAH). De plus, nous introduisons une nouvelle approche qui exploite une arborescence de concepts. Pour éviter le conflit entre pertinence et diversité, les différentes approches sont comparées sur un corpus dédié annoté manuellement où tous les documents sont pertinents, et sur un corpus de l&amp;rsquo;état de l&amp;rsquo;art (ImageClef photo 2008). Les résultats montrent que l&amp;rsquo;approche hiérarchique améliore la diversité des résultats.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Dynamiques des popularités dans YouTube.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.55/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.55/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article est une étude de l’évolution du nombre de vues des contenus dans You-&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The goal of this paper is to study the behaviour of view count in YouTube. We first propose several bio-inspired and economy-inspired models for the evolution of the view count of YouTube videos. We show, using a large set of empirical data, that the view count for 90% of videos in YouTube can indeed be associated to at least one of these models, with a Mean Error which does not exceed 5%. We derive automatic ways of classifying the view count curve into one of these models and of extracting the most suitable parameters of the model. We study empirically the impact of videos&amp;rsquo; popularity and category on the evolution of its view count. We finally use the above classification along with the automatic parameters extraction in order to predict the evolution of videos&amp;rsquo; view count.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Expansion de requêtes par apprentissage automatique dans un assistant pour la recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.89/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.89/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les outils disponibles de recherche d&amp;rsquo;information sur le Web ont une approche généraliste, ne prenant pas en compte les caractéristiques de l&amp;rsquo;utilisateur, ce qui limite la qualité des résultats qu&amp;rsquo;ils sont susceptibles de fournir. Le système AIRA présenté ici utilise les références documentaires rassemblées par l&amp;rsquo;utilisateur pour construire un profil le représentant, exploité pour interpréter et filtrer les résultats proposés par les moteurs de recherche. Dans cet article nous nous focalisons sur un algorithme d&amp;rsquo;expansion de requêtes à l&amp;rsquo;aide de techniques de l&amp;rsquo;apprentissage machine, et sur les problèmes par l&amp;rsquo;évaluation de cette famille de systèmes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Fusion de multi-modalités et réduction par sémantique latente.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.39/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.39/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier étudie la &amp;lsquo;sémantique latente&amp;rsquo; entre des éléments visuels et textuels d&amp;rsquo;une collection multimédia, appliquée à deux tâches : (1) la Recherche de Document Multimédia (RDM) contenant des images et du texte ; et (2) l&amp;rsquo;Annotation Automatique d&amp;rsquo;Images (AAI). La sémantique latente, habituellement utilisée dans l&amp;rsquo;indexation textuelle, est mise à profit ici pour faire apparaître des liens entre les descriptions textuelles et visuelles des images. Nous avons ainsi deux contributions principales. Il s&amp;rsquo;agit d&amp;rsquo;une part, de la première étude sur l&amp;rsquo;influence de la sémantique latente entre termes textuels et visuels, sur une grande collection de documents. En effet, cette méthode est testée sur une collection de 20000 images touristiques. D&amp;rsquo;autre part, nous démontrons que la fusion des différents modalités d&amp;rsquo;image (i.e. termes visuels vs textuels, et différentes méthode de représentations d&amp;rsquo;image) améliore le résultat d&amp;rsquo;une annotation au- tomatique des images par du texte. Nos collections de test sont la base d&amp;rsquo;images annotées de COREL et la base d&amp;rsquo;ImageCLEF 2006.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation sémantique et recherche d&#39;information interactive.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.65/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.65/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Parmi les différentes facettes de la recherche d&amp;rsquo;information en données textuelles, la recherche d&amp;rsquo;informations localisées dans l&amp;rsquo;espace et dans le temps constitue un domaine d&amp;rsquo;étude à part entière. Celle-ci nécessite en effet, pour l&amp;rsquo;indexation comme pour la recherche, des analyses linguistiques et des ressources spécifiques. Le projet GéoSem fut le cadre de conception  de  techniques  d&amp;rsquo;indexation  sémantique  d&amp;rsquo;informations  géographiques.  Ces techniques  se  trouvent  aujourd&amp;rsquo;hui  mises  en  oeuvre  au  sein  d&amp;rsquo;un  moteur  de  recherche permettant la localisation intra-documentaire des informations, indexées selon des u axes sémantiques » géographiques (temps, espace et phénomène), sa généricité permettant de le paramétrer pour d&amp;rsquo;autres axes. Une visualisation de la localisation spatiale et temporelle de l&amp;rsquo;information est également proposée. Cet article décrit les différentes facettes du moteur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>La CTC et son intrigant label « blank » : étude comparative de méthodes d&#39;entraînement de réseaux de neurones pour la reconnaissance d&#39;écriture.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-20/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-20/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de reconnaissance d’écriture vainqueurs d’évaluations internationales&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In recent years, Long Short-Term Memory Recurrent Neural Networks (LSTM-RNNs)&lt;/p&gt;</description>
    </item>
    <item>
      <title>Learning to Extract Answers in Question Answering: Experimental Studies.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.24/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.24/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes Question/Réponse sont des programmes complexes capables de répondre à une question en langage naturel, en utilisant comme source d&amp;rsquo;information soit un corpus donné, soit, comme c&amp;rsquo;est le cas ici, le Web. Pour cela, ces systèmes réalisent différentes sous- tâches parmi lesquelles la dernière, appelée extraction de la réponse, est très similaire à une tâche d&amp;rsquo;Extraction d&amp;rsquo;Information. L&amp;rsquo;objectif de cet article est d&amp;rsquo;adapter les techniques d&amp;rsquo;ap- prentissage automatique utilisées en Extraction d&amp;rsquo;Information à l&amp;rsquo;extraction de la réponse. Les spécificités des systèmes Question/Réponse sont identifiées et utilisées dans cette adaptation. Trois algorithmes utilisant une abstraction croissante du texte sont testés et comparés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche approchée d&#39;information dans une base de documents semi-structurés.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.53/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.53/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons des algorithmes dédiés à l&amp;rsquo;indexation et à la recherche approximative d&amp;rsquo;information dans les bases de données hétérogènes semi-structurées XML. Le modèle d&amp;rsquo;indexation proposé est adapté à la recherche de contenu textuel dans les contextes XML définis par les structures d&amp;rsquo;arbres. Les mécanismes de recherche approchée mis en oeuvre s&amp;rsquo;appuient sur une distance de Levenshtein modifiée et des heuristiques de fusion d&amp;rsquo;information. Une implémentation exploitant simultanément l&amp;rsquo;information structurée, i.e. l&amp;rsquo;arborescence des éléments XML, et le contenu des documents indexés est décrite. Les performances obtenues dans le cadre de la campagne d&amp;rsquo;évaluation INEX 2005 sont présentées et analysées.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Spatio-Temporal Modeling for Knowledge Discovery in Satellite Image Databases.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.35/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.35/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;extraction automatique des connaissances à partir des images satellitaires dans un contexte spatio-temporel est un défit majeur pour le domaine de la télédétection. Dans ce contexte, nous présentons une approche haut-niveau pour la modélisation des connaissances spatio-temporelles à partir des images satellitaires. Nous proposons, aussi, d&amp;rsquo;utiliser une seg- mentation multi-approche comportant plusieurs méthodes de segmentation pour améliorer la modélisation et l&amp;rsquo;interprétation des images. Les expérimentations montrent que les résultats de la segmentation issues de l&amp;rsquo;approche proposée sont meilleurs que celles des méthodes clas- siques.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle de recherche d&#39;information collaborative basé sur l&#39;expertise des utilisateurs.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans ce papier, nous nous intéressons à un contexte de recherche d&amp;rsquo;information col- laborative où les utilisateurs sont caractérisés par différents niveaux d&amp;rsquo;expertise du sujet de la requête. Nous proposons un modèle d&amp;rsquo;ordonnancement de documents intégrant les rôles d&amp;rsquo;ex- pert et de novice tenant compte de la spécificité de chacun des rôles et assignant un document à l&amp;rsquo;utilisateur le plus à même de le juger en fonction de son niveau d&amp;rsquo;expertise. Pour cela, les scores de pertinence document-requête sont calculés en y intégrant la variable rôle puis optimisés par la méthode d&amp;rsquo;apprentissage de maximisation de l&amp;rsquo;espérance mathématique. L&amp;rsquo;évaluation expérimentale est réalisée selon un cadre de simulation de la collaboration à partir de fichiers log de la collection TREC Interactive et montre l&amp;rsquo;efficacité de notre approche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une étude de l&#39;impact de la structure sur la recherche multimédia.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.51/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.51/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;inscrit dans le cadre de la recherche XML multimedia, dont l&amp;rsquo;objectif est de trouver des fragments multimedia pertinents (c&amp;rsquo;est à dire des fragments XML contenant au moins un autre media que le texte). Dans des travaux précédents, nous avons proposé un modèle pour la recherche de fragments multimedia appliqué au media &amp;lsquo;image&amp;rsquo;. Ce modèle consiste tout d&amp;rsquo;abord à trouver les images pertinentes et ensuite, à définir les fragments multimedia pertinents à partir de ces images. Dans cet article, nous nous intéressons plus particulièrement à la première partie du modèle où nous étudions l&amp;rsquo;impact de différents facteurs structurels pour la recherche d&amp;rsquo;images. Cette étude comparative est effectuée à travers une approche basée sur une analogie entre un document XML et une ontologie. Les facteurs sont évalués dans le cadre de la tâche Multimedia de campagne d&amp;rsquo;évaluation INEX 2007, et montrent l&amp;rsquo;intérêt de l&amp;rsquo;utilisation de la structure dans le processus de recherche multimedia.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une Nouvelle Approche d&#39;Expansion Sociale de Requêtes dans le Web 2.0.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.41/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.41/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article aborde le problème d&amp;rsquo;expansion de requêtes qui consiste à enrichir les requêtes utilisateurs avec de l&amp;rsquo;information additionnelle pour maximiser son niveau de satis- faction en prenant en considération son écosystème. Tout en considérant les systèmes de book- marking sociaux, l&amp;rsquo;approche proposée considère : (i) la similarité sémantique entre les termes qui composent les requêtes, (ii) la proximité sociale entre les termes qui composent les requêtes et les profils utilisateurs construits sur la base des intérêts de l&amp;rsquo;utilisateur et de ses voisins so- ciaux, et (iii) a la volé, une stratégie pour enrichir les requêtes utilisateurs. Cette approche a été évaluée sur un ensemble de données de del.icio.us et les résultats obtenus montrent son intérêt.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Approche hybride de segmentation de page à base d&#39;un descripteur de traits.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons une nouvelle approche hybride pour la segmenta- tion de pages basée sur les composantes connexes et sur l&amp;rsquo;analyse de régions. Nous décrivons d&amp;rsquo;abord notre descripteur de traits qui permet de détecter les candidats de texte et des lignes par la squelettisation de l&amp;rsquo;image du document binarisée. Ensuite, un modèle de contours actifs est appliqué pour segmenter le reste de l&amp;rsquo;image en photos et arrière plan. Cette classification est vérifiée par l&amp;rsquo;étude de la variation de chacune des régions détectées. Enfin, les candidats de texte sont classifiés à l&amp;rsquo;aide de la technique du clustering &amp;ldquo;mean-shift&amp;rsquo; en fonction de leurs tailles et nous présentons une approche adaptative d&amp;rsquo;analyse du profil de projection pour re- cueillir séparément les régions de texte horizontales et verticales. Cette méthode est appliquée pour la segmentation des images réelles des documents numérisés (journaux et magazines) qui contiennent du texte, lignes et des régions de photos. Nous évaluons les performances de notre approche en la comparant avec les méthodes existantes qui ont participé à la compétition de segmentation de pages &amp;ldquo;ICDAR page segmentation competition&#39;.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Bandit contextuel pour la capture de données temps réel sur les médias sociaux.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La plupart des médias sociaux offrent un accès aux flux de données produites par leurs&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Social media usually provide streaming data access that enable dynamic capture of&lt;/p&gt;</description>
    </item>
    <item>
      <title>Combinaison des caractéristiques des termes pour l&#39;extension de requêtes en recherche d&#39;information dans les documents semi-structurés.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.77/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.77/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;En Recherche d&amp;rsquo;Information (RI), l&amp;rsquo;utilisateur a souvent recours, pour des raisons de simplicité, à de simples mots clés pour exprimer sa requête. Les requêtes composées de mots clés sont aussi très utilisées dans le cadre de la recherche d&amp;rsquo;information structurée (c&amp;rsquo;est à dire dans des documents structurés de type XML), puisqu&amp;rsquo;elles n&amp;rsquo;exigent pas une connaissance ap- profondie de la structure des documents. Ces requêtes sont cependant souvent insuffisantes pour décrire les besoins de l&amp;rsquo;utilisateur. Dans cet article, nous proposons une nouvelle approche de reformulation de requêtes à base de mots clés dans des documents XML. Cette approche permet d&amp;rsquo;une part d&amp;rsquo;enrichir la requête initiale en fonction des jugements de pertinence, et d&amp;rsquo;autre part d&amp;rsquo;exprimer des degrés de préférence pour chaque nouveau mot clé : c&amp;rsquo;est ce qu&amp;rsquo;on appelle la re- pondération. Notre approche est basée sur une combinaison de mesures caractérisant un terme dans les éléments jugés pertinents pour une requête donnée. Nos propositions ont été évaluées grâce à la campagne d&amp;rsquo;évaluation INEX et les résultats montrent l&amp;rsquo;intérêt de nos méthodes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Du e-commerce au m-commerce : vers une recommandation incrémentale.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.51/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.51/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de recommandation, et notamment le filtrage collaboratif, sont tradition- nellement utilisés dans les domaines du e-commerce et de la navigation web pour suggérer des ressources pertinentes aux utilisateurs au moment adéquat. Dans des approches dites &amp;lsquo;mo- dèle&amp;rsquo;, nous pouvons trouver les modèles à base d&amp;rsquo;usage et les règles d&amp;rsquo;association. Dans la littérature, ces modèles sont présentés comme des systèmes temps-réel. Ces dernières années, le domaine du m-commerce a émergé, dans lequel les recommandations sont diffusées sur un mobile au lieu de l&amp;rsquo;écran d&amp;rsquo;un ordinateur. Il faut donc adapter les techniques de recommanda- tion aux nouvelles contraintes des terminaux mobiles. En particulier, puisque le respect de la vie privée est un objectif important, une façon de la préserver est de stocker les systèmes de recommandation sur le mobile. Cependant, bien que les systèmes de recommandation à base d&amp;rsquo;usage sont temps-réel, la génération des recommandations est complexe, et dans le cas où ils sont stockés sur le mobile, ils peuvent ne plus être temps-réel. Dans cet article, nous proposons un nouveau système de recommandation incrémental, à base d&amp;rsquo;usage, dans le but d&amp;rsquo;obtenir des recommandations instantanées dans le cadre du m-commerce.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Étude de l’informativité des transcriptions : une approche basée sur le résumé automatique</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper27short/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper27short/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous proposons une nouvelle approche d&amp;rsquo;évaluation de l&amp;rsquo;informativité des transcriptions issues de différents systèmes de Reconnaissance Automatiques de la Parole. Cette approche, fondée sur la notion d&amp;rsquo;informativité, s&amp;rsquo;inscrit particulièrement dans le cadre du Résumé Automatique de texte effectué sur ces transcriptions. Nous estimons, dans un premier temps, le contenu informatif des différentes transcriptions. Par la suite, nous explorons la capacité du Résumé automatique de texte pour surmonter la perte informative. Pour ce faire, nous utilisons un protocole d&amp;rsquo;évaluation automatique de résumés sans références basé sur le contenu informatif. Le but est de calculer les divergences entre les distributions de probabilité des différentes représentations textuelles obtenues: des transcriptions manuelles et automatiques et leurs résumés. À l&amp;rsquo;issue d&amp;rsquo;une série d&amp;rsquo;évaluations, cette analyse nous a permis de juger à la fois la qualité des transcriptions en terme d&amp;rsquo;informativité et d&amp;rsquo;évaluer la capacité du résumé automatique de texte à compenser les problèmes soulevés lors de la phase de transcription.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Exploration de l&#39;apport de l&#39;analyse des perceptions oculaires : étude préliminaire pour le bouclage de pertinence</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_1/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nos travaux visent à évaluer l’impact potentiel de l’utilisation des perceptions oculaires&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Our work aims to evaluate the potential impact of the use of ocular perceptions analysis&lt;/p&gt;</description>
    </item>
    <item>
      <title>Inspiration des sondages d&#39;opinion pour réduire la latence en filtrage collaboratif.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.49/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.49/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le filtrage collaboratif est l&amp;rsquo;une des approches les plus populaires des systèmes de recommandation. En filtrage collaboratif, le système cherche à estimer les préférences de l&amp;rsquo;uti- lisateur actif en exploitant les préférences (les notes) des utilisateurs similaires à cet utilisateur actif : ses voisins. Le filtrage collaboratif fait face au problème de latence : il ne peut recom- mander un nouvel item à des utilisateurs tant que cet item n&amp;rsquo;a pas été noté un nombre suffisant de fois. Pour diminuer ce problème de latence, nous proposons une approche à base de mentors s&amp;rsquo;inspirant des sondages d&amp;rsquo;opinion. Un mentor est un utilisateur fiable et représentatif, sur qui l&amp;rsquo;on peut compter. La connaissance des notes (opinions) des mentors sur les nouveaux items permet d&amp;rsquo;estimer les notes de la population entière. Nous montrons que, sur le corpus que nous avons utilisé, certaines méthodes de sélection des mentors requièrent les notes de seulement 6 mentors pour estimer les notes de la population entière, avec une erreur faible. Ainsi, lorsqu&amp;rsquo;un nouvel item est intégré dans le système, seules 6 notes sont requises pour faire des recomman- dations de bonne qualité à l&amp;rsquo;ensemble de la population.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Intérêt des ressources morphologiques pour la recherche d&#39;information précise.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.57/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.57/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente la construction automatique, le filtrage et la validation d&amp;rsquo;une ressource morphologique concernant les noms d&amp;rsquo;agents déverbaux. Cette validation utilise dif- férentes ressources et corpus pour tester l&amp;rsquo;appartenance des verbes et noms à la même famille morphologique, ainsi que leur lien, méthode qui peut se généraliser à d&amp;rsquo;autres ressources du même type. Hormis une méthode de construction et d&amp;rsquo;aide à la validation d&amp;rsquo;une ressource, nous montrerons l&amp;rsquo;intérêt de disposer de ressources morphologiques pour la recherche de courts passages en questions-réponses.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Interface pour l&#39;évaluation de systèmes de recherche sur des documents XML.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.109/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.109/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;évaluation des systèmes de Recherche d&amp;rsquo;Information est depuis le début un des piliers de l&amp;rsquo;évolution de ce domaine. La qualité de l&amp;rsquo;évaluation est d&amp;rsquo;une importance capitale puisqu&amp;rsquo;elle permet de discriminer les différents modèles entre eux. Il est donc primordial de pouvoir constituer des corpus où les questions et leurs jugements de pertinence associés sont de qualité. Alors qu&amp;rsquo;avec des documents plats les méthodes sont bien établies, ce n&amp;rsquo;est plus le cas avec des documents structurés de type XML. Il est donc nécessaire de développer de nou- velles façons d&amp;rsquo;évaluer. Nous présentons dans cet article l&amp;rsquo;interface utilisée lors de la campagne INEX 2003 qui permet d&amp;rsquo;évaluer de façon la plus consistante et la plus exhaustive possible les documents XML.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Mise en œuvre d’une base de données graphe pour l’analyse des logs de requêtes en recherche d’information.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.1/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les travaux présentés dans cet article concernent la mise en oeuvre d&amp;rsquo;une base de données orientée graphe pour l&amp;rsquo;étude des reformulations de requêtes réalisées par les utilisa- teurs d&amp;rsquo;un moteur de recherche. Notre objectif est de rechercher des patrons de reformulation à des fins d&amp;rsquo;analyse linguistique. Nous nous sommes appuyés sur un log de connexion issu d&amp;rsquo;un moteur de recherche associé à la librairie digitale Revue.org. Après avoir extrait les sessions de recherche, nous avons défini plusieurs types de liens pouvant être extraits des reformulations et nous avons créé une base de données orientée graphe avec ces données. Nous nous sommes ensuite appuyés sur ces liens pour analyser la structure du graphe obtenu et extraire des élé- ments sur l&amp;rsquo;utilisation des termes. Nous avons proposé différents patrons de reformulation de requêtes qui pourraient être utilisés dans une reformulation automatique des requêtes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;images en mobilité : le système IOTA-EyeSnap.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_68/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_68/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit le système IOTA-EyeSnap, un système de recherche d&amp;rsquo;images mobile appliqué à la recherche de photographies de peintures dans le cadre du projet CLICIDE. Ce système repose sur un enchaînement d&amp;rsquo;approches probabilistes : la première à base de modèle de langue sur des graphes représentant les images, et la seconde à base de modèles bayésiens. Nous détaillons les contraintes et les choix réalisés. Ils sont adaptés à la mobilité dans un cadre muséal. Les différents outils permettant une évaluation a priori et a posteriori sont présentés, et les résultats expérimentaux sont décrits et analysés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche de conversations dans les réseaux sociaux : modélisation et expérimentations sur Twitter.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La problématique étudiée dans cet article est celle de l&amp;rsquo;indexation et de la recherche de conversations dans les réseaux sociaux. Une conversation est un ensemble de messages échangés entre utilisateurs, à la suite d&amp;rsquo;un message initial. La démarche proposée se base sur une modélisation probabiliste, et détaille en particulier l&amp;rsquo;utilisation d&amp;rsquo;informations sociales dans le réseau Twitter. Notre proposition est évaluée sur un corpus de conversations contenant plus de 50 000 tweets, et sur un ensemble de 15 requêtes tirées pour partie des campagnes TREC Microblog (Lin et Efron, 2013). Les résultats obtenus en combinant les éléments de contenu et les éléments sociaux sur ce corpus sont statistiquement significativement meilleurs que ceux de notre approche utilisant le contenu seul ainsi que ceux d&amp;rsquo;une approche à base de BM25.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche par le contenu dans des documents audiovisuels multilingues.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.67/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.67/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons dans cet article une approche basée sur l&amp;rsquo;utilisation de l&amp;rsquo;Alpha- bet Phonétique International (API) pour l&amp;rsquo;indexation et la recherche par le contenu de docu- ments audiovisuels multilingues. L&amp;rsquo;approche fonctionne même si les documents contiennent des langues inconnues. Elle a été validée dans le cadre de la compétition u Star Challenge » sur les moteurs de recherche organisée par l&amp;rsquo;Agence A*STAR de Singapour. Notre approche comprend la construction d&amp;rsquo;un modèle acoustique multilingue basé sur l&amp;rsquo;API et une méthode fondée sur la programmation dynamique pour la recherche de segments de documents par u détection de chaînes API ». La programmation dynamique permet de repérer la chaîne de la requête dans la chaîne du document, même avec un taux d&amp;rsquo;erreur de transcription au niveau phonétique signifi- catif. Les méthodes que nous avons développées nous ont classés premiers et troisièmes sur les tâches de recherche monolingues (anglais), cinquièmes sur la tâche de recherche multilingue et premiers sur la tâche de recherche multimodale (audio et image).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une métrique pondérée pour la recherche textuelle d&#39;images dans des documents semi-structurés.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.55/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.55/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La naissance du standard XML et l&amp;rsquo;utilisation de plus en plus fréquente des images dans les documents électroniques ont soulevé une nouvelle problématique en recherche d&amp;rsquo;infor- mation: la recherche d&amp;rsquo;images dans des documents semi-structurés. Cet article s&amp;rsquo;inscrit dans ce contexte et présente une méthode permettant de calculer une re- présentation sémantique de l&amp;rsquo;image en utilisant le texte et la structure des documents. Plus précisément, nous proposons une mesure pour calculer la participation de chaque élément du document dans cette représentation. Cette mesure est inspirée d&amp;rsquo;une mesure de similarité sé- mantique entre les concepts d&amp;rsquo;une ontologie. Notre méthode est évaluée dans le cadre de la campagne de l&amp;rsquo;évaluation INEX 2006.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation du réseau sémantique de l&#39;UMLS pour la définition de types d&#39;entités nommées médicales.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.28/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.28/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les entités nommées (EN) sont des objets importants pour les systèmes de Questions- Réponses (QR). Cependant, les types d&amp;rsquo;EN habituels couvrent des concepts très généraux : dates, lieux géographiques, noms de personnes, etc. Pour un système de QR dédié à la méde- cine, il serait utile de disposer de types plus spécifiques. Une hiérarchie de types de concepts médicaux est définie dans l&amp;rsquo;UMLS, une grande base terminologique médicale produite par la NLM. Nous tentons d&amp;rsquo;évaluer l&amp;rsquo;utilisabilité de l&amp;rsquo;UMLS, dans sa partie francophone, comme source de telles entités. Nous réalisons un étiquetage d&amp;rsquo;un corpus médical par les concepts de l&amp;rsquo;UMLS et leurs types sémantiques. Puis nous montrons, à travers une étude statistique que les modalités de mise en oeuvre de ces nouveaux types d&amp;rsquo;EN doivent prendre en compte l&amp;rsquo;origine individuelle des documents explorés lors d&amp;rsquo;une tâche de QR.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers une stratégie de recherche d&#39;information structurée basée sur lacomparaison d&#39;arbres.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.65/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.65/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une approche statistique de comparaison d&amp;rsquo;arbres adaptée à la recherche d&amp;rsquo;information structurée. Elle consiste à associer l&amp;rsquo;indexation des structures des documents XML à l&amp;rsquo;indexation de leurs contenus et d&amp;rsquo;utiliser le double index résultant dans un processus de recherche. La recherche s&amp;rsquo;effectue en utilisant des structures issues des arbres document et requête et retourne un ensemble de fragments dont la strcture et le contenu sont semblables à la structure originale de la requête.&lt;/p&gt;</description>
    </item>
    <item>
      <title>A la Recherche de noeuds informatifs dans des corpus de documents XML.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.27/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.27/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Un des principaux challenge de la Recherche d&amp;rsquo;Information dans des documents XML est le traitement des requêtes composées de simples mots-clés. L&amp;rsquo;utilisateur exprimant de telles requêtes ne donne en effet aucune indication au système sur la granularité de l&amp;rsquo;information qu&amp;rsquo;il désire. De quel type doit-être cette information ? Les documents XML pouvant être considérés comme des arbres, chercher les parties de documents pertinentes à une requête revient à chercher des sous-arbres pertinents. Ceci soulève les problématiques suivantes: Comment calculer la pertinence de ces sous-arbres ? Toute l&amp;rsquo;information structurelle contenue dans les documents est-elle utile et doit-elle être indexée ? Afin de répondre à ces problématiques, nous présentons ici une suite d&amp;rsquo;expérimentations reposant sur un modèle de propagation de la pertinence et utilisant le système XFIRM. Les performances de notre système sont évaluées dans le cadre de la campagne d&amp;rsquo;évaluation INEX et les premiers résultats montrent de bonnes performances par rapport aux soumissions officielles. De plus, les expérimentations effectuées laissent apparaître que les noeuds de petite taille, quoique non informatifs, semblent jouer un rôle non négligeable dans le calcul de la pertinence de leurs noeuds ancêtres.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Algorithmes de bandit pour les systèmes de recommandation : le cas de multiples recommandations simultanées.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.26/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.26/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de recommandation (SR) à tirages multiples font référence aux SR qui recommandent plusieurs objets aux utilisateurs. La plupart des SR s&amp;rsquo;appuient sur des modèles d&amp;rsquo;apprentissage afin de décider les objets à recommander. Parmi les modèles d&amp;rsquo;apprentissage, les algorithmes de bandit offrent l&amp;rsquo;avantage de permettre d&amp;rsquo;apprendre tout en exploitant les éléments déjà appris. Les approches actuelles utilisent autant d&amp;rsquo;instances d&amp;rsquo;un algorithme de bandit que le SR doit recommander d&amp;rsquo;objets. Nous proposons au contraire de gérer l&amp;rsquo;ensemble des recommandations par une seule instance d&amp;rsquo;un algorithme de bandit pour rendre l&amp;rsquo;apprentis- sage plus efficace. Nous montrons sur deux jeux de données de références (Movielens et Jester) que notre méthode, MPB (Multiple Plays Bandit), permet d&amp;rsquo;obtenir un temps d&amp;rsquo;apprentissage jusqu&amp;rsquo;à treize fois plus rapide tout en obtenant des taux de clics équivalents. Nous montrons également que le choix de l&amp;rsquo;algorithme de bandit utilisé influence l&amp;rsquo;amélioration obtenue.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage actif pour l&#39;annotation de documents.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.93/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.93/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre du projet LegDoc au Centre Européen de Recherche de Xerox, nous avons développé des composants pour l&amp;rsquo;annotation sémantique de documents semi-structurés. Alors que certaines entités sémantiques ont une forme régulière et peuvent être facilement ex- traites, d&amp;rsquo;autres collections plus complexes et hétérogènes nous ont amenés à déployer des méthodes d&amp;rsquo;apprentissage automatique. Dans les cas réels nous sommes souvent confrontés au problème technique de la non disponibilité de corpus annotés, pour des tâches d&amp;rsquo;annotations spécifiques. Comme l&amp;rsquo;annotation manuelle est coûteuse et propice à l&amp;rsquo;erreur, notre approche consiste à appliquer des méthodes d&amp;rsquo;apprentissage actif afin de considérablement réduire le corpus nécessaire à l&amp;rsquo;élaboration d&amp;rsquo;un modèle pertinent. Dans cet article, nous expliquons comment le principe de l&amp;rsquo;apprentissage actif est adapté à l&amp;rsquo;annotation interactive de documents orientés mise en page. Pour une utilisation efficace de l&amp;rsquo;apprentissage actif sur les grandes col- lections, nous déployons un classifieur probabiliste basé sur le principe de l&amp;rsquo;entropie maximum ainsi que trois métriques d&amp;rsquo;incertitude. Nous présentons le prototype ALDAI (Active Learning Document Annotation) et décrivons ses fonctionnalités ainsi que les choix d&amp;rsquo;implémentation. Le prototype offre une interface WYSIWYG, un haut langage pour la définition des attributs et intègre le composant d&amp;rsquo;apprentissage actif qui vise à assister l&amp;rsquo;utilisateur dans le processus d&amp;rsquo;annotation. Nous rapportons aussi des résultats de tests d&amp;rsquo;évaluation des techniques d&amp;rsquo;ap- prentissage actif sur une collection de données publiques (UCI) et une collection de documents internes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de fonctions d&#39;ordonnancement par classification de paires ordonnées et pondérées (OWPC).</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.67/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.67/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Apprendre les fonctions d&amp;rsquo;ordonnancement pour les moteurs de recherche est une tâche difficile parce que les critères d&amp;rsquo;évaluations généralement utilisés sont difficilement opti- misables directement. Dans ce cas, nous sommes contraints d&amp;rsquo;optimiser une fonction d&amp;rsquo;erreur d&amp;rsquo;ordonnancement qui en est proche. Dans ce papier, nous proposons de définir une fonction d&amp;rsquo;erreur d&amp;rsquo;ordonnancement en utilisant un opérateur d&amp;rsquo;agrégation convexe des erreurs de clas- sification sur les paires appelé OWA (Yager, 1988) qui suivant son paramétrage peut donner un poids plus important aux erreurs commises au début de la liste. En utilisant des coûts de classification de type hinge loss, notre problème est similaire à une SVM à sorties structurées. Les expériences menées nous permettent de valider notre approche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification dynamique par treillis de concepts pour la recherche d&#39;information sur le web.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.71/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.71/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;analyse de concepts formels (ACF) permet d&amp;rsquo;organiser des objets en fonction de leurs propriétés. Des travaux récents ont utilisé l&amp;rsquo;ACF pour réorganiser, sous la forme d&amp;rsquo;un treillis de concepts, les réponses fournies par un moteur de recherche du web. L&amp;rsquo;utilisateur na- vigue dans le treillis pour explorer un résultat structuré et synthétique. Or, un tel treillis contient des concepts qui sont pertinents par rapport à une tâche de recherche d&amp;rsquo;information donnée et d&amp;rsquo;autres qui ne le sont pas. Pour que l&amp;rsquo;utilisateur puisse se focaliser sur ce qui l&amp;rsquo;intéresse et éli- miner ce qui ne l&amp;rsquo;intéresse pas, nous proposons un système interactif dans lequel il va exprimer son intérêt (positif ou négatif) pour certains concepts du treillis. Ce contrôle de pertinence est exploité dans la classification pour faire évoluer le treillis et ainsi mieux l&amp;rsquo;adapter au besoin de l&amp;rsquo;utilisateur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Construction de profils folksonomiques pour la Recherche d&#39;Information.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.71/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.71/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une méthode qui exploite les folksonomies pour prendre en compte les profils de l&amp;rsquo;utilisateur lors de sa recherche d&amp;rsquo;information. Une folksonomie est constituée d&amp;rsquo;un ensemble de relations associant un utilisateur, une ressource et le mot-clé que le premier a utilisé pour tagger la seconde. L&amp;rsquo;idée consiste à construire un recouvrement de ces relations folksonomiques par un ensemble de micro-folksonomies qui relient des groupes d&amp;rsquo;utilisateurs, un vocabulaire de tags et un ensemble de ressources et qui généralisent ainsi les relations folksonomiques initiales. Nous introduisons l&amp;rsquo;algorithme de construction des micro-folksonomies, nous expliquons son fonctionnement sur un exemple jouet puis nous présentons des expériences qui montrent son apport en termes de recherche d&amp;rsquo;information.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Évaluation de la robustesse des descripteurs de texture pour la segmentation des images de documents anciens.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans la littérature, le choix d’utiliser des descripteurs de texture pour guider la segmentation&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;For the segmentation of ancient digitized document images, it has been shown that texture feature analysis is a consistent choice for meeting the need to segment a page layout un- der significant and various degradations. In addition, it has been proven that the texture-based approaches work effectively without hypothesis on the document structure, neither on the doc- ument model nor the typographical parameters. Thus, by investigating the use of texture as a tool for automatically segmenting images, we propose to search homogeneous and similar content&lt;/p&gt;</description>
    </item>
    <item>
      <title>GRAD: A Metric for Evaluating Summaries</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier vise à proposer une nouvelle métrique pour évaluer les résumés. La plupart de méthodes existantes (e.g. ROUGE) nécessitent une intervention humaine importante car elles comparent le résumé considéré avec un ensemble des résumés de référence (gold standard). De plus, les métriques basées sur le chevauchement de vocabulaires ne sont pas appropriées pour la comparaison avec le texte intégral. La métrique proposée intitulée GRAD vise à dépasser les défauts des mesures existantes et s&amp;rsquo;appuie sur la représentation graphique du texte. L&amp;rsquo;hypothèse est qu&amp;rsquo;un bon résumé doit être composé de sommets qui sont connectés avec un maximum d&amp;rsquo;autres sommets. En outre, nous introduisons un cadre entièrement automatique pour évaluer les métriques qui n&amp;rsquo;exige aucune annotation humaine. Les expérimentations conduites sur une collection d&amp;rsquo;articles scientifiques disponibles sur la plate-forme ISTEX ainsi que sur des articles Wikipédia prouvent que la métrique proposée est meilleure de façon significative comparativement aux mesures existantes pour distinguer les résumés automatiques et ceux créés par les humains.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Poursuite de cibles dans l&#39;espace de recommandation - vers un nouveau système de recommandation basé sur le filtrage de Kalman.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.57/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.57/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons une nouvelle approche de système de recommandation basée sur la poursuite de cible à l&amp;rsquo;aide des filtres de Kalman. Nous supposons que les utilisateurs et leurs consommations de télévision (films, séries, émissions, etc.) sont représentés par des vecteurs dans l&amp;rsquo;espace multidimensionnel des genres des contenus (action, aventure, divertissement, etc.). Connaissant cet espace, nous proposons un algorithme basé sur les filtres de Kalman pour poursuivre le profil de l&amp;rsquo;utilisateur et prédire ses positions futures dans l&amp;rsquo;espace multidimensionnel des genres. A partir de cette prédiction, nous construisons une nouvelle stratégie de recommandation de contenus.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Prédiction automatique d’emojis sentimentaux.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.24/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.24/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans les messageries sociales les emojis sont parmi les principaux vecteurs d&amp;rsquo;émo- tions et de sentiments des individus. Aujourd&amp;rsquo;hui, les utilisateurs naviguent dans des biblio- thèques contenant souvent des milliers d&amp;rsquo;emojis pour sélectionner celui correspondant à ce qu&amp;rsquo;ils souhaitent transmettre. Nos travaux visent à développer un système de recommandation automatique d&amp;rsquo;emoji permettant à l&amp;rsquo;utilisateur d&amp;rsquo;identifier un panel réduit d&amp;rsquo;emojis pertinents étant donnée sa conversation en évitant le parcours de bibliothèques conséquentes d&amp;rsquo;emojis. Cette recommandation pouvant permettre à l&amp;rsquo;utilisateur de requêter les phrases susceptibles de contenir cet emoji, et l&amp;rsquo;émotion qui y est associée. Pour ce faire, dans un premier temps, notre objectif est de développer un outil permettant de prédire automatiquement les emojis d&amp;rsquo;une phrase à partir d&amp;rsquo;un modèle de classification appris sur un corpus de messagerie sociale conte- nant des emojis. Plusieurs caractéristiques sont considérées pour l&amp;rsquo;apprentissage telles que le sentiment de l&amp;rsquo;utilisateur mais aussi son humeur. Dans cet article, nous décrivons l&amp;rsquo;impact de ces caractéristiques et les performances des modèles résultants.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recommandation et analyse de sentiments dans un espace latent textuel.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de recommandation permettent d’aider les utilisateurs à identifier les&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Recommender systems were developed to cherry-pick interesting content in an always&lt;/p&gt;</description>
    </item>
    <item>
      <title>Selection of Search Facets.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_17/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_17/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les recherches par mots clés sur le Web donnent souvent une énorme quantité de pages Web pertinentes. Un cadre qui intègre les avantages á la fois des u mot-clé » et des u facettes » des recherches a des larges avantages pour les utilisateurs Web, car il offre une meilleure or- ganisation des résultats de la recherche et une plate-forme utile pour guider les utilisateurs á trouver les informations pertinentes. Dans un cadre pareil, deux problèmes principaux existent :1) une requête peut entamer plusieurs facettes, ce qui nécessite une agrégation ou un résumé&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle multimodal d’apprentissage de représentations de phrases qui préserve la sémantique visuelle</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;ancrage visuel est un domaine de recherche actif dont le but est d&amp;rsquo;enrichir les repré- sentations vectorielles textuelles à l&amp;rsquo;aide d&amp;rsquo;informations visuelles. La plupart des travaux du domaine s&amp;rsquo;appuient sur des projections inter-modales qui alignent les éléments de deux moda- lités différentes. Cette technique s&amp;rsquo;avère problématique car elle impose que tous les objets aient une correspondance directe. Dans ce papier, nous proposons un modèle d&amp;rsquo;apprentissage de re- présentation de phrases qui transfère la structure d&amp;rsquo;un espace de représentation visuel à un espace textuel tout en préservant les deux espaces. Notre approche multimodale est générique dans la mesure où l&amp;rsquo;ancrage visuel est modélisé via une fonction objectif qui assure que (1) des phrases associées à un contenu visuel similaire doivent être proches dans l&amp;rsquo;espace textuel et que (2) les similarités entre éléments doivent être préservées entre les modalités. Nous démontrons la qualité de nos représentations de phrases sur des tâches de similarité de phrases et recherche inter-modale.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un regard statistique sur l&#39;évaluation de performance : L&#39;exemple de CLEF 2005.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.73/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.73/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cette communication évalue et compare l&amp;rsquo;efficacité du dépistage de l&amp;rsquo;information de onze modèles à l&amp;rsquo;aide de quatre collections de documents rédigés dans les langues française, portugaise- brésilienne, hongroise et bulgare. Pour les deux dernières langues, on compare également l&amp;rsquo;indexation basée sur des mots à celle reposant sur des quadrigrammes (4-grams). En recourant à quatre tests statistiques et deux règles ad hoc, nous analysons les performances obtenues pour savoir si les différences de performance observées sont significatives. Enfin, nous comparons les résultats de ces différentes règles de décision afin de vérifier leur degré de concordance.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation de concepts visuels et de la diversité visuelle pour améliorer la recherche d&#39;images.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.83/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.83/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous étudions (i) comment extraire et exploiter des concepts visuels pour améliorer la recherche d&amp;rsquo;images basée sur le texte, et (ii) comment diversifier les résul- tats pertinents obtenus. Nous utilisons d&amp;rsquo;abord des forêts d&amp;rsquo;arbre de décisions flous (FFDTs) pour détecter les concepts dans les images, puis nous découvrons à l&amp;rsquo;aide de l&amp;rsquo;analyse des cooccurrences des relations d&amp;rsquo;exclusion mutuelle et d&amp;rsquo;implication entre les concepts. Ensuite, nous utilisons ces concepts pour améliorer la pertinence des résultats obtenus par un système de recherche d&amp;rsquo;images par le texte. Enfin, nous appliquons une méthode de diversité visuelle basée sur le partitionnement de l&amp;rsquo;espace visuel. Ce travail se place dans le cadre de la cam- pagne d&amp;rsquo;évaluation CLEF. Il montre une nette amélioration des résultats lorsque l&amp;rsquo;on utilise les concepts apparaissant explicitement dans la requête textuelle, ainsi que l&amp;rsquo;efficacité du clustering spatial.&lt;/p&gt;</description>
    </item>
    <item>
      <title>XFIRM: un Modèle Flexible de Recherche d&#39;Information pour le stockage et l&#39;interrogation de documents XML.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.121/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.121/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les utilisateurs recherchant une information précise ne souhaitent pas la voir noyée aux milieux d&amp;rsquo;autres sujets, comme cela peut être le cas dans de grands documents. Les documents XML, par leur structure même, permettent de traiter l&amp;rsquo;information qu&amp;rsquo;ils contiennent à un niveau de granularité autre que celui du document tout entier. Deux approches s&amp;rsquo;affrontent pour la recherche d&amp;rsquo;information (RI) dans des documents XML. La première est basée sur des méthodes issues de la communauté des bases de données, alors que la seconde étend des techniques utilisées pour RI traditionnelle et permet d&amp;rsquo;associer des valeurs de pertinences aux unités d&amp;rsquo;information retournées. Cet article présente le modèle XFIRM, combinant les avantages des deux approches. Le modèle est basé sur un modèle de représentation et de stockage des données complet et sur un langage de requête simple, permettant à l&amp;rsquo;utilisateur de formuler son besoin à l&amp;rsquo;aide de simples mots-clés ou de manière plus précise, et ce en intégrant des contraintes sur la structure des documents. Grâce à la flexibilité apportée par la structure d&amp;rsquo;index proposée, de nombreux modèles de recherche d&amp;rsquo;information pourront être expérimentés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Adaptation de XML et XQuery pour la représentation et l&#39;interrogation des documents multi-structurés.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.109/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.109/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous traitons dans cet article le problème de l&amp;rsquo;interrogation des documents à structures multiples, appelés aussi documents multi-structurés. Pour des besoins d&amp;rsquo;usages variés, plusieurs structurations différentes peuvent être associées à un même document initial. Par exemple, une première structure peut être définie pour organiser logiquement le contenu d&amp;rsquo;un document tandis qu&amp;rsquo;une deuxième explicitera les règles de sa mise en forme sur un support physique. Dans de précédents travaux, nous avons proposé une modélisation générique prenant en compte différents aspects de ce type de document. Partant de ce modèle nous avons également proposé un formalisme, basé sur XML, appelé MultiX permettant la sérialisation d&amp;rsquo;un document multi-structuré. Dans cet article, nous étudions l&amp;rsquo;exploitation de ces documents dans le contexte de la recherche d&amp;rsquo;information. Pour interroger efficacement les documents multi-structurés au format MultiX nous avons développé une extension du langage XQuery sous forme d&amp;rsquo;une bibliothèque de fonctions spécifiques permettant d&amp;rsquo;explorer les documents en prenant en compte la sémantique du format MultiX.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Analyse de la robustesse des algorithmes de méta-recherche discriminante.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.87/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.87/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article examine la sensibilité de quatre moteurs de méta-recherche à différents facteurs et contextes d&amp;rsquo;utilisation. L&amp;rsquo;accent de l&amp;rsquo;étude est mis sur les méta-moteurs capables d&amp;rsquo;apprendre à partir d&amp;rsquo;exemples. L&amp;rsquo;apport original de notre travail consiste en une explora- tion systématique sur des corpus de grande taille des performances et du comportement des méthodes d&amp;rsquo;apprentissage pour la méta-recherche. D&amp;rsquo;abord, nous nous intéressons au choix de la représentation des attributs (les scores renvoyés par les moteurs de base). Nous exami- nons ensuite la performance des méta-moteurs sur différents types de requêtes de test. Nous présentons des expériences montrant l&amp;rsquo;influence des propriétés et du nombre des données d&amp;rsquo;ap- prentissage sur la performance finale sur les données de test. Enfin, nous donnons des résultats préliminaires sur la possibilité de sélectionner des requêtes par apprentissage actif. Toutes ces expériences démontrent que l&amp;rsquo;apprentissage supervisé de fonctions d&amp;rsquo;ordonnancement est parti- culièrement efficace pour la méta-recherche et offre des performances uniformément meilleures que celles obtenues par les moteurs individuels et les heuristiques de combinaison. Ces mé- thodes sont de plus robustes à des facteurs comme le codage des résultats des moteurs de base et la variabilité de la base d&amp;rsquo;apprentissage.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de représentations probabilistes pour la prédiction de diffusions d&#39;informations sur les réseaux sociaux.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La problématique du clustering non supervisé et semi-supervisé est très étudiée dans le domaine de l&amp;rsquo;apprentissage automatique. En vue d&amp;rsquo;impliquer l&amp;rsquo;utilisateur dans le clustering d&amp;rsquo;images, (Lai et al., 2014) a proposé un nouveau modèle de clustering semi-supervisé inter- actif traduisant les retours de l&amp;rsquo;utilisateur (exprimés au niveau des images) en contraintes par paires (must-link et cannot-link) entre groupes d&amp;rsquo;images constitués à l&amp;rsquo;aide d&amp;rsquo;une solution de clustering hiérarchique et de ces retours. Ces dernières années, le besoin de moyens appro- priés pour mesurer la distance ou la similarité entre les données a conduit à l&amp;rsquo;émergence de l&amp;rsquo;apprentissage de métrique, qui vise à apprendre automatiquement une métrique à partir de données. Nous avons proposé une méthode intégrant un apprentissage de métrique dans le sys- tème existant de (Lai et al., 2014) pour améliorer la performance et réduire le temps de calcul. Nos résultats expérimentaux, obtenus sur la base d&amp;rsquo;images Wang, montrent que les méthodes d&amp;rsquo;apprentissage de métrique s&amp;rsquo;intègrent bien dans le système existant, et améliorent ses perfor- mances et sa complexité calculatoire.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage statistique pour la constitution des corpus d&#39;évaluation.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.85/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.85/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La constitution de corpus d&amp;rsquo;évaluation est une étape essentielle pour évaluer la per- formance des systèmes de recherche d&amp;rsquo;information. Le coût de développement de tels corpus est en général assez élevé à cause en particulier de l&amp;rsquo;effort humain nécessaire à l&amp;rsquo;évaluation de la pertinence des documents pour chaque requête. Cette difficulté devient un véritable gou- lot d&amp;rsquo;étranglement dans le cas de corpus de très grande taille. Le travail que nous présentons vise à sélectionner adaptativement les documents des corpus d&amp;rsquo;évaluation. Nous utilisons pour cela des algorithmes d&amp;rsquo;apprentissage statistique qui optimisent des critères d&amp;rsquo;ordonnancement. Nous présentons des essais d&amp;rsquo;un algorithme d&amp;rsquo;ordonnancement, dit RankBoost, sur des données de TREC et analysons les résultats obtenus au moyen de différents critères. Les résultats de ces analyses montrent que la méthode proposée permet de créer des corpus d&amp;rsquo;évaluation de qualité supérieure à la méthode de TREC.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification dans les graphes hétérogènes basée sur une représentation latente des noeuds.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les réseaux sociaux sont souvent composés de différents types de noeud. Apprendre et inférer sur ces réseaux hétérogènes est une tâche récente. Nous considérons la tâche d&amp;rsquo;éti- quetage de noeuds dans les réseaux sociaux, où différents types de noeud doivent être étiquetés par différents jeux de catégories ou d&amp;rsquo;étiquettes. Nous proposons une nouvelle approche trans- ductive qui apprend automatiquement à projeter les différents types de noeud dans un espace latent commun, cette représentation apprise étant utilisée ensuite pour classifier les différents éléments. Cette approche exploite l&amp;rsquo;idée que deux noeuds connectés dans un réseau social ten- dront à avoir des représentations latentes similaires peu importe leur type. Cette hypothèse nous permet d&amp;rsquo;apprendre les corrélations entre les catégories de noeuds de type différent, quand les méthodes de l&amp;rsquo;état de l&amp;rsquo;art traitent chaque type de noeud indépendamment. Nous avons testé ce modèle sur deux jeux de données et il obtient de bonnes performances.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection de contradiction dans les commentaires.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.17/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.17/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;analyse des avis (commentaires) générés par les utilisateurs devient de plus en plus exploitable par une variété d&amp;rsquo;applications. Elle permet de suivre l&amp;rsquo;évolution des avis ou d&amp;rsquo;effec- tuer des enquêtes sur des produits. La détection d&amp;rsquo;avis contradictoires autour d&amp;rsquo;une ressource Web (ex. cours, film, produit, etc.) est une tâche importante pour évaluer cette dernière. Dans cet article, nous nous concentrons sur le problème de détection des contradictions et de la me- sure de leur intensité en se basant sur l&amp;rsquo;analyse du sentiment autour des aspects spécifiques à une ressource (document). Premièrement, nous identifions certains aspects, selon les distri- butions des termes émotionnels au voisinage des noms les plus fréquents dans l&amp;rsquo;ensemble des commentaires. Deuxièmement, nous estimons la polarité de chaque segment de commentaire contenant un aspect. Ensuite, nous prenons uniquement les ressources contenant ces aspects avec des polarités opposées (positive, négative). Troisièmement, nous introduisons une mesure de l&amp;rsquo;intensité de la contradiction basée sur la dispersion conjointe de la polarité et du rating des commentaires contenant les aspects au sein de chaque ressource. Nous évaluons l&amp;rsquo;effica- cité de notre approche sur une collection de MOOC (Massive Open Online Courses) contenant 2244 cours et leurs 73873 commentaires, collectés à partir de Coursera. Nos résultats montrent l&amp;rsquo;efficacité de l&amp;rsquo;approche proposée pour capturer les contradictions de manière significative.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Étude comparative de trois ensembles de descripteurs de texture pour la segmentation de documents anciens.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Récemment, des approches basées sur l&amp;rsquo;analyse des descripteurs de texture ont été largement explorées pour la segmentation d&amp;rsquo;images de documents anciens numérisés. Il a été prouvé que ces méthodes fonctionnent efficacement en n&amp;rsquo;ayant pas de connaissances préalables. En outre, il a été démontré qu&amp;rsquo;elles sont robustes lorsqu&amp;rsquo;elles sont appliquées sur des documents dégradés ou bruités. Dans cet article, une approche d&amp;rsquo;évaluation de trois différents ensembles de descripteurs texturaux est présentée pour la segmentation de documents anciens. Sur un vaste corpus expérimental de documents anciens, nous visons tout d&amp;rsquo;abord à déterminer quels descripteurs de texture pourraient être les mieux appropriés pour séparer les illustrations des régions textuelles d&amp;rsquo;une part et d&amp;rsquo;autre part pour discriminer les blocs du texte de différentes tailles et polices de caractères. C&amp;rsquo;est dans ce but que nous étudions différents descripteurs de texture, extraits de trois outils du traitement d&amp;rsquo;image, les plus répandus et largement utilisés (la fonction d&amp;rsquo;auto-corrélation, les matrices de co-occurrence des niveaux de gris et les filtres de Gabor). Un aperçu sur le temps de calcul et la complexité de chaque ensemble de descripteurs de texture est également présenté dans ce travail. Sur une base d&amp;rsquo;images de plus de 300 docu- ments, une étude expérimentale avec des observations qualitatives et numériques, est proposée pour montrer les performances de chaque ensemble de descripteurs de texture.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Impact du « biais des ex aequo » dans les évaluations de Recherche d&#39;Information.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.83/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.83/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article considère la problématique de l&amp;rsquo;évaluation en Recherche d&amp;rsquo;Information, en particulier dans le cadre de TREC avec le programme trec_eval . Nous montrons que les systèmes de RI ne sont pas uniquement évalués en fonction de la pertinence des documents qu&amp;rsquo;ils restituent. En effet, dans le cas de documents ex aequo (trouvés avec le même score) leur nom est utilisé pour les départager. Nous assimilons cette façon de départager les ex aequo à un biais expérimental qui influence les scores attribués aux systèmes, et argumentons en faveur d&amp;rsquo;une stratégie pour les départager plus équitablement. L&amp;rsquo;étude de 22 éditions de TREC révèle une différence significative entre la stratégie conventionnelle et inéquitable de trec_eval et les stratégies équitables proposées. Ces résultats expérimentaux suggèrent l&amp;rsquo;intégration des stratégies proposées dans trec_eval afin d&amp;rsquo;encourager la réalisation d&amp;rsquo;expérimentations plus équitables.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle de langue visuel pour la reconnaissance de scènes.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.99/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.99/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d&amp;rsquo;images. Nous utilisons des régions d&amp;rsquo;images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gère différents scénarios, selon que des images isolées ou groupées soient utilisés comme base d&amp;rsquo;apprentissage ou de tests. Les résultats obtenus sur un problème de catégorisa- tion d&amp;rsquo;images montre (a) que la procédure automatique qui associe les concepts à une image est efficace, et (b) que l&amp;rsquo;utilisation des relations spatiales, en plus des concepts, permet d&amp;rsquo;améliorer la qualité de la classification. Cette approche présente donc une extension du modèle de langue classique en recherche d&amp;rsquo;information pour traiter le problème de recherche et de catégorisation d&amp;rsquo;images représentées par des graphes sans se préoccuper des annotations d&amp;rsquo;images.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modélisation d&#39;évolution de profil utilisateur en recherche d&#39;information personnalisée.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.83/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.83/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Pour satisfaire les besoins d&amp;rsquo;informations d&amp;rsquo;un utilisateur et la personnalisation de l&amp;rsquo;information,&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;To meet user needs of information and the personalization of the information the use of the user profile has been adopted. This generates the problem of evolution of this profile over time. In this paper is proposed a model of evolution of the user profile based on the temporal Bayesian networks. This model is the result of a repetition over time on a sequence of T length, of a basic network representing a search activity characterized by the request submitted at t time and the user interest corresponding with the relevant documents and the terms of the index. The resulting networks are connected by causal links between each two successive steps of time, which allows the dynamic evolution of user profile indicated by the change of the user interests throughout the various submissions of user queries at the sequence of time&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modelling XML retrieval with belief functions.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.143/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.143/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous nous intéressons à la recherche de documents XML. Un cadre générique qui permet la représentation de connaissances partielles dans les processus d&amp;rsquo;indexation et de recherche est tout d&amp;rsquo;abord présenté. Ce modèle est basé sur la théorie des fonctions de croyance et permet de décrire plusieurs formes d&amp;rsquo;incertitude sur le contenu et la structure des documents XML. Par ce biais, la méthodologie autorise l&amp;rsquo;utilisation de requêtes qui permettent la spécification de contraintes sur la structure des documents recherchés. Un exemple d&amp;rsquo;une telle stratégie de recherche est proposé de façon à illustrer la méthodologie présentée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Personnalisation flexible d&#39;un processus de recherche d&#39;information mobile.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.65/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.65/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le passé, les modèles de recherche personnalisés ont été principalement fondés sur le contexte cognitif (Url visitées, les documents vus) de l&amp;rsquo;utilisateur indépendamment de son environnement caractérisé par le lieu, le temps, les personnes proches, etc. Dans cet ar- ticle nous proposons une approche de personnalisation des résultats de recherche Web pour des utilisateurs mobiles en exploitant à la fois le contexte cognitif et spatio-temporel. Nous proposons de modéliser l&amp;rsquo;utilisateur par un profil flexible construit selon trois dimensions sé- mantiques : temps, localisation et centres d&amp;rsquo;intérêt. Une approche de raisonnement à partir de cas est adoptée pour sélectionner le profil approprié pour ré-ordonner les résultats de la re- cherche. Une évaluation expérimentale menée en utilisant le service Yahoo boss montre que&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réseaux de neurones convolutifs de quaternions pour l&#39;identification de thèmes de conversations téléphoniques</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_21/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_21/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les réseaux de neurones convolutifs de quaternions (QCNN) forment un ensemble d’algorithmes&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Quaternion convolutional neural networks (QCNN) are powerful architectures to learn and model external dependencies that exist between neighbor features of an input vector, and internal latent dependencies within the feature. This paper proposes to evaluate the effecti- veness of the QCNN on a realistic theme identification task of spoken telephone conversations between agents and customers from the call center of the Paris transportation system (RATP). We show that QCNNs are more suitable than real-valued CNN to process multidimensional data and to code internal dependencies. Indeed, real-valued CNNs deal with both internal and external relations at the same level since components of an entity are processed independently. Experimental evidence is provided that the proposed QCNN architecture always outperforms real-valued equivalent CNN models in the theme identification task of the DECODA corpus. It is also shown that QCNN accuracy results are the best achieved so far on this task, while reducing by a factor of four the number of model parameters.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Suggestion contextuelle composite.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.33/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.33/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La suggestion contextuelle consiste à recommander à un utilisateur un ensemble de lieux d&amp;rsquo;activités adaptés à ses préférences et à son contexte. La plupart des approches existantes considèrent uniquement ces deux caractéristiques pour constituer leur liste de suggestions. Ce- pendant, les recherches en systèmes de recommandation ont récemment souligné l&amp;rsquo;importance de la diversité des suggestions. Cet article présente un modèle novateur de suggestion contex- tuelle inspiré de la recherche composite qui consiste à regrouper les suggestions en différentes grappes thématiquement cohésives. L&amp;rsquo;évaluation réalisée dans le cadre de la piste Contextual Suggestion de TREC 2013 et 2014 montre que notre approche est compétitive et permet d&amp;rsquo;amé- liorer la diversité des suggestions sans dégrader leur pertinence.&lt;/p&gt;</description>
    </item>
    <item>
      <title>TournaRank : Quand la Recherche d’Information devient un tournoi entre documents</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De nombreuses approches supervisées utilisant les caractéristiques des documents ont été proposées pour l&amp;rsquo;ordonnancement de documents. Un inconvénient est qu&amp;rsquo;elles requièrent une phase d&amp;rsquo;apprentissage. Dans cet article, nous proposons TournaRank, une approche non supervisée d&amp;rsquo;ordonnancement de documents inspirée des compétitions sportives. Les documents sont représentés par un ensemble de caractéristiques et s&amp;rsquo;affrontent lors de tournois. Un tournoi est vu comme une séquence de matchs au cours desquels deux documents s&amp;rsquo;affrontent sur la base des valeurs de leurs caractéristiques. À l&amp;rsquo;issue du tournoi, les documents sont ordonnés dans l&amp;rsquo;ordre décroissant des scores obtenus durant le tournoi. Notre approche est entièrement paramétrable (type de tournoi, règle des matchs, etc). Nous présentons les résultats de notre approche sur trois collections (Robust2004, Web2014, LETOR3.0) et la comparons à différentes approches de l&amp;rsquo;état de l&amp;rsquo;art en Learning to Rank et fusion des résultats. Cet article est une version résumée de (Hubert et al., 2018).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation de la langue naturelle pour l&#39;interrogation de documents structurés.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.19/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.19/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le langage de requête est l&amp;rsquo;indispensable interface entre l&amp;rsquo;utilisateur et l&amp;rsquo;outil de re- cherche. Simplifié au maximum dans les cas où les moteurs indexent essentiellement des do- cuments plats, il devient fort complexe lorsqu&amp;rsquo;il s&amp;rsquo;adresse à des documents structurés et qu&amp;rsquo;il s&amp;rsquo;agit de définir des contraintes portant à la fois sur la structure et le contenu. L&amp;rsquo;approche ici- décrite propose d&amp;rsquo;utiliser la langue naturelle comme interface pour exprimer de telles requêtes. L&amp;rsquo;article décrit dans un premier temps les différentes phases qui permettent de transformer (dans un cadre de recherche d&amp;rsquo;information) la requête en langage naturel en une représentation sémantique indépendante du contexte. Des règles de simplification adaptées à la structure et au domaine du corpus sont ensuite appliquées, permettant d&amp;rsquo;obtenir une forme finale, adaptée à une conversion vers un langage de requête formel. L&amp;rsquo;article décrit enfin les expérimentations effectuées et tire les premières conclusions sur divers aspects de cette approche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>A Document Frequency Constraint for Pseudo-Relevance Feedback Models.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.73/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.73/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous étudions dans cet article le comportement de plusieurs modèles de rétro- pertinence en mettant en avant leurs principales caractéristiques. Ceci nous conduit à intro- duire une nouvelle contrainte pour les modèles de rétro-pertinence, contrainte liée à la fré- quence documentaire (DF) des mots. Nous analysons ensuite, d&amp;rsquo;un point de vue théorique, différents modèles de rétro-pertinence par rapport à cette contrainte. Cette analyse montre que le modèle de mélange utilisé en rétro-pertinence pour les modèles de langue ne satisfait pas cette contrainte. Nous réalisons ensuite une série d&amp;rsquo;expériences qui permettent de valider la contrainte DF. Pour cela, nous utilisons tout d&amp;rsquo;abord un oracle sur la base de documents pertinents, puis utilisons une famile de fonctons de type tf-idf, mais paramétrée de telle sorte que des individus différents de la famille auront des comportements différents par rapport à la contrainte DF. Ces expériences montrent la validité et l&amp;rsquo;importance de la contrainte DF.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Browsing Information Retrieval System Results</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper21short/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper21short/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;évaluation en recherche d&amp;rsquo;information (RI) est fondamentale. Depuis les années 70, les chercheurs utilisent un cadre d&amp;rsquo;évaluation du type de celui proposé dans les projets Cranfield ou TREC pour calculer l&amp;rsquo;efficacité du système sur des collections de référence. Alors que les résultats numériques sont une pratique courante de comparaison de systèmes, nous pensons que les comparaisons visuelles pourraient aussi être utiles aux chercheurs. À cette fin, nous avons développé une interface qui permet aux scientifiques de RI de comparer l&amp;rsquo;efficacité de différents systèmes. Elle s&amp;rsquo;appuie sur les résultats de l&amp;rsquo;outil trec_eval. À ce stade, l&amp;rsquo;interface permet des analyses pour la recherche ad hoc. Cet article présente l&amp;rsquo;interface.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Clustering en recherche d&#39;information : concentration vs distribution de l&#39;information pertinente.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.115/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.115/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;S&amp;rsquo;appuyant sur la Cluster Hypothesis, qui stipule que les documents pertinents à une requête tendent à être plus proches les uns des autres que des documents non pertinents, la plupart des systèmes de recherche d&amp;rsquo;information réalisant une catégorisation de leurs ré- sultats visent à regrouper l&amp;rsquo;ensemble des documents pertinents dans un même groupe. Nous proposons ici, par la mise en place de nouvelles mesures d&amp;rsquo;évaluation, de reconsidérer les bé- néfices résultant d&amp;rsquo;une telle concentration de l&amp;rsquo;information pertinente. Contrairement à ce qui est habituellement admis, nous montrons finalement que des systèmes réalisant une distribu- tion de l&amp;rsquo;information pertinente peuvent s&amp;rsquo;avérer au moins aussi intéressants pour l&amp;rsquo;utilisa- teur que des systèmes regroupant l&amp;rsquo;ensemble des documents pertinents dans un cluster unique.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Construction automatique de ressources lexicales pour la fouille d&#39;opinion.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_96/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_96/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De nombreuses méthodes automatiques de fouille d&amp;rsquo;opinion s&amp;rsquo;appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques, basées sur les similarités sémantiques entre les mots dont on veut estimer la polarité et des mots dont la polarité est connue, ont été développées ces dix dernières années et leur efficacité a été confirmée. La présente recherche propose d&amp;rsquo;étendre de telles procédures à l&amp;rsquo;analyse de n-grammes de mots et de déterminer les éventuels bénéfices apportés par cette extension. Une expérience menée sur la base d&amp;rsquo;un vaste corpus de critiques de films indique non seulement que les n-grammes semblent être des indicateurs plus fiables de polarité que les mots simples, mais aussi que leur combinaison avec ces mêmes mots simples permet une meilleure prédiction de la polarité de textes. Soulignant le caractère exploratoire et les limitations de la présente étude, la conclusion propose quelques pistes pour des recherches futures.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Contexte et sémantique pour une indexation de documents semi-structurés.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.161/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.161/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les documents semi-structurés comme les documents XML présentent l&amp;rsquo;avantage de posséder une structure explicite qui facilite leur présentation et leur exploitation dans dif- férents contextes. Cependant, très souvent, la majeure partie de l&amp;rsquo;information reste contenue dans les champs textuels. Il est donc devenu primordial de concevoir des méthodes permettant d&amp;rsquo;exploiter à la fois la structure et le contenu textuel de ces documents. Les techniques clas- siques de Recherche d&amp;rsquo;Information (RI) n&amp;rsquo;utilisent pas ou peu la structure des documents alors que les langages de requête issus de la communauté Bases de Données (BD) n&amp;rsquo;exploitent pas le contenu textuel et ne permettent pas une présentation des résultats par ordre de pertinence. De plus en plus de chercheurs essaient de combiner les approches de RI et de BD pour pallier leurs limites respectives. Dans ce travail, nous présentons une structure d&amp;rsquo;index qui permet des requêtes structurées et une présentation des résultats par ordre de pertinence. Pour cela, nous avons étendu le modèle vectoriel de Salton pour une vue bi-dimensionnelle du document en adaptant le calcul du TF-IDF. Par ailleurs, nous proposons d&amp;rsquo;utiliser une ontologie reliée aux termes du corpus pour modéliser la notion de voisinage sémantique à l&amp;rsquo;aide d&amp;rsquo;un calcul de simi- larité entre termes. Cette indexation permet donc une recherche contextuelle (par la structure) et sémantique (par l&amp;rsquo;ontologie).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Définition et exploitation des méta-rôles des utilisateurs pour la recherche d&#39;information collaborative.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d’information collaborative est un processus particulier impliquant un&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Collaborative information retrieval is a particular setting involving a set of users&lt;/p&gt;</description>
    </item>
    <item>
      <title>Evaluer le passage à l&#39;échelle dans des environnements à pertinence multivaluée.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.97/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.97/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La croissance continuelle et exponentielle des volumes d&amp;rsquo;information numérique affecte principalement des domaines comme celui de la Recherche d&amp;rsquo;Information (RI). Toutefois, peu de travaux en RI ont jusqu&amp;rsquo;alors abordé les questions d&amp;rsquo;efficience et d&amp;rsquo;efficacité des sys- tèmes de RI dans le contexte du passage à l&amp;rsquo;échelle dans la taille des corpus. Face à la masse grandissante d&amp;rsquo;information, il est préférable du point de vue de l&amp;rsquo;utilisateur moyen que les documents retournés soient classés par ordre de pertinence décroissante ; ce qui implique de prendre en compte de multiples niveaux de pertinence pour les documents. Nous établissons un lien entre ces deux pans de la RI (pertinence multivaluée et passage à l&amp;rsquo;échelle) et nous étu- dions des protocoles pouvant permettre d&amp;rsquo;évaluer l&amp;rsquo;abilité des systèmes de RI à retourner les documents de meilleur niveau de pertinence en tête des résultats quand la masse d&amp;rsquo;information croît.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Fusion des réponses de systèmes de question-réponses.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.99/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.99/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les réponses données par plusieurs systèmes de questions-réponses proviennent de l&amp;rsquo;application de stratégies différentes, et de ce fait permettent de répondre à des questions différentes. La combinaison de ces systèmes vise alors à accroître le nombre total de questions résolues. Cet article présente la combinaison de trois systèmes : QAVAL, qui s&amp;rsquo;appuie sur un module de validation de réponses et deux versions du systèmes RITEL qui s&amp;rsquo;appuie sur une analyse multi-niveaux appliquée aux questions et aux documents. La fusion des résultats est effectuée de différentes manières : en fusionnant les passages, à la sortie des systèmes par vote ou fusion en tenant compte du poids ou du rang des réponses proposées et par un mécanisme d&amp;rsquo;apprentissage sur les caractéristiques des réponses.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Involving Validity Indices in Document Clustering.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.103/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.103/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The goal of any clustering algorithm is to find the optimal clustering solution with the optimal number of clusters. In order to evaluate a clustering solution, a number of validity indices are used during or at the end of a clustering process. They can be internal, external or relative. In this paper, we provide two main contributions: First, we present an experimental study comparing the major relative indices in the context of document agglomerative cluster- ing. The objective is to highlight the limits of the existing indices for identifying both the optimal clustering solution and the optimal number of clusters in real datasets. Second, we explore the feasibility of using the relative indices as stopping criteria in agglomerative clustering algo- rithms. We present a new method that enhances the clustering process with context-awareness to improve their reliability for such utilization.&lt;/p&gt;</description>
    </item>
    <item>
      <title>L&#39;Agrégation en Recherche d&#39;Information.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.125/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.125/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier donne une nouvelle présentation des modèles standards de la recherche d&amp;rsquo;information, décrits selon deux dimensions. La première porte sur les sources d&amp;rsquo;évidence qu&amp;rsquo;utilisent les modèles et la manière dont ils les agrègent pour mesurer l&amp;rsquo;importance ou le poids d&amp;rsquo;un terme dans un document. La seconde concerne la manière dont ces poids sont agré- gés pour calculer un score de pertinence. Les mécanismes d&amp;rsquo;agrégation utilisés dans les deux cas sont alors explicités et critiqués motivant le recours à une nouvelle famille de méthodes basées sur de nouveaux mécanismes d&amp;rsquo;agrégation plus adaptés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Les Signaux Sociaux Émotionnels : Quel impact sur la recherche d’information ?</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.18/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.18/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Une grande partie des traces des utilisateurs exprimées par des signaux sociaux (ex. j&amp;rsquo;aime, +1, rating) sont attribuées aux ressources web. Ces signaux sont souvent exploités par les systèmes de RI comme des sources d&amp;rsquo;évidence additionnelles pour trier les résultats de recherche. Notre objectif dans cet article est d&amp;rsquo;étudier l&amp;rsquo;impact des nouveaux signaux sociaux, appelés Facebook reactions (j&amp;rsquo;adore, haha, grrr, wouah, triste) sur le tri de ces résultats. Ces réactions permettent aux utilisateurs d&amp;rsquo;exprimer des émotions plus nuancés par rapport aux signaux classiques (ex. like, share). Nous analysons tout d&amp;rsquo;abord ces réactions et montrons la manière dont les internautes les utilisent pour interagir avec les ressources (ex. posts, vidéo, etc). Ensuite, nous évaluons l&amp;rsquo;impact de ces réactions dans le tri des résultats de recherche en les comparant à un modèles de tri textuel et à un modèle qui prend en compte le signal j&amp;rsquo;aime. Ces caractéristiques sociales sont modélisées comme une probabilité a priori du document et elles sont intégrées dans un modèle de langue. Nous avons effectué une série d&amp;rsquo;expérimentations sur la collection INEX IMDb. Nos résultats révèlent que la prise en compte de ces signaux améliore significativement la qualité des résultats de recherche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèles de RI fondés sur l&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.99/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.99/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans une premier temps, nous présentons dans cet article une vue analytique des contraintes heuristiques récemment proposées pour les fonctions d&amp;rsquo;ordonnancement (retrieval function): ces caractérisations permettent ainsi de tester simplement si un modèle de recherche d&amp;rsquo;information (RI) respecte ces contraintes ou non. De plus, nous examinons un certain nombre de résultats empiriques sur les distributions de fréquences de mots et le rôle central joué par le phénomène de rafale, pour lequel nous proposons une définition formelle. Nous introduisons ensuite une nouvelle famille de modèles probabilistes pour la RI, fondée sur la notion d&amp;rsquo;infor- mation. Lorsque la loi de probabilité sous-jacente est capable de modéliser le phénomène de rafale, alors le modèle devient naturellement valide au sens des contraintes heuristiques. La distribution log-logistique est présentée dans ce contexte et les expériences, menées sur trois collections différentes, illustrent le comportement adéquat de ce modèle; il surpasse Okapi BM25 et les modèles de langues, avec lissage de Jelinek-Mercer ou de Dirichlet, à la fois pour la précision moyenne et la précision en tête de liste, fournit de meilleurs résultats que les mo- dèles DFR (Divergence from Randomness) en précision moyenne et des résultats similaires sur la précision en tête de liste, tout en simplifiant ces modèles.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;Information Sociale en Langue Arabe : Cas de Facebook</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_26/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_26/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose une approche de recherche d&amp;rsquo;information (RI) en langue arabe sur Facebook, qui exploite toutes les traces des utilisateurs (ex. polarité, partage, j&amp;rsquo;aime, haha) laissées sur des publications Facebook pour estimer leur importance sociale. Notre objectif est de montrer comment ces signaux peuvent jouer un rôle vital dans l&amp;rsquo;amélioration de la recherche en langue arabe sur Facebook. Premièrement, des polarités (positive ou négative) portée par les signaux textuels (ex. commentaires) et non textuels (ex. les réactions j&amp;rsquo;adore et triste) ont été identifiées pour chaque publication Facebook. Par conséquent, la polarité de chaque com- mentaire exprimé sur une publication donnée, est estimée sur la base d&amp;rsquo;un modèle neuronal de sentiment en langue arabe. Deuxièmement, des signaux en fonction de leur complémentarité ont été regroupés en utilisant des algorithmes de sélection. Troisièmement, des algorithmes de learning to rank ont été appliqués pour re-ordonner les résultats de recherche de Facebook en fonction des groupes de signaux sélectionnés. Enfin, des expérimentations sont réalisées sur&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information XML utilisant un principe de vote.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.45/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.45/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit une approche pour la recherche d&amp;rsquo;information dans des collections de documents XML. Cette approche utilise une méthode de vote pour déterminer les éléments XML répondant à une requête. Une requête peut combiner des informations sur le contenu recherché, sur la granularité des éléments recherchés et sur les éléments structurels associés aux concepts recherchés. La méthode proposée a été expérimentée et évaluée dans le cadre de la campagne INEX 2004.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Segmentation de flux de documents. Application aux documents administratifs.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose une approche de segmentation supervisée de flux de documents. L&amp;rsquo;approche traite le flux de documents comme une suite de paires de pages et étudie la relation qui existe entre elles pour déceler une continuité de documents ou une rupture. Dans un premier temps, des descripteurs sont extraits des pages et une approche est proposée pour fusionner ces descripteurs en un seul vecteur qui modélise la relation entre les paires de pages. Cette représentation est fournie à un classifieur binaire qui la classifie comme étant&lt;/p&gt;</description>
    </item>
    <item>
      <title>Suggestion d&#39;experts pour renouveler le comité de programme d&#39;une conférence.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.20/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.20/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le processus d&amp;rsquo;évaluation par les pairs permet de valider les progrès scientifiques communiqués dans des articles de recherche. Cette grande responsabilité repose sur les comités éditoriaux des journaux, sur les comités de programme des conférences et sur chacun de leurs membres. De plus, avec un grand nombre de conférences scientifiques organisées chaque année, la recherche d&amp;rsquo;experts pour participer au comité de programme devient une tâche fréquente et coûteuse. Dans cet article, nous proposons une modélisation d&amp;rsquo;expert basée sur différentes preuves d&amp;rsquo;expertise, notamment sur les citations, pour émettre des suggestions d&amp;rsquo;experts dans le cas d&amp;rsquo;une recherche de membres pour renouveler le comité de programme d&amp;rsquo;une conférence.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Analyse et transformation des questions médicales en requêtes SPARQL.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.111/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.111/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La conception des systèmes de questions-réponses nécessite une analyse profonde des questions posées. Cette tâche primordiale requiert d&amp;rsquo;être étudiée et évaluée séparément. Dans cet article, nous nous intéressons à l&amp;rsquo;analyse de questions en domaine médical. Plus pré- cisément, nous étudions la transformation de questions posées en langage naturel en requêtes basées sur un langage formel. Cette étude examine trois points clés : (i) Quelles sont les car- actéristiques d&amp;rsquo;une question médicale, (ii) Quelles sont les méthodes les mieux adaptées pour l&amp;rsquo;extraction des informations utiles et (iii) Comment transformer les informations extraites en une représentation formelle. Nous présentons une approche sémantique comportant la recon- naissance des entités médicales, l&amp;rsquo;extraction de relations sémantiques et la transformation au- tomatique de la question en requête(s) SPARQL. Notre étude supporte l&amp;rsquo;hypothèse que SPARQL peut représenter de nombreux types de questions. Les résultats obtenus sur un corpus de ques- tions réelles montrent que les requêtes SPARQL sont correctes pour 62 % des questions. Ces résultats dépendent fortement de la couverture des relations traitées. Si les systèmes d&amp;rsquo;extrac- tion d&amp;rsquo;information sont fiables, SPARQL peut représenter correctement 98 % des questions du corpus d&amp;rsquo;évaluation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage d&#39;un espace de concepts de mots pour une nouvelle représentation des données textuelles.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.119/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.119/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous proposons une technique à base d&amp;rsquo;apprentissage non-supervisé pour la réduction de dimension des données textuelles. Cette technique est basée sur l&amp;rsquo;hypo- thèse que les termes co-occurrants dans les mêmes documents avec les mêmes fréquences sont sémantiquement proches. Suivant cette hypothèse les termes sont d&amp;rsquo;abord regroupés avec l&amp;rsquo;al- gorithme CEM qui est une version classifiante de l&amp;rsquo;algorithme EM. Les documents sont ensuite représentés dans l&amp;rsquo;espace de ces groupes de termes. Nous jugeons de la pertinence de cette technique de réduction dimensionnelle avec la tâche du clustering de documents. Et nous mon- trons la validité de notre approche en comparant le résultat de ce clustering avec ceux obtenus dans l&amp;rsquo;espace sac-de-mots initial et l&amp;rsquo;espace des groupes de mots induit par l&amp;rsquo;algorithme PLSA sur deux collections standard de WebKB et de Reuters.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification active de flux de documents avec identification des nouvelles classes.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, on propose un algorithme semi-supervisé actif pour la classification de flux continu de documents. Cet algorithme, basé sur une méthode adaptative d&amp;rsquo;apprentis- sage non supervisé, permet de repérer les documents les plus informatifs à l&amp;rsquo;aide d&amp;rsquo;une mesure d&amp;rsquo;incertitude pour demander leur étiquette à un opérateur. Il construit et maintient un modèle sous forme d&amp;rsquo;un graphe à topologie dynamique dont les noeuds sont des représentants de docu- ments étiquetés, formant ce qu&amp;rsquo;on appelle l&amp;rsquo;&amp;rsquo;espace couvert par les classes connues&amp;rsquo;. Il permet de détecter automatiquement les nouvelles classes apparaissant dans le flux. Un document est identifié comme membre d&amp;rsquo;une nouvelle classe ou d&amp;rsquo;une classe connue, selon qu&amp;rsquo;il se trouve à l&amp;rsquo;extérieur ou à l&amp;rsquo;intérieur de l&amp;rsquo;espace couvert par les classes connues. Les expérimentations effectuées sur des ensembles de documents réels montrent que la méthode nécessite peu de documents à étiqueter et qu&amp;rsquo;elle atteint des performances comparables aux méthodes supervi- sées qui sont entraînées sur des ensembles de documents présents en mémoire et entièrement étiquetés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification automatique de documents structurés. Application au corpus d&#39;arbres étiquetés de type XML.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.52/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.52/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le domaine de la Recherche d&amp;rsquo;Information Structurée (RIS) est un domaine qui émerge avec l&amp;rsquo;arrivée de données semi structurées comme les documents XML. Ce domaine, à travers l&amp;rsquo;initiative INEX, concerne principalement le développement de moteurs de recherche documen- taire. Aujourd&amp;rsquo;hui, il est nécessaire de développer des modèles pour le traitement de différentes problématiques dans les documents structurés comme la discrimination ou la restructuration. Dans cet article, nous nous intéressons à la classification automatique de documents XML en fonction de leur régularités structurelles. Nous proposons de modéliser la structure des documents XML par un réseau bayésien qui permet de prendre en compte différentes dépendances entres les unités structurelles du document. Nous présentons les résultats de nos différents mo- dèles sur le corpus INEX et voyons ensuite comment un de nos modèles permet de déterminer un représentant de chacune des classes obtenues sous forme d&amp;rsquo;une DTD probabiliste.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification de Sentiments Multi-Domaines et Passage à l&#39;Echelle.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_33/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_33/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La classification de sentiments multi-domaines est un problème complexe: en effet, les distributions de caractéristiques sont alors différentes dans les ensembles d&amp;rsquo;apprentissage et de test. Différentes propositions permettent de limiter la baisse de performance inhérente à ce cadre. Cependant, la classification de sentiments est une tâche particulière car le web participatif nous donne accès à une quasi-infinité de données étiquetées. Cela soulève de nou- velles questions: à partir de quel volume de données les distributions d&amp;rsquo;apprentissage et de test convergent elles? Quand est ce que l&amp;rsquo;intérêt des techniques de transfert disparait? Dans cet ar- ticle, nous étudions le taux de reconnaissance en sentiments par rapport la taille des ensembles d&amp;rsquo;apprentissage.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Correction de césures et enrichissement de requêtes pour la recherche de livres.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.89/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.89/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les livres numérisés accessibles sur Internet constituent une importante source d&amp;rsquo;in- formation. Néanmoins, la Reconnaissance Optique des Caractères (ROC) introduit parfois des erreurs qui peuvent pénaliser la Recherche d&amp;rsquo;Information. Dans cet article nous proposons une méthode de correction des césures et nous en analysons l&amp;rsquo;impact sur une tâche de recherche de livres. Nous décrivons également une série d&amp;rsquo;expériences sur l&amp;rsquo;enrichissement de requêtes à partir de mots extraits de Wikipédia. Les résultats obtenus montrent qu&amp;rsquo;utiliser un grand nombre de mots ainsi qu&amp;rsquo;une répartition adéquate des poids entre la requête initiale et l&amp;rsquo;enrichissement apporte une amélioration significative par rapport à l&amp;rsquo;état de l&amp;rsquo;art.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Critères d&#39;évaluation pour les interfaces des systèmes de recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.109/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.109/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La visualisation (ou restitution) des résultats d&amp;rsquo;une recherche est une étape essentielle dans tout processus de recherche d&amp;rsquo;information. En effet, les interfaces utilisateur d&amp;rsquo;information servent de lien entre les utilisateurs et les systèmes de recherche d&amp;rsquo;information, et permettent donc de donner un u sens » aux résultats pour les utilisateurs. Face à l&amp;rsquo;importance que prend la visualisation des résultats, de nombreuses interfaces (textuelles, 2D ou 3D) ont été proposées depuis une dizaine d&amp;rsquo;années. Cependant, bien que des évaluations aient été proposées, elles sont trop rares et peu interprétables (et comparables) du fait de la trop grande hétérogénéité des systèmes et de l&amp;rsquo;absence d&amp;rsquo;un cadre strict d&amp;rsquo;évaluation. Dans cet article, nous proposons donc de définir un ensemble de critères dans le but d&amp;rsquo;évaluer et de comparer ces interfaces.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection de fausses informations dans les réseaux sociaux : l’utilité des fusions de connaissances.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les réseaux sociaux permettent une diffusion massive et rapide des informations. Un&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Social networks make it possible to share rapidly and massively information. Yet, one of their major drawback comes from the absence of verification of the piece of information, especially with viral messages. This is the issue addressed by the participants to the Verification Multimedia Use task of Mediaeval 2016. They used several approaches and clues from different modalities (text, image, social information). In this paper, we explore the interest of combining and merging these approaches in order to evaluate the predictive power of each modality and in order to make the most of their potential complementarity.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction d&#39;un vocabulaire de surprise par mélange de filtrage collaboratif et d&#39;analyse de sentiments.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.21/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.21/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;informatique subit actuellement une mutation profonde: les améliorations maté- rielles et les grandes quantités de données disponibles fournissent un terrain fertile à la re- cherche en apprentissage automatique. Dans ce contexte, le principal défi est de tenir compte des préférences des utilisateurs pour proposer un accès personnalisé à l&amp;rsquo;information. Les sys- tèmes de recommandation créent des profils utilisateurs et objets en utilisant les revues utilisa- teurs, et ces profils reflètent les préférences des utilisateurs et les caractéristiques des objets. Nous proposons ici une analyse par combinaison de systèmes de recommandation et classifieurs de polarité qui met en évidence le vocabulaire de la surprise. En effet, la recommandation ana- lyse le passé et anticipe les attentes d&amp;rsquo;un utilisateur tandis que le classifieur de polarité prend en entrée une revue déjà écrite par l&amp;rsquo;utilisateur: nous montrons que l&amp;rsquo;écart entre l&amp;rsquo;expérience attendue et le retour réel sur un objet permet de construire un lexique de la surprise.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Fusion multimodale image/texte par réseaux de neurones profonds pour la classification de documents imprimés.</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper26short/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper26short/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La classification de documents imprimés est une tâche réalisée en entrée de multiples chaînes de traitement et d&amp;rsquo;analyse d&amp;rsquo;archives numériques, ce qui en fait un point critique dans de tel systèmes. Afin d&amp;rsquo;extraire des éléments caractéristiques de chaque catégorie parmi lesquels ces pièces doivent être classés, des données textuelles ou des images sont utilisés. Nous présentons dans cet article une analyse de différentes approches pour la catégorisation de documents exploitant des données textuelles ou des images en entrée, ainsi qu&amp;rsquo;un système de classification utilisant l&amp;rsquo;information du texte et de l&amp;rsquo;image de façon jointe en un modèle de réseau de neurone convolutionnel.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Grammatical Inference and Textual Information Extraction.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.179/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.179/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;objectif de l&amp;rsquo;Extraction de Connaissances Textuelles (ECT) est la recherche de mo- tifs intéressants dans les documents. La plupart des techniques employées dans ce domaine n&amp;rsquo;utilisent pas la structure linguistique, étant donnée le coût d&amp;rsquo;une analyse morpho-syntaxique (complète) et l&amp;rsquo;absence du respect des règles grammaticale (langue naturelle) dans ces textes. Dans ce contexte, l&amp;rsquo;Inférence Grammaticale peut être utilisée pour extraire la structure d&amp;rsquo;un texte (ou de ses sous-languages) afin de permettre une recherche informée dans une base de données textuelles. Dans cet article, nous présentons une contribution de l&amp;rsquo;Inférence Gramma- ticale dans le domaine d&amp;rsquo;ECT et exposons les éléments d&amp;rsquo;un processus d&amp;rsquo;extraction appliqué à un corpus d&amp;rsquo;annonces de séminaire.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Intégration de règles d&#39;association pour améliorer la recherche d&#39;informations XML.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.137/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.137/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La reformulation de requêtes constitue un moyen d&amp;rsquo;améliorer la recherche d&amp;rsquo;informations, en particulier lorsque cela concerne  des documents XML. Les approches existantes se basent sur une connaissance du domaine (thésaurus, ontologie) pour étendre la requête initiale. Nous proposons une approche de reformulation automatique basée sur une technique de datamining. Nous intégrons les règles d&amp;rsquo;association dans le système de recherche d&amp;rsquo;informations que nous avons développé pour les documents XML. Cela présente l&amp;rsquo;avantage de ne pas dépendre d&amp;rsquo;une connaissance du domaine préétablie qui n&amp;rsquo;est pas toujours disponible mais plutôt de s&amp;rsquo;appuyer sur une connaissance dynamique et cachée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèles d&#39;Ordonnancement pour l&#39;Annotation Automatique d&#39;Images dans les Réseaux Sociaux.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.115/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.115/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons un modèle d&amp;rsquo;ordonnancement de données relationnelles pour ap- prendre automatiquement à annoter des images dans les sites permettant le partage social d&amp;rsquo;images. Ce modèle apprend à associer une liste ordonnée d&amp;rsquo;étiquettes à une image en consi- dérant simultanément l&amp;rsquo;information de contenu (texte/image) et les informations relationnelles entre les images. Il est capable d&amp;rsquo;utiliser aussi bien des informations relationnelles implicites comme les similarités visuelles ou les informations relationnelles explicites comme l&amp;rsquo;amitié entre deux utilisateurs, où le fait que deux images possèdent le même auteur. Il peut être utilisé aussi bien pour l&amp;rsquo;annotation d&amp;rsquo;images non-annotées ou pour aider un utilisateur à annoter ses propres images. Le modèle lui-même est basé sur un algorithme transductif qui apprend à la fois à partir des images déjà annotées et des images à annoter. Les expériences menées sur un corpus réel extrait de Flickr montrent l&amp;rsquo;efficacité de ce modèle, particulièrement quand celui-ci utilise des informations extraites du réseau social sous-jacent aux images.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Nouveau modèle pour la datation automatique de photographies à partir de caractéristiques visuelles.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-24/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-24/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons, dans cet article, une méthode de datation de photographies par&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;We present in this paper, a method for dating photographs by using their visual content.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Régularisation Spatiale de Représentations Distribuées de Mots</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_23/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_23/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Stimulée par l&amp;rsquo;usage intensif des téléphones mobiles, l&amp;rsquo;exploitation conjointe des don- nées textuelles et des données spatiales présentes dans les objets spatio-textuels (p. ex. tweets) est devenue la pierre angulaire à de nombreuses applications comme la recherche de lieux d&amp;rsquo;at- traction. Du point de vue scientifique, ces tâches reposent de façon critique sur la représentation d&amp;rsquo;objets spatiaux et la définition de fonctions d&amp;rsquo;appariement entre ces objets. Dans cet article, nous nous intéressons au problème de représentation de ces objets. Plus spécifiquement, confor- tés par le succès des représentations distribuées basées sur les approches neuronales, nous proposons de régulariser les représentations distribuées de mots (c.-à-d. plongements lexicaux ou word embeddings), pouvant être combinées pour construire des représentations d&amp;rsquo;objets, grâce à leurs répartitions spatiales. L&amp;rsquo;objectif sous-jacent est de révéler d&amp;rsquo;éventuelles relations sémantiques locales entre mots ainsi que la multiplicité des sens d&amp;rsquo;un même mot. Les expéri- mentations basées sur une tâche de recherche d&amp;rsquo;information qui consiste à retourner le lieu physique faisant l&amp;rsquo;objet (sujet) d&amp;rsquo;un géo-texte montrent que l&amp;rsquo;intégration notre méthode de ré- gularisation spatiale de représentations distribuées de mots dans un modèle d&amp;rsquo;appariement de base permet d&amp;rsquo;obtenir des améliorations significatives par rapport aux modèles de référence.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Routage sémantique des requêtes dans les systèmes pair-à-pair.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.131/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.131/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes pair-à-pair (P2P) se sont imposés ces dernières années comme la technologie majeure d&amp;rsquo;accès à différentes ressources sur Internet. De nombreuses recherche concer- nant la sélection des meilleurs pairs contenant les données appropriées à une requête,ont émergé et constituent un axe de recherche très actif. L&amp;rsquo;efficacité de la recherche dans ces systèmes, et surtout le cas non structuré, peut être améliorée en introduisant de la sémantique dans le processus de routage des requêtes. Cette sémantique est généralement construite à par- tir du contenu des pairs, mais peut également faire intervenir le comportement explicite des utilisateurs. Nous présentons dans cet article un nouvel algorithme de routage des requêtes par apprentissage basé sur le comportement implicite des utilisateurs qui est déduit à partir d&amp;rsquo;un historique de requêtes. Pour tester l&amp;rsquo;algorithme proposé, nous avons défini une couche de routage sur le simulateur PeerSim qui nous a permis d&amp;rsquo;évaluer l&amp;rsquo;efficacité de notre algorithme.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Cascade de CRFs et SVM pour la détection de références bibliographiques diffuses dans les articles scientifiques.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le contexte d’une bibliothèque d’articles scientifiques, les références bibliographiques&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In the context of a library of scientific articles, bibliographic references are a major&lt;/p&gt;</description>
    </item>
    <item>
      <title>Choix d&#39;une mesure d&#39;association pour une extension de requête contôlée : la question de l&#39;orientation de la mesure.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.135/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.135/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une étude comparative de mesures d&amp;rsquo;association dans le contexte de la construction automatique de thésaurus. L&amp;rsquo;étude porte plus particulièrement sur la question de l&amp;rsquo;orientation de la mesure d&amp;rsquo;association. Différentes solutions sont distinguées et testées dans le cadre d&amp;rsquo;une tâche de filtrage adaptatif dans laquelle le thésaurus est utilisé pour sélectionner des termes d&amp;rsquo;indexation à ajouter au cours de l&amp;rsquo;apprentissage. Les résultats obtenus sur le corpus OSHUMED montrent une forte influence de l&amp;rsquo;orientation considérée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification conceptuelle d&#39;une collection documentaire - Intertextualité et Recherche d&#39;Information.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.123/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.123/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Une collection documentaire est généralement représentée comme un ensemble de do- cuments mais cette modélisation ne permet pas de rendre compte des relations intertextuelles et du contexte d&amp;rsquo;interprétation d&amp;rsquo;un document. Le modèle documentaire classique trouve ses limites dans les domaines spécialisés où les besoins d&amp;rsquo;accès à l&amp;rsquo;information correspondent à des usages spécifiques et où les documents sont liés par de nombreux types de relations. Cet article propose un modèle permettant de rendre compte de cette complexité des collections do- cumentaire dans les outils d&amp;rsquo;accès à l&amp;rsquo;information. En se basant sur l&amp;rsquo;analyse formelle et rela- tionnelle de concepts appliquée sur des objets documentaires ce modèle permet de représenter et d&amp;rsquo;interroger de manière unifiée les descripteurs de contenu des documents et les relations intertextuelles qu&amp;rsquo;ils entretiennent.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Comparaison des stratégies d&#39;indexation pour les langues asiatiques.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.117/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.117/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;En recherche d&amp;rsquo;information, les langues chinoise et japonais présentent des défis multiples. Contrairement aux langues européennes, les mots ne se sont pas délimités de manière explicite ce qui pose un problème pour l&amp;rsquo;indexation. Pour cette raison, plusieurs travaux ont proposé différentes stratégies pour représenter les documents (et requêtes) rédigés dans ces langues. Cet article présente une comparaison des stratégies d&amp;rsquo;indexation les plus courantes. En particulier, nous avons comparé quatre stratégies pour le chinois (unigrammes, bigrammes, uni- et bigrammes et finalement les mots), deux pour le japonais (bigrammes et mots) et trois pour le coréen (mots, bigrammes et morphèmes). Basé sur les collections-tests de NTCIR-5, nous avons évalués ces différentes approches à l&amp;rsquo;aide de neuf modèles de recherche, soit deux approches probabilistes et sept vectoriels.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Contextualisation automatique de Tweets à partir de Wikipédia.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_23/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_23/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les réseaux sociaux sont au centre des communications sur internet et une grande&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Social networks are central in nowadays internet communication and community exchanges. The emergence of Twitter led to the creation of a new tool for sharing information, where messages are bound to 140 characters. Publications on this social network are short and straightforward and often sent in real time from mobile phones, which make it difficult to appre- hend without some kind of context. We propose in this paper a method allowing to automatically contextualize Tweets by using information coming from Wikipedia. We treat this problem as an automatic summarization task, where the text to resume is composed of Wikipedia articles that discuss the various pieces of information appearing in a Tweet. We explore the influence of var- ious Tweet-related articles retrieval methods as well as several features for sentence extraction. We evaluate our approach using the test collection from the INEX 2012 Tweet Contextualization track and provide some insights on what makes a contextually important sentence.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Expansion de requêtes à base de motifs et de Word Embeddings pour améliorer la recherche de microblogs</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_16/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_16/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les services sociaux de microblogging jouent un rôle important dans notre société. Twitter est l&amp;rsquo;une des plateformes de microblogging les plus populaires, utilisées par les in- ternautes pour trouver des informations pertinentes (sujets d&amp;rsquo;actualité, tendances populaires, informations sur certains internautes, etc.). Dans ce contexte, la recherche d&amp;rsquo;information pro- venant de telles données a récemment gagné un intérêt majeur et ouvert de nouveaux défis. Cependant, la taille de ces données ainsi que des requêtes est généralement courte et peut avoir un impact sur le résultat de la recherche. Cette dernière peut être améliorée à l&amp;rsquo;aide de l&amp;rsquo;expan- sion de requêtes. En effet, les mots peuvent avoir plusieurs sens dont un seul est utilisé pour un contexte donné. Dans cet article, nous proposons une méthode d&amp;rsquo;expansion de requêtes prenant en compte le sens du contexte. Nous utilisons les motifs et les plongements de mots pour étendre les requêtes des utilisateurs. L&amp;rsquo;évaluation expérimentale de la méthode proposée est menée sur la collection TREC. Les résultats montrent l&amp;rsquo;efficacité de l&amp;rsquo;approche en combinant des motifs avec des plongements de mots pour améliorer significativement la recherche de microblogs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction d&#39;information à partir d&#39;articles médicaux.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.197/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.197/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;essentiel de l&amp;rsquo;information médicale est actuellement accessible dans diverses bibliothèques numériques ou sur le Web. Toutefois, l&amp;rsquo;usager désire parfois obtenir une information précise mais perdue dans un document spécifique. Dans cet article, nous proposons une approche automatique à ce problème d&amp;rsquo;extraction d&amp;rsquo;information. A partir du titre et du résumé d&amp;rsquo;articles médicaux touchant le domaine de la génétique, notre système s&amp;rsquo;avère capable d&amp;rsquo;y extraire le descripteur caractérisant un gène spécifique. Notre stratégie d&amp;rsquo;extraction, basée sur la régression logistique, a été évaluée sur un corpus de documents lié au forum d&amp;rsquo;évaluation TREC et a démontré une performance supérieure à la moyenne.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation semi-automatique de textes : thésaurus et transducteurs.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.151/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.151/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une méthode de classification ne nécessitant pas de phase d&amp;rsquo;apprentissage. Son but est d&amp;rsquo;améliorer l&amp;rsquo;indexation manuelle des documents textuels, une opéra- tion souvent menée au sein de certains systèmes d&amp;rsquo;information requérant un niveau de précision élevé. Le système, qui apporte une aide à l&amp;rsquo;indexeur humain, est semi-automatique. Par analo- gie à la terminologie utilisée en apprentissage automatique, la méthode est dite supervisée car elle exploite une définition préalable des catégories d&amp;rsquo;indexation. Un vocabulaire contrôlé, par exemple un thésaurus, est utilisé comme la ressource de base servant à la génération automa- tique de transducteurs (ou automates). L&amp;rsquo;application de ceux-ci à un texte permet d&amp;rsquo;extraire un nombre limité d&amp;rsquo;expressions pertinentes, chacune accompagnée d&amp;rsquo;au moins un code de catégo- rie dont l&amp;rsquo;analyse finale permet la classification du document. Nos tests sur un corpus de textes en français ont permis d&amp;rsquo;obtenir une f-measure située entre 0,51 et 0,64.&lt;/p&gt;</description>
    </item>
    <item>
      <title>La visualisation de données relationnelles au service de la recherche d&#39;informations.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.149/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.149/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre de la recherche d&amp;rsquo;informations, la restitution des documents s&amp;rsquo;effectue selon leur score de pertinence calculé, correspondant à une requête précise. Cependant des questions se posent quant à la représentation des documents et des requêtes ainsi que leur mise en correspondance. Le graphe est utilisé comme moyen de représentation et de visualisation de données, sans nécessiter de pré requis mathématique particulier. Cet article présente les apports de la visualisation d&amp;rsquo;information à la recherche d&amp;rsquo;information, en s&amp;rsquo;attachant au processus de conception d&amp;rsquo;un outil de visualisation et d&amp;rsquo;analyse développé par l&amp;rsquo;équipe SIG/EVI de l&amp;rsquo;IRIT le prototype VisuGraph. Dans ce contexte, nous proposons de nouvelles approches pour la visualisation des réseaux d&amp;rsquo;informations, afin d&amp;rsquo;en extraire avec facilité les documents les plus pertinents. Nous développons cette approche et nous illustrons notre contribution par des exemples concrets.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle neuronal tripartite pour la représentation de documents</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper25/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper25/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De nombreux travaux en recherche d&amp;rsquo;information (RI) ont montré que l&amp;rsquo;utilisation des sources d&amp;rsquo;évidence provenant de ressources sémantiques externes pourrait améliorer la performance de l&amp;rsquo;appariement. Par ailleurs, les approches neuronales sont devenues des modèles de référence qui permettent de capturer à partir des corpus, la sémantique latente des mots qui peut être injectée dans les modèles RI. Ce papier présente un modèle qui a pour but de réduire le fossé sémantique en RI en combinant ces deux sources d&amp;rsquo;évidence. C&amp;rsquo;est un modèle neuronal tripartite pour la représentation sémantique de documents qui exploite des connaissances explicites pour régulariser conjointement l&amp;rsquo;apprentissage de représentations des mots, des concepts et des documents. Nous montrons l&amp;rsquo;efficacité de notre modèle sur différentes tâches de RI.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Polarité des jugements et des interactions pour le filtrage collaboratif et la prédiction de liens sociaux.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.81/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.81/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous nous intéressons à l&amp;rsquo;étude des similarités entre utilisateurs dans des systèmes de filtrage collaboratif, et en particulier à l&amp;rsquo;exploitation de la polarité (note positive ou négative) des jugements. Nous proposons une mesure qui prend en compte les biais liés à la popularité de l&amp;rsquo;item et à la propension de l&amp;rsquo;utilisateur à noter de manière positive ou négative. La validité de cette mesure de similarité est évaluée par le biais de deux tâches (recommendation et prédiction de lien), et montre que ces deux mesures permettent de distinguer trois types de relations entre utilisateurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Retweeter ou ne pas retweeter : Le dilemme des portails de diffusion d’information temps-réel.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.28/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.28/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;étude des caractéristiques contextuelles a été largement traitée en Recherche d&amp;rsquo;Information (RI), mais les applications concrètes sur de vrais flux de données ne sont pas très répandues. Dans cet article, notre problématique concerne la décision automatique de retwee- ter un message. En considérant le centre d&amp;rsquo;intérêt d&amp;rsquo;un utilisateur, nous proposons un modèle pour effectuer un filtrage automatique en temps-réel du flux Twitter en utilisant de multiples caractéristiques contextuelles. Le modèle sépare l&amp;rsquo;aspect contextuel du contenu du message en lui-même, tout en conservant une très grande vitesse d&amp;rsquo;exécution. Des expérimentations ont été réalisées sur la collection TREC Microblog 2015. Les résultats montrent que l&amp;rsquo;intégration de caractéristiques de contexte a un impact positif sur l&amp;rsquo;efficacité du filtrage sans pénaliser son efficience.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Structuration sémantique des documents XML : Expérimentations et évaluation.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La norme XML permet la représentation d&amp;rsquo;un document selon un découpage logique qui ne reflète généralement pas la sémantique de son contenu. Il serait donc intéressant de compléter la structure logique des documents XML par une structure&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The XML standard represents a logical structuring of documents that generally do not reflect the semantics of the content. It would be interesting to complete the logical structure of an XML documents with a semantic structure. The purpose of this paper is to evaluate the approach of extraction of semantic structures for XML documents; this evaluation is performed on a sample of documents from the ImageClef2010 collection and using the MeSH (Medical Subject Headings) thesaurus.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une approche multi-vue pour l&#39;extraction terminologique bilingue.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.97/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.97/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier présente une approche multi-vue pour la traduction de termes de spécial- ité, basée sur un lexique bilingue et un corpus comparable. Nous proposons d&amp;rsquo;étudier dif- férents niveaux de représentation pour un terme : le contexte, le thème et la graphie. Ces trois approches sont tout d&amp;rsquo;abord étudiées individuellement, puis combinées afin de sélection- ner les meilleures traductions. Des expériences menées sur la traduction de termes médicaux du français vers l&amp;rsquo;anglais montrent une amélioration de l&amp;rsquo;approche classique par contexte, at- teignant une précision de 80,4% de bonnes traductions au rang 1.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une nouvelle approche pour la modélisation du prol de l&#39;utilisateur dans les systèmes de filtrage d&#39;information basés sur le contenu: le modèle de filtre détecteur de nouveauté.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.22/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.22/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente un mécanismme original pour la modélisation du profil de l&amp;rsquo;utilisateur dans les systèmes de filtrage d&amp;rsquo;information basés sur le contenu. Ce mécanisme repose sur un modèle de filtre basé sur la détection de la nouveauté. En exploitant les bouclages de pertinence positif et négatif, ce modèle permet à la fois de construire incrémentalement une représentation synthétique, ou profil, du besoin de l&amp;rsquo;utilisateur et d&amp;rsquo;adapter ce profil selon le changement de ses centres d&amp;rsquo;intérêt. Une expérimentation du fonctionnement de ce modèle, menée sur un corpus de plusieurs milliers de sites web référencés dans une des catégories principales de l&amp;rsquo;annuaire ouvert DMOZ, est également décrite. Cette expérimentation permet de démontrer l&amp;rsquo;efficacité du modèle proposé pour l&amp;rsquo;analyse du besoin de l&amp;rsquo;utilisateur et pour l&amp;rsquo;identification des alternatives utiles à la représentation de ce besoin.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Validation du type de la réponse dans un système de questions réponses.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.131/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.131/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre de la recherche de réponse à une question posée en langue naturelle dans des textes, de nombreuses questions attendent une réponse d&amp;rsquo;un certain type. Par exemple la question u Quel président succéda à Jacques Chirac ? » attend en réponse une entité du type président. La méthode présentée dans cet article vérifie que la réponse renvoyée est du bien type cherché. Pour cela elle suit une approche par apprentissage automatique en utilisant trois types de critères. Les premiers sont statistiques et calculent entre autre la fréquence d&amp;rsquo;apparition de la réponse avec le type dans un ensemble de documents. Les seconds utilisent des entités nommées et les derniers l&amp;rsquo;encyclopédie Wikipédia.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Améliorer la classification de documents par combinaison de descripteurs visuels et textuels.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La contribution principale de cet article est de proposer une nouvelle méthode de clas- sification des images de documents combinant les caractéristiques textuelles visuelles extraites respectivement avec les techniques des sacs de mots (BoW) et sacs de mots visuels (BoVW). Alors que les tentatives classiques de combinaison telles que celles basées sur le &amp;lsquo;Borda-Count&amp;rsquo; aboutissent à des résultats décevants, nous proposons ici une combinaison par apprentissage. Les expériences de cet article ont été réalisées sur une base de données industrielles de 1925 images de document. Ces tests révèlent que la combinaison des information améliore signi- ficativement les performances de classification. Notre contribution finale est une discussion concernant les réglages des BoW et BoVW dans un contexte industriel.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de l’évolution langagière dans des communautés d’auteurs</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper15/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper15/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les modèles de langue sont au coeur de nombreux de travaux, notamment dans les domaines de la recherche d&amp;rsquo;information et de la fouille de texte. Plutôt qu&amp;rsquo;une analyse fine de la sémantique des textes, ces modèles statistiques visent à extraire des distributions d&amp;rsquo;occurrence de mots dans différents contextes. Divers types d&amp;rsquo;approches ont été proposés dans la littérature, du simple modèle multinomial unigramme à des modèles à variables latentes pour la prise en compte de dépendances complexes dans les textes. Néanmoins, peu de travaux se sont portés sur la prise en compte conjointe des dépendances structurelles et temporelles dans des distributions de textes observés au cours du temps. Nous établissons ici un modèle dynamique de l&amp;rsquo;évolution langagière d&amp;rsquo;une communauté d&amp;rsquo;auteurs. En apprenant un modèle neuronal d&amp;rsquo;évolution sur des ensembles de textes produits par différents auteurs d&amp;rsquo;une communauté à différents instants, nous sommes capables d&amp;rsquo;en exploiter les dépendances latentes à des fins de prédiction des publications à venir.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage non-supervisé pour la segmentation automatique de textes.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.213/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.213/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article une approche basée sur des techniques d&amp;rsquo;appren- tissage pour la segmentation automatique de texte. Nous considérons un paragraphe comme l&amp;rsquo;entité textuelle de base. Notre système découvre d&amp;rsquo;abord diffèrents concepts présents dans un texte, chaque concept étant défini par un ensemble représentatif de mots. Le texte est en- suite segmenté suivant des paragraphes en utilisant une technique de partitionnement basée sur la vraisemblance classifiante. Nous évaluons l&amp;rsquo;efficacité de cette technique sur un ensemble concaténé de paragraphes de la collection 7sectors et nous la comparons à une technique de&lt;/p&gt;</description>
    </item>
    <item>
      <title>Audit d&#39;une base de documents étiquetée.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, déjà présenté à ICDAR 2015, nous nous intéressons à l’étiquetage&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The context of this paper, already presented at ICDAR 2015, is the labelling of a&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification Supervisée de Questions : Rôle de l&#39;Expansion Sémantique.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.147/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.147/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Fournir de bonnes réponses à une question donnée en cherchant au sein d&amp;rsquo;un grand corpus de documents est une tâche difficile. Il est nécessaire de percevoir et de reconnaître la question à un niveau qui permet d&amp;rsquo;imposer des contraintes sur l&amp;rsquo;ensemble des réponses pos- sibles. Une contrainte fréquemment utilisée est la catégorie des questions qui permet de déduire le type de réponse attendue. L&amp;rsquo;objectif est de fournir des informations supplémentaires afin de réduire l&amp;rsquo;écart entre la question et sa réponse. Nous proposons ici une approche pour amélio- rer l&amp;rsquo;efficacité des classifieurs, basée sur l&amp;rsquo;analyse linguistique et des approches statistiques. Ce travail propose également deux méthodes d&amp;rsquo;expansion des questions. Pour cela, différentes caractéristiques pour la représentation des questions, différentes pondérations et plusieurs al- gorithmes d&amp;rsquo;apprentissage automatique ont été étudiés. Les expériences menées sur des jeux de données réels montrent une amélioration de la précision dans la classification des questions.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Contrainte de correspondance Document-Document pour la RI. Application à la Divergence de Kullback-Leibler.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit une contrainte d&amp;rsquo;un modèle de recherche d&amp;rsquo;information décrivant les comportement attendu d&amp;rsquo;un système si un document du corpus est posé en requête, la contrainte DDMC (Document-Document Matching Constraint). Cette contrainte n&amp;rsquo;étant pas vérifiée par un modèle classique de recherche d&amp;rsquo;information (modèle de langue basé sur un calcul de néga- tive de Divergence de Kullback-Leibler avec lissage de Jelinek-Mercer), nous présentons une modification de ce dernier modèle qui permet de vérifier DDMC. Une dernière partie présente des expérimentations menées afin de vérifier que notre modification n&amp;rsquo;impacte pas la qualité des réponses d&amp;rsquo;un système, tout en garantissant la vérification de DDMC.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Evaluation de la contextualisation de tweets.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_16/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_16/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;intéresse à l&amp;rsquo;évaluation de la contextualisation de tweets. La contextuali- sation est définie comme un résumé permettant de remettre en contexte un texte qui, de par sa taille, ne contient pas l&amp;rsquo;ensemble des éléments qui permettent à un lecteur de comprendre tout ou partie de son contenu. Nous définissons un cadre d&amp;rsquo;évaluation pour la contextualisation de tweets généralisable à d&amp;rsquo;autres textes courts. Nous proposons une collection de référence ainsi que des mesures d&amp;rsquo;évaluation adhoc. Ce cadre d&amp;rsquo;évaluation a été expérimenté avec succès dans la contexte de la campagne INEX Tweet Contextualization. Au regard des résultats obtenus lors de cette campagne, nous discutons ici les mesures utilisées en lien avec les autres mesures de la littérature.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extension du modèle de langue pour la RI avec la position du terme.</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La plupart des modèles de RI se basent généralement sur la combinaison de trois facteurs dans leur fonction de pondération, qui sont : la fréquence du terme dans le document (TF), la fréquence du terme dans la collection (ou l&amp;rsquo;IDF) et la taille du document. Quelques approches ont proposé d&amp;rsquo;intégrer la position du terme dans le document dans l&amp;rsquo;objectif de surpondérer les termes qui apparaissent au début du document. Dans cet article, nous nous situons dans cette perspective. Précisément, nous proposons deux nouvelles techniques d&amp;rsquo;estimation du poids d&amp;rsquo;un terme en se basant sur ses positions dans le document. La première technique considère uniquement la positon de la première apparition du terme dans le document; la seconde technique prend en compte toutes les positions du terme dans le document. Nous avons ensuite intégré les facteurs obtenus dans un modèle de langue pour la RI. Deux techniques de lissage sont considérées dans ce modèle de langue: Dirichlet et Jelinek-Mercer. Les résultats expérimentaux obtenus sur deux collections de test TREC, montrent que notre modèle améliore significativement les deux modèles de langue de base: Dirichlet et Jelinek-Mercer. Notre modèle surpasse aussi un modèle de l&amp;rsquo;état de l&amp;rsquo;art, qui est le modèle CTR, basé sur la position du terme dans le document.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Filtrage Collaboratif avec un Algorithme d&#39;Ordonnancement.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.165/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.165/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;A ce jour, la plupart des travaux en filtrage collaboratif se basent sur la prédiction de notes pour générer des recommandations. Dans ce papier, nous choisissons d&amp;rsquo;explorer une autre voie, consistant à ordonner correctement les articles selon les goûts des utilisateurs. D&amp;rsquo;abord, nous définissons une erreur d&amp;rsquo;ordonnancement qui prend en compte les préférences par paires d&amp;rsquo;articles. Puis nous construisons un algorithme efficace qui optimise cette erreur. Enfin, nous testons notre approche sur une base standard de filtrage collaboratif. Pour cela, nous adap- tons le protocole d&amp;rsquo;évaluation initialement proposé par (Marlin, 2004a) pour la prédiction de notes à notre cas, où ce sont des préférences par paires qui sont prédites. Nous comparons nos performances avec celles de deux méthodes basées sur la prédiction de notes. Nous suggérons différentes directions pour continuer l&amp;rsquo;exploration de notre approche basée sur la prédiction d&amp;rsquo;ordres pour le filtrage collaboratif.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Introduction du nouveau centre de données biomédicales Décrypthon.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.151/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.151/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper presents the design and the implementation of the new high performance biomedical data center of the Décrypthon computing grid which provides a strong potential for calculation and storage to high trhoughput biological applications and projects. In order to efficiently share the biological data required by the application, the Décrypthon data center is integrated in the computing grid to provide local databases of nucleotide, genomic and proteomic sequences. In addition, the access to methods for heterogeneous and distributeddata, and treatment of joint queries, analysis and visualization are provided. A new system of data integration, called BIRD (for Biological Integration and Retrieval of Data), considered as the core of the Décrypthon data center, was developed to locally integrate very large genomic, proteomic and transcriptomic datasets. BIRD also provides an engine and a high level query language allowing the biologist to extract pertinent information.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Mining the Web for lists of Named Entities.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.113/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.113/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les entités nommées jouent un rôle important en extraction d&amp;rsquo;information. Dans cet article, nous proposons une méthode pour extraire des entités nommées de la même classe au sein de listes HTML. Au lieu de partir d&amp;rsquo;une classe donnée et d&amp;rsquo;extraire les entités correspon- dantes, nous proposons une nouvelle approche qui consiste à identifier des ensembles d&amp;rsquo;entités nommées sans connaître leur classe d&amp;rsquo;appartenance. Un avantage évident de cette approche est qu&amp;rsquo;elle peut s&amp;rsquo;appliquer à tout type d&amp;rsquo;entité nommée (c&amp;rsquo;est à dire à des entités nommées de n&amp;rsquo;importe quelle classe). Nous utilisons des listes HTML pour identifier des ensembles can- didats d&amp;rsquo;entités. Afin d&amp;rsquo;évaluer notre approche, des juges ont évalué un échantillon de listes HTML issues du Web. 8.25% de ces listes sont des listes d&amp;rsquo;entités nommées de la même classe. On peut ainsi s&amp;rsquo;attendre à trouver plus de 890 millions de listes d&amp;rsquo;entités nommées appartenant à la même classe sur tout le Web indexé. Le classifieur que nous proposons dans cet article et permettant d&amp;rsquo;identifier ces listes d&amp;rsquo;entités nommées pertinentes nous permet d&amp;rsquo;obtenir de premiers résultats prometteurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle d&#39;indexation dynamique à base d&#39;ontologies.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.169/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.169/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose un modèle de données pour une indexation basée sur une ontologie de référence représentant la sémantique des termes d&amp;rsquo;indexation. Le modèle proposé vise à permettre une indexation en temps réel qui suit la dynamique du corpus tout en assurant la disponibilité des documents et de l&amp;rsquo;index. Ceci permet de garder la cohérence entre les documents de la collection, l&amp;rsquo;index et l&amp;rsquo;ontologie de référence. Notre modèle permet ainsi d&amp;rsquo;éviter la reconstruction de l&amp;rsquo;index lors de la modification du corpus de documents car il reste à jour en permanence. Ainsi, le modèle que nous proposons permet l&amp;rsquo;indexation sémantique dynamique d&amp;rsquo;un corpus. Le modèle est illustré par des algorithmes expliquant sa mise en oeuvre.&lt;/p&gt;</description>
    </item>
    <item>
      <title>OBIRS-feedback, une méthode de reformulation utilisant une ontologie de domaine.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.135/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.135/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les performances d&amp;rsquo;un système de recherche d&amp;rsquo;information (SRI) peuvent être dégradées en termes de précision du fait de la difficulté pour des utilisateurs à formuler précisément leurs besoins en information. La reformulation ou l&amp;rsquo;expansion de requêtes constitue une des réponses à ce problème dans le cadre des SRI. Dans cet article, nous proposons une nouvelle méthode de reformulation de requêtes conceptuelles qui, à partir de documents jugés pertinents par l&amp;rsquo;utilisateur et d&amp;rsquo;une ontologie de domaine, cherche un ensemble de concepts maximisant les performances du SRI. Celles-ci sont évaluées, de manière originale, à l&amp;rsquo;aide d&amp;rsquo;indicateurs dont une formalisation est proposée. Cette méthode a été évaluée en utilisant notre moteur OBIRS, l&amp;rsquo;ontologie de domaine MeSH et la collection de tests MuCHMORE.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Personnalisation de l&#39;information: aperçu de l&#39;état de l&#39;art et définition d&#39;un modèle flexible de profils.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.31/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.31/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le but de la personnalisation est de faciliter l&amp;rsquo;expression du besoin de l&amp;rsquo;utilisateur et de lui permettre d&amp;rsquo;obtenir des informations pertinentes lors de ses accès à un système d&amp;rsquo;information. La pertinence de l&amp;rsquo;information se définit par un ensemble de critères et de préférences personnalisables spécifiques à chaque utilisateur ou communauté d&amp;rsquo;utilisateurs. Les données décrivant les utilisateurs sont souvent regroupées sous forme de profils. Le contenu du profil d&amp;rsquo;un utilisateur varie selon les approches et les applications. Les approches existantes répondent partiellement aux questions liées à la personnalisation, mais il manque un modèle donnant une vision globale sur les aspects de la prise en compte des préférences des utilisateurs. Dans cet article nous proposons un modèle de profil générique qui permet de classifier un grand nombre d&amp;rsquo;informations contenues dans les profils. Nous présentons également un ensemble d&amp;rsquo;opérateurs de manipulation de profils et une plateforme de gestion de profils.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Question-Réponse multilingue : influence du multilinguisme et stratégies.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.129/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.129/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente un système de question-réponse bilingue, capable de traiter des questions en français en cherchant la réponse dans des documents en anglais (ou potentielle- ment l&amp;rsquo;inverse). Deux stratégies de passage d&amp;rsquo;une langue à l&amp;rsquo;autre y sont décrites et évaluées. Ces stratégies concernent à la fois la recherche d&amp;rsquo;information dans le corpus et l&amp;rsquo;extraction de la réponse. Dans un premier temps, nous étudions l&amp;rsquo;apport de la traduction de bitermes, et l&amp;rsquo;influence de la complétion des dictionnaires de traduction. Dans un second temps, nous pro- posons une stratégie de transfert de l&amp;rsquo;analyse des questions d&amp;rsquo;une langue à l&amp;rsquo;autre et évaluons son influence dans notre chaîne.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une méthode collaborative pour identifier les spams: contribution à la qualité de l’information dans les réseaux sociaux.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.41/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.41/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Contrer les actions des utilisateurs mal intentionnés dits &amp;ldquo;spammeurs&amp;rdquo; est un réel défi pour maintenir un haut niveau de performance dans les applications mises en oeuvre dans les réseaux so- ciaux. Les méthodes conventionnelles de détection de spams imposent des délais de traitement impor- tants et inévitables, allant par exemple jusqu&amp;rsquo;à des mois pour traiter de grandes collections de tweets. Ces méthodes entièrement dépendantes de l&amp;rsquo;approche d&amp;rsquo;apprentissage supervisé choisie pour produire des modèles de classification, requièrent un ensemble de données vérité terrain qui n&amp;rsquo;est pas disponible pour ce type d&amp;rsquo;applications. Nous proposons donc une méthode basée sur un modèle linguistique non supervisé qui effectue une collaboration avec d&amp;rsquo;autres réseaux sociaux pour détecter les tweets spam dans des sujets qui génèrent de gros volumes d&amp;rsquo;échanges, par exemple à partir des hashtags utilisés. Notre méthode a été expérimentée sur plus de 6 millions de tweets postés dans 100 thématiques &amp;ldquo;ten- dances&amp;rdquo;. Facebook est utilisé en parallèle comme vérité terrain permettant ainsi la collaboration de deux réseaux sociaux différents. Nos expérimentations démontrent une efficacité en ce qui concerne le temps de traitement et la performance de classification, par rapport aux méthodes classiques de détection de spam dans les tweets.&lt;/p&gt;</description>
    </item>
    <item>
      <title>À la recherche des paramètres des modèles de RI.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.1000/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.1000/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous abordons ici le problème de l&amp;rsquo;estimation des paramètres des modèles standard de la recherche d&amp;rsquo;information sur de nouvelles collections pour lesquelles aucun jugement de pertinence n&amp;rsquo;est disponible. Pour cela, nous nous reposons sur des collections passées pour lesquelles des jugements de pertinence sont disponibles et introduisons une nouvelle représen- tation des requêtes indépendante de la collection considérée. À partir de cette représentation et des collections passées, nous apprenons une fonction de régression capable de fournir, pour une nouvelle requête, une valeur à chaque paramètre des modèles standard de la recherche d&amp;rsquo;information. Les expériences menées sur des collections standard montrent le bien fondé de l&amp;rsquo;approche suivie, qui fournit des résultats significativement meilleurs que ceux obtenus en uti- lisant les valeurs par défaut des paramètres ou en utilisant des jugements de pertinence sur la nouvelle collection.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Architecture Asymétrique pour les Modèles Neuronaux d&#39;Appariement de Textes</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_13/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_13/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans les modèles neuronaux d&amp;rsquo;appariement de textes, les entrées subissent les mêmes transformations pour construire les représentations correspondantes. La nature de la tâche d&amp;rsquo;appariement est défini à partir du type des entrées du modèle et de la relation entre elles. Nous distinguons deux types d&amp;rsquo;appariement : (1) l&amp;rsquo;appariement symétrique fait référence aux tâches d&amp;rsquo;appariement à des entrées de même nature, telles que l&amp;rsquo;identification des paraphrases et la classification de documents. (2) l&amp;rsquo;appariement asymétrique concerne des tâches à des entrées de natures différentes, telle que l&amp;rsquo;appariement document-requête ou question-réponse. Généralement, les représentations des entrées sont construites indépendamment de leurs nature à partir des vecteurs de leurs mots. Nous proposons une approche permettant de prendre en compte la nature de la tâche, (1) ou (2), et de mieux traiter les entrées. Nous utilisons un modèle d&amp;rsquo;attention pour étendre des modèles de l&amp;rsquo;état de l&amp;rsquo;art. Les résultats expérimentaux montrent que l&amp;rsquo;adaptation de l&amp;rsquo;architecture du modèle au type de la tâche permet d&amp;rsquo;améliorer les performances de plusieurs modèles neuronaux bien connus.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Detection of abusive messages in an on-line community.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.16/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.16/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La modération du contenu posté par les utilisateurs de communautés en ligne est majoritairement effectuée manuellement. De par la taille des données à traiter, les méthodes au- tomatiques ont un intérêt certain pour réduire la charge de travail. Actuellement, l&amp;rsquo;industrie utilise des approches basiques à base de recherche de mots, comme par exemple le filtrage des messages contenant certains mots interdits. Nous nous intéressons dans cet article à une tâche de classification permettant de déterminer si un message est abusif ou non. Ceci est com- plexe, car les messages sont écrits dans un langage naturel non standardisé. Nous proposons ici une approche originale de modération automatique appliquée au français, s&amp;rsquo;appuyant à la fois sur des outils classiques et un nouveau descripteur fondé sur la modélisation du comporte- ment utilisateur face à un message abusif. Les résultats obtenus lors de cette étude préliminaire montrent le potentiel de notre méthode, pour l&amp;rsquo;alerte automatique ou le support à la décision.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Impact de la présence/absence des termes de la requête dans le document sur le processus d’appariement document-requête en utilisant Word2Vec</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper28/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper28/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous étudions l&amp;rsquo;appariement document-requête basé sur des similarités sémantiques entre les termes de la requête et ceux du document, à l&amp;rsquo;aide du plongement lexical des mots (word embedding). Contrairement aux approches traditionnelles qui sont basées sur les représentations dites sac de mots et qui reposent sur l&amp;rsquo;appariement exact entre les mots, le processus d&amp;rsquo;appariement pourrait être amélioré en tenant compte de tous les mots du document et en traitant différemment les mots de la requête qui ne sont pas dans le document. Nous avons exploité différentes stratégies d&amp;rsquo;appariement. Les résultats expérimentaux en utilisant des collections TREC montrent que les stratégies d&amp;rsquo;appariement étudiées donnent de meilleurs résultats que les modèles classiques de la RI.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation de structures de documents par réseaux bayésiens.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.163/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.163/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Notre objectif est d&amp;rsquo;étudier l&amp;rsquo;apport des réseaux naïfs augmentés dans les problèmes de classification d&amp;rsquo;images. Les images utilisées dans notre étude représentent la structure d&amp;rsquo;un type de documents qui contiennent des blocs de textes et de graphiques. Nous avons proposé trois variantes des réseaux bayésiens. En premier lieu les réseaux bayésiens naïfs RN qui malgré leur structure simple ont donnés un très bons résultats. En second lieu, les réseaux bayésiens naïfs augmentés par un arbre TAN. En effet, l&amp;rsquo;hypothèse d&amp;rsquo;indépendance entre les attributs est généralement fausse. A cet effet, l existe différentes techniques pour assouplir cette hypothèse. En troisième lieu, les réseaux bayésiens naïfs augmentés par une forêt FAN qui bien qu&amp;rsquo;ils soient assez connus dans les problèmes de classification, n&amp;rsquo;ont pas été explorés à notre connaissance en imagerie. Les résultats obtenus ont montré une nette amélioration du FAN par rapport aux réseaux RN et TAN&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation et représentation comparative : application au discours électoral.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.185/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.185/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit quelques approches afin d&amp;rsquo;extraire les termes les plus représentatifs d&amp;rsquo;un site web ou d&amp;rsquo;un ensemble de documents en comparaison avec d&amp;rsquo;autres sites ou un corpus de référence. Nous montrons que la fréquence d&amp;rsquo;occurrence ou le rang des termes les plus fréquents peut fournir une première synthèse. Notre proposition s&amp;rsquo;appuie sur une distribution binomiale des mots et le calcul d&amp;rsquo;un score normalisé (score Z) mettant en lumière les termes comparativement les plus appropriés.  Quelques exemples tirés des discours électoraux suisses ou français illustrent l&amp;rsquo;intérêt de l&amp;rsquo;approche suggérée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Influence de l&#39;hétérogénéité sémantique sur les performances d&#39;un système de RI distribuée.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.151/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.151/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous considérons des systèmes pair-à-pair pour le partage de documents dans lesquels chaque pair utilise une ontologie pour représenter ses documents. Lorsque tous les pairs n&amp;rsquo;utilisent pas la même ontologie, le système est sémantiquement hétérogène, ce qui constitue à priori un frein à l&amp;rsquo;inter- opérabilité. Nous proposons un système dont l&amp;rsquo;organisation générique en couches logicielles sépare les algorithmes dédiés à la diminution de l&amp;rsquo;hétérogénéité de ceux utilisés pour la recherche d&amp;rsquo;informa- tion sémantique distribuée. Nous proposons une méthode de RI, puis nous étudions sur l&amp;rsquo;impact qu&amp;rsquo;ont des algorithmes dédiés à la diminution de l&amp;rsquo;hétérogénéité sur l&amp;rsquo;interopérabilité (mesurée en termes de précision/rappel). Nos expérimentations considèrent des ontologies du domaine bio-médical et des documents issus de la base PubMed. Nous mesurons l&amp;rsquo;hétérogénéité du système et le taux de préci- sion/rappel obtenus avant et après avoir appliqué deux algorithmes visant à diminuer l&amp;rsquo;hétérogénéité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Mots audio-visuels joints pour la détection de scènes violentes dans les vidéos.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier présente une représentation audio-visuelle des données pour la détection des scènes violentes dans les films. Les travaux existants dans ce domaine considèrent l&amp;rsquo;information visuelle ou l&amp;rsquo;information audio; voire leur fusion classique. Jusqu&amp;rsquo;à présent peu d&amp;rsquo;ap- proches ont exploré leur dépendance mutuelle pour la détection de scènes violentes. Ainsi, nous proposons un descripteur qui fournit des indices multimodaux audio et visuels; tout d&amp;rsquo;abord en assemblant les descripteurs audio et visuels, ensuite en révélant statistiquement les motifs conjoints multimodaux. La validation expérimentale a été effectuée dans le cadre de la tâche u détection de scènes violentes » de MediaEval 2013. Les résultats obtenus montrent le potentiel de l&amp;rsquo;approche proposée en comparaison avec les méthodes utilisant les descripteurs audio et visuels séparément ou d&amp;rsquo;autres types de fusion.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Prédiction des buzz sur Twitter.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La prédiction des buzz sur Internet est une tâche difficile notamment parce que le phé- nomène est dépendant de paramètres très divers, liés au contenu du message lui-même mais aussi au contexte de sa diffusion et à la dynamique de propagation de l&amp;rsquo;information sur la toile. Ces difficultés se trouvent augmentées par la dimension du Web et la dispersion et la fragmen- tation des informations qui s&amp;rsquo;y trouvent. Twitter est un espace d&amp;rsquo;expérimentation plus contraint et délimité que le Web dans sa globalité; dans cet article, nous présentons une méthode de prédiction des buzz appliquée à la prédiction des pics de ré-émissions (retweets) des messages postés sur Twitter. La méthode proposée repose essentiellement sur trois types d&amp;rsquo;indicateurs dont nous pensons qu&amp;rsquo;ils participent à la probabilité de re-diffusion d&amp;rsquo;un tweet : la popula- rité, la saillance thématique et l&amp;rsquo;expressivité. Ces descripteurs sont utilisés comme variables d&amp;rsquo;entrée d&amp;rsquo;un réseau de neurones dont le rôle est de prédire le dépassement d&amp;rsquo;un seuil de ré- émission du message. Les tests, conduits sur un ensemble d&amp;rsquo;environ 30000 messages, montrent l&amp;rsquo;efficacité de l&amp;rsquo;approche proposée : le système détecte plus de 72% des messages re-diffusés au moins 60 fois.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information dans des documents structurés par proximité des termes.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.165/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.165/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons une méthode pour calculer un score d&amp;rsquo;un élément quelconque d&amp;rsquo;un document structuré qui prend en compte la proximité des termes de la requête dans le texte du document. Plus précisément nous définissons autour de chaque occurrence d&amp;rsquo;un terme de la requête une fonction d&amp;rsquo;influence. Pour une occurrence qui apparaît dans le texte proprement dit, cette fonction d&amp;rsquo;influence décroit linéairement de 1 à 0 selon la distance à l&amp;rsquo;occurrence. Lorsqu&amp;rsquo;un terme de la requête apparaît dans le titre d&amp;rsquo;une (sous-)section d&amp;rsquo;un document struc- turé, son influence est uniformément 1 du début à la fin de la (sous-)section. Nous utilisons des requêtes booléennes et les fonctions d&amp;rsquo;influence sont combinées à chaque noeud ET et OU de l&amp;rsquo;arbre de la requête selon le modèle de la logique floue. Le score d&amp;rsquo;une partie quelconque de document est la normalisation de la somme de la fonction d&amp;rsquo;influence résultante à la racine de l&amp;rsquo;arbre de la requête sur l&amp;rsquo;intervalle associé à cette partie. Nous présentons et commentons les résultats obtenus dans le cadre de la tâche ad&amp;rsquo;hoc de la campagne INEX 2006.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche de la pertinence et de la nouveauté dans les textes.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.229/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.229/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de recherche d&amp;rsquo;information s&amp;rsquo;intéressent à retrouver les documents pertinents par rapport à un besoin défini par un utilisateur. Certains systèmes se sont intéressés à mieux répondre au besoin de l&amp;rsquo;utilisateur en considérant un niveau de granularité plus petit que le document. Dans ces systèmes, les informations restituées à l&amp;rsquo;utilisateur ne correspondent pas aux documents mais aux passages susceptibles de correspondre au besoin exprimé. Cet article répond à la double tâche proposée dans le programme TREC : rechercher les passages pertinents et ceux qui apportent de la nouveauté. Nous présentons une nouvelle stratégie de sélection de passages qui permet d&amp;rsquo;être efficace sans utiliser de ressources extérieures. Nous discutons les résultats obtenus sur les collections de TREC utilisées en 2002 et 2003.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Représentation Dynamique de Documents pour une Recherche Documentaire Intelligente.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.43/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.43/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Avec le développement des supports de stockage, la quantité de documents disponibles&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;With the development of internet and storage devices, the quantity of available doc- uments increases quickly. It is necessary to have an information retrieval system able to ap- prehend efficiently these enormous quantities of documents. In this paper we propose DIIR (Dynamic Indexing for Information Retrieval), an information retrieval model based on the vector space model where the representation of documents is made dynamically in order to ex- pand requests and to adapt the term weights of documents. An evaluation of the model on real data from the evaluation campaign AMARYLLISS confirms the relevance of our approach.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réseau de neurones profond et SVM pour la classification des sentiments.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.121/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.121/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le développement des forums, des blogs et de la vente en ligne pousse les utilisateurs à laisser de plus en plus d&amp;rsquo;informations en libre accès sur le web. Une partie de ces informations décrit des sentiments: elles permettent de développer des modèles d&amp;rsquo;analyse d&amp;rsquo;opinions et de faire des sondages dans divers domaines en récupérant simplement ces données textuelles. Nous proposons d&amp;rsquo;utiliser des réseaux de neurones pour apprendre des modèles de classifica- tion d&amp;rsquo;opinions efficaces. L&amp;rsquo;architecture retenue mêle des couches de neurones classiques et des couches de convolution, elle permet de projeter les mots dans un espace sémantique continu. Nous avons comparé notre travail avec un modèle SVM sur le corpus multi-thématiques Ama- zon. Nos expériences aboutissent à des performances identiques aux SVM et à de l&amp;rsquo;état de l&amp;rsquo;art. Cependant les modèles se comportent différemment et les erreurs ne concernent pas les mêmes documents: il est possible d&amp;rsquo;améliorer les performances en combinant les modèles.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réseaux possibilistes pour un modèle de recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.143/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.143/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans ce papier un modèle de recherche d’information utilisant les réseaux&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper proposes a model for Information Retrieval (IR) based on possibilistic directed networks. Relations documents-terms and query-terms are modeled through possibility and necessity measures rather than a probability measure. The relevance value for the doc- ument given the query is measured by two degrees: the necessity and the possibility. More precisely, the user&amp;rsquo;s query triggers a propagation process to retrieve necessarily or at least possibly relevant documents. The possibility degree is convenient to filter documents out from the response (retrieved documents) and the necessity degree is useful for document relevance confirmation. Separating these notions may account for the imprecision pervading the retrieval process. Experiments carried out on a sub-collection of CLEF, namely LeMonde 1994, a French newspapers collection, showed the effectiveness of the model.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers une indexation personnalisée de photographies par apprentissage non supervisé de régularités.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.181/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.181/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose une approche pour indexer des images photographiques avec pour objectif de permettre une bonne qualité d&amp;rsquo;annotation des images et aussi un moyen de visualiser, pour un utilisateur non expert, ce que le système apprend pour éventuellement corriger un apprentissage défectueux. Notre approche repose sur la génération de régularités dans l&amp;rsquo;espace des caractéristiques extraites en se basant sur un apprentissage non supervisé, puis sur un apprentissage supervisé afin d&amp;rsquo;associer ces régularités à des termes d&amp;rsquo;indexation. Des expérimentations préliminaires sur des photographies ont été menées et sont décrites.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Was it better before ? Automated Quotation Detection in Ancient Texts.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.40/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.40/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;intéresse à l&amp;rsquo;application des travaux en recherche de citations dans le contexte de documents anciens en langue grecque. La notion de citation est définie dans le contexte de ces documents, et les approches automatiques ustatistiques et sémantiquesu qui permettent de les découvrir sont évaluées à la lumière de cette définition et des ressources disponibles. Nous étudions également les effets spécifiques à notre corpus sur les métriques de performance.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de conversion de documents semi-structurés à partir d&#39;exemples.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.181/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.181/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Une majorité de travaux de Recherche d&amp;rsquo;Information dans les collections de documents semi-structurés se focalise sur le traitement de bases homogènes et ne sont pas utilisables sur des corpus de documents hétérogènes issus du Web par exemple. Nous présentons ici la mé- thode ISM (Incremental Structure Mapping) permettant la conversion de documents XML issus de sources hétérogènes dans un schéma de médiation. ISM est centrée document et permet la prise en compte simultanée de la structure et du contenu des documents. Elle ne nécessite pas de spécifier des correspondances entre schéma manuellement et utilise des méthodes d&amp;rsquo;appren- tissage automatique, l&amp;rsquo;utilisateur n&amp;rsquo;ayant qu&amp;rsquo;à fournir au système un ensemble de documents exprimés conjointement dans leur schéma initial et dans le schéma de destination. Contraire- ment aux méthodes existantes, ISM possède une complexité très faible et permet de traiter de grands corpus de documents. Les résultats des expériences sur différents corpus montrent que l&amp;rsquo;algorithme est capable d&amp;rsquo;apprendre des transformations complexes, notamment pour la tâche de conversion du format HTML vers un format XML sémantiquement riche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Catégorisation automatique de pages web chinoises - documents spécialisés vs grand public sur le tabagisme.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.203/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.203/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La catégorisation (ou classification supervisée) de textes concerne généralement le thème traité ou le type de document. Nous nous intéressons ici à une dimension particulière, le public visé, en distinguant deux grandes catégories : textes destinés au grand public, et textes destinés à des spécialistes du domaine traité. Nous testons la catégorisation, selon cette opposition, de pages web en langue chinoise sur le thème du tabagisme. Dans ce contexte, nous obtenons les conclusions suivantes : une segmentation des textes chinois en mots plutôt qu&amp;rsquo;en sinogrammes n&amp;rsquo;améliore pas la catégorisation mais facilite son interprétation ; des attributs supplémentaires relevés à la lecture humaine du corpus n&amp;rsquo;améliorent pas la catégorisation ; un arbre de décision ou un SVM sont plus performants sur un corpus de test proche du corpus d&amp;rsquo;entraînement (F1 = 98;5 %) que Na¨ıve Bayes ou Kppv ; les Kppv ou un arbre de décision&lt;/p&gt;</description>
    </item>
    <item>
      <title>Combining Subword information and Language model for Information Retrieval</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper9short/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper9short/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;En recherche d&amp;rsquo;information, certains procédés sont utilisés pour améliorer les performances des modèles de langue. Lorsque l&amp;rsquo;on considère la sémantique des mots, il a été montré que les plongements de mots neuronaux capturent des similarités sémantiques entre les mots (Mikolov et al., 2013). De telles représentations distribuées qui plongent les mots dans un espace vectoriel dense sont apprises de façon efficace sur de grandes collections. Récemment, elles ont été utilisées pour calculer les probabilités de traduction entre termes dans le cadre des modèles de langue neuronaux (Zuccon et al., 2015) pour la recherche d&amp;rsquo;information afin de gérer le problème de la disparité des termes. Dans cet article, nous proposons d&amp;rsquo;utiliser de nouvelles représentations distribuées qui prennent en compte la structure interne des mots (Bojanowski et al., 2016) dans le cadre des modèles de langue neuronaux.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction de patterns successifs dans des images de document en combinant histogrammes de forces et de droites discrètes.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article une méthode originale pour la recherche de séries de&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The problematic of automatically searching series of broad patterns in technical&lt;/p&gt;</description>
    </item>
    <item>
      <title>Graphe de communauté pour la validation de relations dans le cadre de la population de bases de connaissances.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.37/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.37/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;extraction de relations entre entités à partir de textes est une étape importante pour des tâches d&amp;rsquo;extraction d&amp;rsquo;information ou de découverte de connaissances. Les systèmes pro- duisent de nombreux candidats et la tâche de validation de relation consiste à décider si une relation candidate est correcte ou non en fonction des informations fournies par les systèmes. Dans cet article, nous proposons un nouvel ensemble de traits fondés sur l&amp;rsquo;analyse des graphes engendrés par les relations entre entités, qui complète ceux provenant d&amp;rsquo;une analyse linguistique.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Impact de l&#39;information visuelle pour la Recherche d&#39;Images par le contenu et le contexte.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.179/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.179/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les documents multimédia composés de texte et d&amp;rsquo;images sont de plus en plus présents grâce à Internet et à l&amp;rsquo;augmentation des capacités de stockage. Cet article présente un modèle de représentation de documents multimédia qui combine l&amp;rsquo;information textuelle et l&amp;rsquo;information visuelle. En utilisant une approche par sac de mot, un document composé de texte et d&amp;rsquo;image peut être décrit par des vecteurs correspondant à chaque type d&amp;rsquo;information. Pour une requête multimédia donnée, une liste de documents pertinents est retournée en combinant linéairement les résultats obtenus séparément sur chaque modalité. Le but de cet article est d&amp;rsquo;étudier l&amp;rsquo;im- pact, sur les résultats, du poids attribué à l&amp;rsquo;information visuelle par rapport à l&amp;rsquo;information textuelle. Des expérimentations, réalisées sur la collection multimédia ImageCLEF extraite de l&amp;rsquo;encyclopédie Wikipedia, montrent que les résultats peuvent être améliorés après une première étape d&amp;rsquo;apprentissage de ce poids.&lt;/p&gt;</description>
    </item>
    <item>
      <title>La prédiction efficace de la difficulté des requêtes : une tâche impossible?</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les moteurs de recherche d’information (RI) retrouvent des réponses quelle que soit la&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Search engines found answers whatever the user query is, but some queries are more&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle de compréhension du besoin en information pour la recherche d&#39;information conversationnelle</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La RI repose sur un cadre standard qui interroge des collections de documents à partir d&amp;rsquo;un besoin en information exprimé sous la forme d&amp;rsquo;un ensemble de mots-clés. Notre contri- bution vise à dépasser ce paradigme habituel en traitant directement le besoin en information exprimé en langage naturel pour tendre vers une nouvelle génération de systèmes de RI axés sur l&amp;rsquo;aspect conversationnels (appelés aussi &amp;ldquo;search oriented conversational systems&amp;rdquo;). Une première étape réside alors dans la formulation de requêtes à partir de besoins en informa- tion exprimés en langage naturel. Nous proposons dans ce papier un modèle de formulation de requêtes capable 1) d&amp;rsquo;apprendre la traduction des expressions en langage naturel en requêtes de type mots-clés de manière supervisée, et 2) d&amp;rsquo;injecter les retours de pertinence dans le pro- cessus d&amp;rsquo;apprentissage (apprentissage par renforcement). Pour pallier au manque de données d&amp;rsquo;apprentissage, nous considérons le modèle de traduction comme un modèle de sélection de mots. Notre modèle est évalué sur deux collections TREC démontrant ainsi son efficacité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle évolutif d&#39;un profil utilisateur.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.197/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.197/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La prise en compte des besoins, des intentions et des spécificités cognitives, cuturelles ou autres, qui caractérisent le profil d&amp;rsquo;un utilsiateur constitue un élément déterminant pour améliorer la pertinence des réponses lors d&amp;rsquo;une session de Recherche d&amp;rsquo;Information dans de grandes bases de documents. La modélisation des profils et la manière de les adapter à différents utilisateurs qui n&amp;rsquo;ont pas une idée précise sur l&amp;rsquo;information qu&amp;rsquo;ils recherchent, nous permet d&amp;rsquo;offrir un accès personnalisé au contenu de documents scientifiques fondé sur l&amp;rsquo;exploitation du profil d&amp;rsquo;utilisateur. Nous proposons dans cet article, un modèle de l&amp;rsquo;utilisateur fondé sur les connaissances et un système implémentant le raisonnement à partir des cas, pour acquérir ces connaissances, les structurer et les faire évoluer.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Normalisation et validation d&#39;images de documents capturées en mobilité.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La numérisation de documents à l&amp;rsquo;aide des smartphones introduit un nombre impor- tant de dégradations qui doivent être corrigées ou détectées sur le mobile, avant l&amp;rsquo;envoi de données sur un réseau payant ou la perte de disponibilité du document. Dans cet article, nous proposons un système permettant de corriger les problèmes de perspective et d&amp;rsquo;illumination avant d&amp;rsquo;estimer la netteté de l&amp;rsquo;image pour un traitement OCR. L&amp;rsquo;étape corrective repose sur une détection des contours, suivie d&amp;rsquo;une normalisation de l&amp;rsquo;illumination. Son évaluation sur un jeu de données privé montre une amélioration franche des résultats OCR. L&amp;rsquo;étape de contrôle repose sur une combinaison de mesures de focus. Son évaluation sur un jeu de données public montre que cette approche simple donne des performances comparables à celles des meilleures méthodes basées sur des traitements lourds, et surpasse les méthodes basées sur des métriques.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Quantification et identification des concepts implicites d&#39;une requête.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_27/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_27/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article une méthode non supervisée pour l’identification et&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper we introduce an unsupervised method for mining and modeling la- tent search concepts. We use Latent Dirichlet Allocation (LDA), a generative probabilistic topic model, to exhibit highly-specific query-related topics from pseudo-relevant feedback doc- uments. Our approach automatically estimates the number of latent concepts as well as the needed amount of feedback documents, without any prior training step. Latent concepts are then weighted to reflect their relative adequacy and are further used to automatically reformu- late the initial user query. We also explore the use of different types of sources of information for modeling the latent concepts. For this purpose, we use four general sources of information of various nature (web, news, encyclopedic) from which the feedback documents are extracted. We evaluate our approach over two large ad-hoc TREC collections, and results show that it signif- icantly improves document retrieval effectiveness while best results are achieved by combining latent concepts modeled from all available sources.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Quel est l&#39;auteur de ce roman ?</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.135/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.135/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons le problème de l&amp;rsquo;attribution d&amp;rsquo;auteur d&amp;rsquo;une oeuvre écrite. Comme représentation des textes, les études récentes s&amp;rsquo;appuient sur un ensemble restreint de mots fonctionnels ou très fréquents (50 ou 100). Sur cette base, les méthodes de l&amp;rsquo;analyse en composantes principales (ACP) ou des correspondances (AC) permettent de visualiser les affinités et différences entre les représentations des écrits. En appliquant l&amp;rsquo;approche du plus proche voisin, nous pouvons estimer l&amp;rsquo;auteur de chaque texte. Comme alternative, nous suggérons de fonder le calcul de distance entre textes sur la base de la spécificité du vocabulaire (Z score). Basée sur une évaluation de corpus en langue française et anglaise, cette solution permet d&amp;rsquo;accroître la qualité de l&amp;rsquo;attribution d&amp;rsquo;auteur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ridgelet-based signatures for natural image classification.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.29/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.29/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous proposons une nouvelle représentation des images naturelles permettant de les organiser en groupes sémantiquement consistants. Les catégories concernées par la méthode sont identifiées par les propriétés statistiques des scènes naturelles. Les images sont décrites par une signature basée sur les ridgelets. Elle est combinée à une classifieur à vecteur support (SVM),qui est particulièrement adapté à la représentation des données en grande dimension, résultant en un système de reconnaissance efficace. Le potentiel de notre approche est démontré par une série de classifications binaires (e.g. ville/paysages or scènes extérieures/intérieures) sur une base de 1900 images.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle à base de chemin de lecture pour la Recherche d&#39;Informations précises sur le Web.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.249/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.249/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Actuellement, le noeud hypertexte (document) est utilisé comme la plus petite granularité d&amp;rsquo;information que l&amp;rsquo;utilisateur cherche. Nous supposons que le fait de considérer le noeud hypertexte comme unité informationnelle n&amp;rsquo;as pas toujours un sens, car il s&amp;rsquo;agit uniquement d&amp;rsquo;une contrainte physique. Dans la réalité, l&amp;rsquo;utilisateur peut avoir envie de rechercher un seul paragraphe, ou au contraire un ensemble de pages. Or, les SRI se basent sur la granularité d&amp;rsquo;un noeud comme unité de base. Cette contrainte physique peut être la cause de résultats non satisfaisants, typiquement des documents &amp;ldquo;bruités&amp;rdquo; contenant, en plus de l&amp;rsquo;information recherchée, d&amp;rsquo;autres informations non pertinentes. En plus, si nous manipulons les noeuds indépendamment les uns des autres sans prendre en compte les informations dispersées dans plusieurs noeuds, nous aurons probablement un &amp;ldquo;silence&amp;rdquo; dans les réponses, c&amp;rsquo;est-à-dire qu&amp;rsquo;il y a encore des informations pertinentes mais le SRI n&amp;rsquo;a pas pu les retrouver car les documents ont perdu leur contexte (les noeuds voisins) et les relations sémantiques entre eux. Dans cet article, nous redéfinissons la notion de document dans un contexte hypertexte et requête précise. Nous proposons, comme réponse précise à une requête, un document virtuel que nous appelons chemin de lecture. Ce dernier reflète la description de l&amp;rsquo;information sur les hypertextes. Il est formé de zones de texte dispersées dans un ou plusieurs documents connectés. Nous proposons un modèle permettant d&amp;rsquo;extraire les chemins de lecture. Nous utilisons les liens typés pour regrouper les zones de texte constituant chaque chemin. Pour celà, nous nous basons sur une technique heuristique et sur les valeurs de similarité entre les zones.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle de RI basé sur des critères d&#39;obligation et de certitude.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.155/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.155/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;l existe un grand nombre de modèles de recherche d&amp;rsquo;information chacun ayant pour but de répondre au mieux aux attentes des utilisateurs. Le modèle que nous proposons se base sur une formulation précise de la requête reflétant le besoin de l&amp;rsquo;utilisateur : Chaque terme de la requête est augmenté par deux critères, l&amp;rsquo;un exprimant l&amp;rsquo;obligation ou non de l&amp;rsquo;apparition du terme dans les documents et l&amp;rsquo;autre exprimant la certitude de l&amp;rsquo;utilisateur quand au terme utilisé. Des expérimentations nous ont permis de vérifier qu&amp;rsquo;une telle formulation permet de gagner en précision.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une plate-forme open-source de recherche d&#39;information sémantique.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.167/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.167/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les méthodes de RIS visent à s&amp;rsquo;affranchir des problèmes classiques de synonymie et polysémie via le passage au niveau conceptuel. Elles reposent souvent sur l&amp;rsquo;utilisation d&amp;rsquo;une ressource sémantique. La qualité des résultats dépend des fonctionnalités sémantiques mises en place ainsi que de la qualité de la ressource utilisée. Malgré la profusion des propositions, l&amp;rsquo;apport d&amp;rsquo;une sémantique explicite reste à prouver. Nous proposons une décomposition des fonctionnalités qui sont communes aux différentes méthodes de RI. Nous présentons ensuite Terrier SIR qui, via la dissociation des modules sémantiques, favorise aussi bien l&amp;rsquo;implémenta- tion des méthodes de RIS que leurs éventuelles mises à jour ou adaptations. Nous avons effectué des expérimentations pour mettre en évidence l&amp;rsquo;intérêt d&amp;rsquo;une telle plate-forme.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Automatic Detection of Depressive Users in Social Media</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La dépression est une affection courante qui concerne environ 350 millions de personnes dans le monde selon les estimations de l&amp;rsquo;Organisation Mondiale de la Santé. La détection de ce trouble est donc un enjeu majeur de santé publique. Plusieurs recherches en psychologie ont démontré l&amp;rsquo;existence d&amp;rsquo;un lien fort entre l&amp;rsquo;état dépressif d&amp;rsquo;un individu et son expression langagière. Dans cet article, nous proposons de repérer automatiquement ces indices linguistiques dans le but de détecter les comportements dépressifs à partir de messages postés sur les réseaux sociaux. Notre approche est supervisée et se base sur un ensemble de traits d&amp;rsquo;apprentissage allant de traits standards tels que les sacs de mots ou les traits de surface, à des traits plus sémantiques. L&amp;rsquo;approche a été évaluée sur des données issues du réseau social Reddit et appliquée sur deux tâches : (a) étant donné les posts d&amp;rsquo;un utilisateur, détecter si l&amp;rsquo;auteur est dépressif ou non; (b) étant donné un fil de posts d&amp;rsquo;un même utilisateur présentés chronologiquement, détecter au plus tôt les signes de la dépression. Nos résultats montrent l&amp;rsquo;intérêt de notre approche pour ces deux tâches.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification automatique de textes basée sur une ontologie normée. Application du Extensible Business Reporting Language (XBRL) au Reuters Corpus Volume 1 (RCV1).</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.151/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.151/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous démontrons que l&amp;rsquo;utilisation d&amp;rsquo;une ontologie normée selon le domaine d&amp;rsquo;application permet d&amp;rsquo;améliorer significativement la Classification automatique de textes (CAT). Nous utilisons le Extensible Business Reporting Language (XBRL) pour définir une ontologie normée et comparons la performance d&amp;rsquo;un engin de CAT (IBM Classification Module v.8.6) face à 2 autres listes de concepts, soient simple et hiérarchique. Notre échantillon de nouvelles financières est tiré du Reuters Corpus Volume 1 (RCV1), où 2 experts en finance nous aident à coder 1 000 des 45 000 nouvelles portant sur les fusions et acquisitions. Nous rapportons le rappel, la précision, la mesure F, et en plus une mesure dite hiérarchique ajustée pour la pertinence de classification au niveau des classes parents, ainsi qu&amp;rsquo;une mesure plus détaillée évaluant l&amp;rsquo;amélioration de la classification au niveau de chaque texte.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Compression de structure XML pour la recherche d&#39;information structurée.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.197/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.197/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;informations dans les documents structurés nécessite le stockage de la structure des documents indexés dans les index. Si de nombreuses méthodes sont connues et largement utilisées pour compresser les index pour les documents plats, le stockage efficient de la structure est peu étudié. Nous présentons une représentation de structure arborescente adap- tée à la recherche d&amp;rsquo;information structurée, puis nous proposons une méthode de compression des données de cette représentation. Nous présentons les résultats d&amp;rsquo;expérimentations sur la collection Wikipedia utilisée dans les campagnes INEX 2006 et 2007 (5,8 giga-octet, 659 388 documents) en terme d&amp;rsquo;efficience en espace et en temps.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Désambiguïsation d’entités nommées par apprentissage de modèles d’entités à large échelle.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.23/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.23/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La désambiguïsation d&amp;rsquo;entités consiste à lier automatiquement des mentions d&amp;rsquo;entités identifiées dans un texte et des entités présentes dans une base de connaissances. L&amp;rsquo;approche générale consiste à produire, pour une mention donnée, des entités candidates puis à sélection- ner la meilleure parmi celles-ci, selon un ensemble de critères. Notre travail se focalise sur cette dernière étape, avec une méthode fondée sur l&amp;rsquo;apprentissage de modèles permettant d&amp;rsquo;opérer une discrimination entre une entité et les entités qui lui sont ambiguës. Un verrou majeur dans ce contexte réside dans la capacité à gérer de grandes bases de connaissances nécessitant l&amp;rsquo;ap- prentissage de dizaines de millions de modèles. Nous proposons trois stratégies permettant d&amp;rsquo;y répondre, offrant différents compromis entre efficacité et qualité de reconnaissance. Nous les validons expérimentalement sur six bases provenant des campagnes TAC en utilisant les bases de connaissances Freebase et DBpedia.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection et segmentation des blocs de texte manuscrits et imprimés dans des documents complexes.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons un système de segmentation des zones de texte imprimées ou manuscrites dans des documents complexes. La méthode réalise une première classification des composantes connexes en tant que texte/non-texte, puis un deuxième étage discrimine les composantes manuscrites des composantes imprimées. Les composantes de texte sont ensuite regroupées en blocs homogènes à l&amp;rsquo;aide d&amp;rsquo;un algorithme basé sur la détection des rectangles blancs. Nous présentons les résultats obtenus par le système lors de la première campagne MAURDOR.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction de relations n-aires interphrastiques guidée par une RTO.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.179/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.179/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article une méthode d&amp;rsquo;extraction d&amp;rsquo;instances de relations n- aires dans un texte guidée par une Ressource Termino-Ontologique (RTO) de domaine. Une RTO est une ressource comportant une composante conceptuelle (l&amp;rsquo;ontologie) et une compo- sante terminologique (la terminologie), dans laquelle les termes sont distingués des concepts qu&amp;rsquo;ils dénotent. L&amp;rsquo;ontologie permet la modélisation de relations n-aires, reliant des arguments pouvant être des concepts symboliques et des quantités. La méthode proposée s&amp;rsquo;applique aux relations n-aires formulées de façon implicite dans le texte et dont les instances d&amp;rsquo;arguments peuvent être exprimées à travers différentes phrases du texte.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction des bulles de bandes dessinées.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-23/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-23/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les bandes dessinées et les mangas sont l’une des formes les plus populaires de&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Comics and manga are one of the most popular and familiar forms of graphic content&lt;/p&gt;</description>
    </item>
    <item>
      <title>Impact de la reconnaissance de l&#39;écriture en-ligne sur une tâche de catégorisation.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.219/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.219/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;intéresse à la problématique de la catégorisation automatique de docu- ments manuscrits en-ligne et plus particulièrement à l&amp;rsquo;impact de la reconnaissance de l&amp;rsquo;écriture dans un processus de catégorisation utilisant des méthodes d&amp;rsquo;apprentissage automatique. Nous comparons les performances obtenues avec des documents issus d&amp;rsquo;un système de recon- naissance de l&amp;rsquo;écriture en-ligne et leur version originale électronique. Les résultats montrent qu&amp;rsquo;aucune perte significative des performances n&amp;rsquo;est à signaler lorsque 78 % des termes d&amp;rsquo;in- dexation sont correctement reconnus dans les documents à catégoriser. Nous montrons égale- ment que lorsque plus de la moitié de ces termes sont mal reconnus, l&amp;rsquo;utilisation d&amp;rsquo;une liste de candidats mots permet d&amp;rsquo;améliorer le taux de classification.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Méthodes de classification pour l’identification de nœuds importantes dans les graphes dynamiques</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De nos jours, nous nous intéressons à la détection d&amp;rsquo;entités importantes, ceci peut être des mots-clés importants dans un document ou Twitter, ou des individus importants dans un réseau de mouvement. Nous pouvons modéliser ces données sous la forme d&amp;rsquo;un graphe dy- namique et utiliser des métriques de centralité telle que la centralité de proximité temporelle. Malheureusement, cela peut être coûteux. Dans ce travail, nous comparons la précision de plu- sieurs méthodes de classification supervisée, les unes par rapport aux autres, à la détection de ces noeuds importants. Sur seize jeux de données de natures différentes, nous montrons que ces méthodes réussissent à différencier les noeuds importants de noeuds insignifiants. Nous montrons également que prendre en compte la nature des données diminue la qualité de résultats. Enfin, nous examinons le temps du calcul de chacune de ces méthodes contre le temps du calcul de méthodes exact.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Pseudo-réinjection de pertinence basée sur un modèle de langue mixte combinant les termes simples et composés.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_20/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_20/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous présentons une nouvelle technique de reformulation de requête. Cette technique considère la requête comme un ensemble de termes composés et un ensemble de termes simples. Pour déterminer les termes d&amp;rsquo;expansion on additionne les poids des relations d&amp;rsquo;un terme candidat avec chacun des termes de la requête (simple, composé). Un terme candidat est choisi s&amp;rsquo;il est fortement en relation avec la plupart des termes de la requête. Cette technique est modélisée dans le cadre de modèle de langue. Les tests effectués sur deux collections TREC ont montré des améliorations par rapport à deux modèles: le modèle uni-gramme et le modèle d&amp;rsquo;expansion de requêtes basé sur la mesure Kullback- Leibler Divergence (KLD).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche bilingue et multilingue d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.271/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.271/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Afin de pouvoir interroger des corpus écrits dans plusieurs langues, la stratégie la plus simple et la moins onéreuse consiste à traduire la requête soumise dans la (ou les) langue(s) souhaitée(s). Dans ce but, nous nous sommes appuyés sur des ressources dispo- nibles gratuitement sur le Web. En comparant l&amp;rsquo;efficacité du dépistage entre les requêtes traduites manuellement ou automatiquement, on constate que la machine s&amp;rsquo;avère moins bonne que l&amp;rsquo;être humain. Toutefois, cette première conclusion se base sur une moyenne et une analyse plus détaillée indique une forte variabilité, dans le dépistage de l&amp;rsquo;information, entre les performances des différentes traductions produites par la machine. La question qui se pose est de savoir si l&amp;rsquo;on peut prédire la performance d&amp;rsquo;une requête traduite afin de sélectionner seulement la meilleure ou les meilleures traductions. Afin de résoudre ce problème, nous avons conçu un système de prédiction basé sur la régression logistique et capable de prédire les meilleures traductions. L&amp;rsquo;évaluation de notre approche s&amp;rsquo;avère supé- rieure au meilleur système de traduction automatique.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information flexible basée CP-nets.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.161/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.161/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier décrit une approche de recherche d&amp;rsquo;information (RI) flexible fondée sur l&amp;rsquo;utilisation des CP-Nets (Conditional Preferences Networks). Le formalisme CP-Net est utilisé d&amp;rsquo;une part, pour la représentation graphique de requêtes flexibles exprimant des préférences qualitatives et d&amp;rsquo;autre part pour l&amp;rsquo;évaluation flexible de la pertinence des documents. Le raisonnement et l&amp;rsquo;inférence sur les préférences qualitatives n&amp;rsquo;étant pas aisés, nous devons quantifier les préférences. Nous proposons alors une approche de pondération automatique des requêtes CP-Nets. Cette pondération, correspondant à la quantification du CP-Net requête par des valeurs d&amp;rsquo;utilités, conduit à un UCP-Net. L&amp;rsquo;UCP-Net correspond à une requête booléenne pondérée. Une utilisation des CP-Nets est également proposée pour la représentation des documents dans la perspective d&amp;rsquo;une évaluation flexible des requêtes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>SnapToTell Accès ubiquitaire à de l&#39;information multimédia à partir d&#39;un téléphone portable.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.35/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.35/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Avec la prolifération des téléphones portables munis d&amp;rsquo;appareils photo, beaucoup de nouvelles applications et services vont émerger : nous présentons le système SnapToTell, qui permet de fournir de l&amp;rsquo;information à partir de requêtes images prises d&amp;rsquo;un téléphone portable. Nous présentons également des résultats expérimentaux sur l&amp;rsquo;identification de scènes, basés sur une collection test d&amp;rsquo;images originales et réalistes de scènes à Singapour.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;With the proliferation of camera phones, many novel applications and services will emerge. In this paper, we present the SnapToTell system, which provides information directory service to tourists based on pictures taken by the camera phones and location information. Next we present experimental results on scene recognition based on a realistic data set of scenes and locations in Singapore which form a new original application oriented image test bed freely available.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle pour l&#39;interrogation visuelle des documents structurés.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.211/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.211/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons un modèle d&amp;rsquo;interrogation visuelle des documents structurés permettant de représenter graphiquement les requêtes utilisateurs sous forme de graphe, et d&amp;rsquo;effectuer ainsi des requêtes d&amp;rsquo;une rare complexité syntaxique et sémantique. Le modèle est validé par le développement d&amp;rsquo;un prototype XmlBrowser permettant d&amp;rsquo;explorer et d&amp;rsquo;interroger une collection de documents structurés (Xml).&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this article, we present a visual querying model of the structured documents making it possible to represent graphically the users query in the form of graph, thus to carry out query of a rare syntactic and semantic complexity.  The model is validated by the development of an XmlBrowser prototype for seamlessly browsing and querying a collection of structured document (Xml).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une approche pour la recherche sémantique de l&#39;information dans les documents semi-structurés hétérogènes.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.195/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.195/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier présente SHIRI-Querying, une approche pour la recherche sémantique de l&amp;rsquo;information dans les documents semi-structurés. Nous proposons une solution pour pallier l&amp;rsquo;incomplétude et l&amp;rsquo;imprécision des annotations au moment de l&amp;rsquo;interrogation. Cette solution repose sur deux types de reformulations élémentaires qui exploitent la notion d&amp;rsquo;agrégation et la structure des documents. Nous présentons l&amp;rsquo;algorithme DREQ qui combine ces transfor- mations élémentaires pour construire des reformulations ordonnées de la requête utilisateur. L&amp;rsquo;étude de notre approche sur deux corpus réels montre que les reformulations augmentent considérablement le rappel et que la précision est meilleure pour les premières réponses retournées.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers des méta-règles de contexte appréciées par la IIE pour la RI.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.73/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.73/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le processus de Fouille de Textes (FT), basé sur l&amp;rsquo;extraction des règles d&amp;rsquo;association en utilisant un algorithme, génère une quantité importante de règles d&amp;rsquo;association. Dans cet article, ce sont des règles d&amp;rsquo;association non redondantes résultantes d&amp;rsquo;un processus d&amp;rsquo;extrac- tion à partir d&amp;rsquo;un corpus de textes. Nous proposons tout d&amp;rsquo;abord de montrer l&amp;rsquo;intérêt et l&amp;rsquo;utilité de règles d&amp;rsquo;association filtrées par une mesure de qualité autre que la confiance, en particulier l&amp;rsquo;Intensité d&amp;rsquo;Implication Entropique (IIE). D&amp;rsquo;autre part, nous présentons une nouvelle structure de données &amp;ldquo;les Méta-règles de contexte&amp;rdquo; (MR) afin de réduire la base de règles en mettant en valeur les nouvelles mesures correspondantes. Nous étudions nos approches dans le cadre de la recherche d&amp;rsquo;information (RI) pour l&amp;rsquo;expansion de requêtes ( QE). Nos expériences ont été me- nées sur une collection en anglais de CLEF 2003. Les résultats ont montré une amélioration significative de la pertinence système.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de métrique appliqué à la détection de changement de page Web et aux attributs relatifs.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.27/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.27/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article un nouveau schéma d&amp;rsquo;apprentissage de métrique. Basé sur l&amp;rsquo;exploitation de contraintes qui impliquent des quadruplets d&amp;rsquo;images, notre approche vise à modéliser des relations sémantiques de similarités riches ou complexes. Nous étudions comment ce schéma peut être utilisé dans des contextes tels que la détection de régions impor- tantes dans des pages Web ou la reconnaissance à partir d&amp;rsquo;attributs relatifs.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper introduces a novel distance metric learning framework. Working with in- equality constraints involving quadruplets of images, our approach aims at efficiently modeling similarity for rich or complex semantic label relationships. We study how our metric learning scheme can be exploited in contexts such as detection of important regions in Webpages or recognition with relative attributes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de Représentation appliqué à la Recommandation pour la Littérature Scientifique</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La littérature scientifique forme un large réseau d&amp;rsquo;information reliant des acteurs va- riés (laboratoires, entreprises, institutions, etc.). La vaste quantité de données générées par ce réseau constitue un graphe hétérogène attribué dynamique, dans lequel de nouvelles informa- tions sont constamment produites et dont il est de plus en plus difficile d&amp;rsquo;extraire du contenu d&amp;rsquo;intérêt. Dans cet article, je présente mes premiers travaux de thèse réalisés en partena- riat avec un acteur industriel. Celui-ci propose un outil de veille scientifique abordant diffé- rentes problématiques, telles que la recommandation d&amp;rsquo;articles et la recherche d&amp;rsquo;experts. Tout d&amp;rsquo;abord, je détaille les données habituellement associées à la littérature scientifique. Ensuite, j&amp;rsquo;aborde le problème de la recherche d&amp;rsquo;experts, son évaluation et propose une nouvelle méthode pour juger de la qualité d&amp;rsquo;un algorithme. Enfin, j&amp;rsquo;introduis un algorithme d&amp;rsquo;apprentissage de représentations abordant le problème du plongement des noeuds d&amp;rsquo;un graphe dans un espace de faible dimension, étendu pour intégrer l&amp;rsquo;information textuelle liée à ces noeuds.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage des schémas de propagation dans les multi-graphes.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.159/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.159/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous considérons le problème de l&amp;rsquo;étiquetage de noeuds dans un multi-graphe- ou graphe multi-relationnel- dans lequel les noeuds peuvent être connectés simultanément par dif- férents types de relations. De nombreux problèmes se modélisent ainsi, comme par exemple les réseaux sociaux ou bien les bases de données bibliographiques. Les relations peuvent être expli- cites (par exemple amitié dans un réseau social) ou bien implicite (par exemple des similarités de contenu calculées sur les données). Nous proposons ici un algorithme d&amp;rsquo;apprentissage per- mettant d&amp;rsquo;exploiter l&amp;rsquo;information multi-relationnelle pour la tâche d&amp;rsquo;étiquetage automatique. Cette méthode est capable d&amp;rsquo;apprendre à combiner de manière optimale l&amp;rsquo;influence des dif- férents types de relations sur la propagation des étiquettes entre les noeuds du graphe. Nous décrivons des expériences sur quatre corpus qui montrent la capacité du modèle à tirer parti de l&amp;rsquo;information multi-relationnelle pour des tâches d&amp;rsquo;étiquetage complexes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection d’opinion argumentée à partir de Twitter</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper20/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper20/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Savoir ce que pensent les gens est fondamental pour la prise de décision. Avec la croissance explosive des réseaux sociaux ces informations sont disponibles à profusion, sous forme d&amp;rsquo;avis, d&amp;rsquo;opinions ou d&amp;rsquo;un jugement formé sur quelque chose ou quelqu&amp;rsquo;un pour défendre un point de vue. Plusieurs chercheurs ne se sont concentrés que sur l&amp;rsquo;identification et la définition de l&amp;rsquo;opinion. Nous proposons dans cet article de définir et de caractériser l&amp;rsquo;opinion argumentée selon les composantes d&amp;rsquo;arguments associées. Nous avons mené des expériences en utilisant différents modèles de classification.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Étude d’un modèle d’inférence de connaissances à partir de textes.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose une approche automatisée d&amp;rsquo;inférence de connaissances basée sur l&amp;rsquo;analyse de relations extraites à partir de textes. Son originalité repose sur la définition d&amp;rsquo;un cadre tenant compte (i) d&amp;rsquo;une structuration des objets étudiés (e.g. syntagmes nominaux) sous la forme d&amp;rsquo;un ordre partiel et (ii) de l&amp;rsquo;exploitation possible d&amp;rsquo;une connaissance a priori formalisée dans un modèle de connaissances de type ontologie (taxonomie). Ce cadre permet notamment de définir des règles de propagation de l&amp;rsquo;information basées sur la théorie des croyances afin d&amp;rsquo;inférer de nouvelles connaissances à partir des relations extraites. Bien qu&amp;rsquo;a portée plus large, notre approche est ici illustrée et évaluée au travers de la définition d&amp;rsquo;un système automatique exploitant des textes issus du Web afin de répondre à des questionnaires générés. Nous montrons notamment l&amp;rsquo;intérêt de structurer les extractions et le gain apporté par la prise en compte d&amp;rsquo;une connaissance a priori au sein d&amp;rsquo;une telle chaîne de traitement.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Filtrage de l&#39;indexation textuelle d&#39;une image au moyen du contenu visuel pour un moteur de recherche d&#39;images sur le web.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.44/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.44/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous décrivons une méthode de filtrage de l&amp;rsquo;indexation textuelle d&amp;rsquo;images qui traitent de sujets généralistes. Pour cela, nous construisons d&amp;rsquo;abord des classes vi- suelles pour chaque mot-clé du lexique au moyen de classifications ascendantes hiérarchiques des vecteurs visuels dans l&amp;rsquo;espace visuel. Puis, nous testons la validité de l&amp;rsquo;association mot- clé/classes visuelles à l&amp;rsquo;aide d&amp;rsquo;une base de test et nous mesurons la performance de la classifi- cation obtenue à l&amp;rsquo;aide du score u normalized score ». Enfin, nous utilisons les classes visuelles pour filtrer l&amp;rsquo;indexation textuelle et obtenir une amélioration de l&amp;rsquo;indexation allant jusqu&amp;rsquo;à 40% suivant la consistance visuelle du mot.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Intégrer plus de connaissances linguistiques en recherche d&#39;information peut-il augmenter les performances des systèmes ?</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.223/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.223/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article pose la question de l&amp;rsquo;intérêt en RI de la combinaison au&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Mesure de la netteté sur une image seule dans des documents anciens.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-12/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-12/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente différentes méthodes permettant d&amp;rsquo;analyser le flou de focus dans le contexte de numérisation. Nous allons définir des méthodes pour mesurer cette information. Ensuite, nous estimerons la pertinence de ces mesures en faisant varier le flou. Puis enfin, nous associerons ces informations en utilisant un modèle d&amp;rsquo;apprentissage supervisé afin d&amp;rsquo;évaluer le gain possible de cette mesure.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This article presents some way to do quality control after digitization, specially out of focus problem. We will enumerate different point of view to analyse and to estimate this information. To validate descriptors, we suggest to blur any picture and to compute blur estimation in order to evaluate precision. After that, we propose to combinate descriptors by machine learning.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle probabiliste pour l&#39;extraction de structures dans les documents semistructurés - Application aux documents Web.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.169/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.169/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le développement des systèmes de gestion de contenu a profondément changé la nature du Web : de plus en plus de documents sont créés automatiquement et leur mise en page reflète leur structure logique. Dans ce travail, nous montrons que l&amp;rsquo;information contenue dans la mise en page est suffisante pour inférer une structure sémantiquement riche, ce qui ouvre la voie à de nombreuses applications. Le passage d&amp;rsquo;une information de mise en page à une structure sémantique se heurte à deux principaux obstacles : l&amp;rsquo;hétérogénéité des données et le caractère implicite de de la structure des documents Web. Nous décrivons un modèle stochastique capable d&amp;rsquo;apprendre à transformer des documents semi-structurés vers un schéma défini a priori et présentons une instance particulière de ce modèle adaptée à la transformation de documents hétérogènes HTML en XML. Finalement, nous décrivons plusieurs expériences sur des corpus XML et HTML réels.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Prédire la difficulté des requêtes : la combinaison de mesures statistiques et sémantiques.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La performance d&amp;rsquo;un Système de Recherche d&amp;rsquo;Information (SRI) est étroitement liée à la requête. Les requêtes pour lesquelles les SRI échouent sont appelées dans la littérature des u requêtes difficiles ». L&amp;rsquo;étude présentée dans cet article vise à ana- lyser, adapater et combiner plusieurs prédicteurs de difficulté de requêtes. Nous avons considéré trois prédicteurs: un lié à l&amp;rsquo;ambiguïté des termes, un basé sur la fréquence des termes et une mesure de répartition des résultats. L&amp;rsquo;évaluation de la prédiction est basée sur la corrélation entre la difficulté prédite et la performance réelle des SRI. Nous montrons que la combinaison de ces prédicteurs donne de bons résultats. Le cadre d&amp;rsquo;évaluation est celui des collections TREC7 et TREC8 adhoc.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche de documents structurés en mobilité : un modèle et une mesure d&#39;évaluation.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.211/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.211/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les travaux en recherche de documents structurés ne s&amp;rsquo;intéressent que peu pour le moment à leur emploi dans un contexte de mobilité. Dans de tels cas, on pose que l&amp;rsquo;objectif d&amp;rsquo;un système de recherche d&amp;rsquo;information demeure inchangé (il est de satisfaire le besoin d&amp;rsquo;information d&amp;rsquo;un utilisateur), mais il faut intégrer que les écrans des systèmes mobiles sont petits et que le réseau utilisé n&amp;rsquo;a pas une grande bande passante. Nous proposons dans cet article une première approche, relativement simple, qui prend en compte ces aspects, en privilégiant les parties de documents structurés petites en terme de taille. Pour tout travail scientifique, il est nécessaire d&amp;rsquo;évaluer les résultats de nos propositions, c&amp;rsquo;est pour cela que nous proposons une mesure d&amp;rsquo;évaluation des systèmes de recherche d&amp;rsquo;information en mobilité. Cette mesure est inspirée du gain cumulé déjà utilisé pour les documents structurés, mais intègre la taille des documents pour en calculer leur intérêt dans un contexte de mobilité en favorisant les parties de documents petites.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Regroupement de relations pour l&#39;extraction d&#39;information non supervisée.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.191/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.191/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;En contexte de veille, l’extraction d’information non supervisée a pour but d’extraire&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The purpose of unsupervised information extraction is to extract information from text without fixing the type of information. Our work concentrates on the task of extracting and characterizing new relations between given entity types. We first propose in this article a filtering procedure to remove false relation candidates by combining heuristics and machine learning models. Best results achieve a score of 77.1% F-measure. Similar relations are then grouped together semantically using Markov Clustering and All Pairs Similarity Search algo- rithm, which can efficiently identify similar candidates in large scale. Finally, evaluations of clustering results, using both internal and external measures, show that the integration of the filtering step allows to double the recall while keeping the same precision.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Relations explicites entre différentes représentations d&#39;image dans un modèle de graphe visuel.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.211/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.211/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons dans ce papier une nouvelle méthode pour exploiter la relation entre différents niveaux de représentation d&amp;rsquo;image afin de compléter le modèle de graphe visuel. Le modèle de graphe visuel est une extension du modèle de langue classique en recherche d&amp;rsquo;infor- mation. Nous utilisons des régions d&amp;rsquo;images et des points d&amp;rsquo;intérêts (associées automatiquement à des concepts visuels), ainsi que des relations entre ces concepts, lors de la construction de la représentation sous forme de graphe. Les résultats obtenus sur catégorisation de la collection RobotVision de la compétition d&amp;rsquo;ImageCLEF 2009 (contenant 5 pièces dans un environnement à l&amp;rsquo;intérieur du bâtiment) montrent que (a) la procédure de l&amp;rsquo;induction automatique des concepts d&amp;rsquo;une image est efficace, et (b) l&amp;rsquo;utilisation des inter-relations entre 2 niveaux de représentation, en plus de concepts, permet d&amp;rsquo;améliorer le taux de reconnaissance.&lt;/p&gt;</description>
    </item>
    <item>
      <title>SRI à base d&#39;inclusion graduelle.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.235/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.235/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article étudie, d&amp;rsquo;un point de vue expérimental, l&amp;rsquo;apport des inclusions graduelles issues de la théorie des ensembles flous pour la modélisation d&amp;rsquo;un système de recherche d&amp;rsquo;in- formation (SRI), comme l&amp;rsquo;ont proposé de manière théorique (Bosc et al., 2008b). Documents et requêtes sont représentés par des ensembles flous, appariés par des opérateurs flous, dont le choix est crucial pour obtenir un système adapté à la RI. S&amp;rsquo;ils sont bien choisis, le SRI flou ob- tenu est proche des SRI classiques et obtient des résultats aussi bons, en conservant l&amp;rsquo;avantage de son cadre théorique fort. À l&amp;rsquo;inverse, l&amp;rsquo;examen d&amp;rsquo;opérateurs inadaptées à la RI souligne les propriétés requises par ce SRI flou. Enfin, nous montrons la valeur ajoutée de ce modèle flou, qui permet d&amp;rsquo;envisager des extensions du modèle très naturelles. Un exemple simple montre comment utiliser une base de liens morphologiques entre mots dans ce cadre.&lt;/p&gt;</description>
    </item>
    <item>
      <title>X-IOTA: Une plateforme distribuée ouverte pour l&#39;expérimentation en Recherche d&#39;Information.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.287/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.287/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Réaliser des expérimentations en Recherche d&amp;rsquo;Information est une activité lourde car nécessitant à la fois des outils rapides pour traiter des collections de taille significative, mais également des outils flexibles pour laisser le plus de latitude possible au champ de l&amp;rsquo;expérimen- tation. Le système X-IOTA a été développé pour répondre tout particulièrement au critère de flexibilité et donc pour favoriser la mise en place rapide d&amp;rsquo;expérimentations variées introduisant des aspects traitement de la langue. L&amp;rsquo;architecture proposée permet également une distribution des calculs. Finalement une interface de commande est mise en place afin de faciliter le suivi et l&amp;rsquo;évolution des calculs sur les différents sites ainsi que la visualisation plus conviviale des résultats.&lt;/p&gt;</description>
    </item>
    <item>
      <title>A New Question Answering Approach with Conceptual Graphs.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.39/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.39/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Avec la disponibilité croissante des bases de connaissances structurées à grandes échelles et des techniques de traitement automatique du langage naturel (TALN) aidées par des techniques avancées de recherche d&amp;rsquo;information (RI), les systèmes de questions-réponses (QR) sont entrés dans une ère de commercialisation. Cependant, les types de questions auxquelles on peut répondre sont un peu limités aux connaissances encyclopédiques qui sont souvent bien structurées sous forme de triplets ou, par ailleurs, localisées dans un segment de texte. Dans cette étude, nous proposons un graphe conceptuel basé sur les structures de questions-réponses (GCQR), qui permet l&amp;rsquo;inférence non-programmée et la représentation des connaissances à base de contexte. Cette approche a été mise en oeuvre avec les techniques TALN pour générer non seulement des graphes conceptuels à partir du texte en question, mais aussi des algorithmes efficaces de correspondance graphique servant comme un mécanisme d&amp;rsquo;inférence, qui est pensé pour répondre à des questions, non seulement classiques mais aussi &amp;lsquo;difficiles&amp;rsquo;.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Construction des profils utilisateurs à base d&#39;une ontologie pour une recherche d&#39;information personnalisée.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.225/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.225/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;information (RI) personnalisée tend principalement à modéliser l&amp;rsquo;utili- sateur selon un profil puis à l&amp;rsquo;intégrer dans la chaîne d&amp;rsquo;accès à l&amp;rsquo;information, afin de mieux ré- pondre à ses besoins spécifiques. Ce papier présente une extension d&amp;rsquo;une approche de construc- tion implicite du profil utilisateur précédemment développée où les centres d&amp;rsquo;intérêts sont re- présentés à base de termes pondérés. L&amp;rsquo;extension de cette approche permet d&amp;rsquo;obtenir une re- présentation sémantique de ces centres à base de concepts pondérés en utilisant l&amp;rsquo;ontologie de l&amp;rsquo;ODP. Nous avons évalué notre approche sur la collection de documents TREC et avons pré- senté quelques résultats expérimentaux mettant en évidence l&amp;rsquo;impact de l&amp;rsquo;intégration du profil utilisateur sur la performance du système.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Estimation du paramètre de collection des modèles d&#39;information pour la RI.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_82/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_82/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous explorons dans cet article plusieurs méthodes permettant, a priori, d&amp;rsquo;estimer le paramètre de collection des modèles d&amp;rsquo;information. Jusqu&amp;rsquo;à présent, ce paramètre a était fixé au nombre moyen de documents dans lesquels un mot donné apparaissait. Nous présentons ici plusieurs méthodes d&amp;rsquo;estimation de ce paramètre et montrons qu&amp;rsquo;il est possible d&amp;rsquo;améliorer les performances du système de recherche d&amp;rsquo;information lorsque ce paramètre est estimé de façon adéquate.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper we explore various methods to estimate the collection parameter of the information based models for ad hoc information retrieval. In previous studies, this parameter was set to the average number of documents where the word under consideration appears. We introduce here a fully formalized estimation method for both the log-logistic and the smoothed power law models that leads to improved versions of these models in IR. Furthermore, we show that the previous setting of the collection parameter of the log-logistic model is a special case of the estimated value proposed here.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Évaluation d&#39;outils de reformulation interactive de requêtes.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.223/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.223/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre de travaux de recherche sur la modélisation de l&amp;rsquo;utilisateur et sur le développement d&amp;rsquo;un système de recherche d&amp;rsquo;information apprenant, nous présentons une nou- velle approche d&amp;rsquo;évaluation d&amp;rsquo;outils de reformulation interactive de requêtes prenant en compte le temps au cours d&amp;rsquo;une session de recherche. En suivant un protocole d&amp;rsquo;expérimentation uti- lisateur adapté, nous montrons que les performances globales d&amp;rsquo;un outil de reformulation de requêtes ne sont pas significatives de ses performances au cours d&amp;rsquo;une session de recherche et varient selon l&amp;rsquo;utilisateur. En conséquence, nous justifions l&amp;rsquo;intérêt de faire collaborer dif- férents modules de suggestions de requêtes et nous proposons de modéliser le comportement de l&amp;rsquo;utilisateur à partir d&amp;rsquo;une analyse fine de ses interactions afin de sélectionner l&amp;rsquo;outil de reformulation de requêtes le plus performant à chaque instant.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extension de requêtes par relations morphologiques acquises automatiquement.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.181/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.181/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;intéresse au problème de la formulation différente d&amp;rsquo;une même idée, d&amp;rsquo;un même concept, en recherche d&amp;rsquo;information à travers la prise en compte du phénomène de la variation morphologique. L&amp;rsquo;approche proposée est une méthode simple de reconnaissance des variantes morphologiques utilisées pour l&amp;rsquo;enrichissement des requêtes au sein d&amp;rsquo;un système de recherche d&amp;rsquo;information (SRI). À l&amp;rsquo;inverse de nombreux travaux déjà réalisés dans ce domaine, la technique proposée présente la particularité de ne nécessiter aucunes ressources ni connais- sances externes, et d&amp;rsquo;être applicable par conséquent à une grande variété de langues. Les éva- luations de cette approche réalisées sur plusieurs collections de documents, sur 6 différentes langues et comparées à différents outils existants (stemmer, lemmatiseur) attestent de l&amp;rsquo;intérêt de la méthode puisqu&amp;rsquo;une amélioration significative des performances des SRI est constatée dans tous les cas.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction d’interactions entre aliment et médicament : Etat de l’art et premiers résultats</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper15/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper15/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;ans cet article, nous nous intéressons à l&amp;rsquo;extraction des interactions entre médicaments et aliments, une tâche qui s&amp;rsquo;apparente à l&amp;rsquo;extraction de relations entre termes dans les textes de spécialité. De nombreuses approches ont été proposées pour extraire des relations à partir de textes : des patrons lexico-syntaxiques, de la classification supervisée, et plus récemment de l&amp;rsquo;apprentissage profond. A partir de cet état de l&amp;rsquo;art, nous présentons une méthode basée sur un apprentissage supervisé et les résultats d&amp;rsquo;une première série d&amp;rsquo;expériences. Malgré le déséquilibre des classes, les résultats sont encourageants. Nous avons ainsi pu identifier les classifieurs les plus performants suivant les étapes. Nous avons également observé l&amp;rsquo;impact important des catégories sémantiques des termes comme descripteurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Identification de personnes dans des flux multimédia.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.76/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.76/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente un système d&amp;rsquo;identification de personnes dans des flux multimédia. Ce système a été engagé dans le défi REPERE, co-organisé par l&amp;rsquo;ANR et la DGA et qui s&amp;rsquo;est terminé en 2014. La tâche principale du défi consistait à identifier des individus apparaissant dans au moins une des modalités portées par la vidéo, qu&amp;rsquo;il s&amp;rsquo;agisse de locuteurs audibles ou de visages visibles à l&amp;rsquo;écran. Un des verrous scientifiques majeurs de cette tâche est lié à la combinaison des modalités audio et vidéo. Cet article présente une stratégie pour la reconnais- sance des personnes basée sur une identification du locuteur reposant sur des descripteurs de haut niveau, modélisant différents aspects de la scène filmée : la transcription et l&amp;rsquo;analyse des textes incrustés, l&amp;rsquo;identification du type de la scène filmée (reportage, plateau, &amp;hellip;), le nombre de personnes présentes, la disposition des caméras&amp;hellip; Nos expériences sur le corpus REPERE montrent l&amp;rsquo;intérêt de l&amp;rsquo;approche proposée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Interactions entre le calcul de collocations et la catégorisation automatique de textes.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.251/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.251/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article d&amp;rsquo;étudier les interactions entre l&amp;rsquo;extraction de collo- cations et la catégorisation automatique de textes. C&amp;rsquo;est-à-dire, dans un premier temps, utiliser la répartition des textes dans les différentes classes afin d&amp;rsquo;extraire des chaînes spécifiques à chacune (calculées par agglutination de collocations) ; puis, dans un second temps, utiliser ces chaînes spécifiques pour améliorer la catégorisation.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper we describe some interactions between collocations and automatic text categorization. First, we use the differents categories to extract strings (through collocations agglutinations) related to each categorie. Then we use these categories-specific strings to im- prove categorization.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle de proximité: Conception et comparaison à une méthode de recherche de passages.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Notre étude se situe dans le domaine de la recherche d&amp;rsquo;informations. Certains mo- dèles classiques comme le modèle vectoriel permettent de classer les documents par ordre de pertinence alors que d&amp;rsquo;autres, qui n&amp;rsquo;offrent pas cette possibilité de classement, possèdent des fonctionnalités particulières comme repérer les documents où les termes de la requête appa- raissent proches les uns des autres. Cette dernière idée ayant conduit à des améliorations des résultats, nous formulons l&amp;rsquo;hypothèse que plus les occurrences des termes d&amp;rsquo;une requête se re- trouvent proches dans un document, plus ce document doit être positionné en tête de la liste de réponses retournées par un système. Par ailleurs, les méthodes de recherche de passages per- mettent de sélectionner les passages répondant à la requête et définissent ainsi une proximité au niveau du passage. Après avoir rappelé les principaux modèles de recherche d&amp;rsquo;informations ainsi que les approches qui traitent de la proximité entre les termes nous présentons notre mo- dèle de proximité qui utilise la logique floue. Nous avons expérimenté notre modèle et nous comparons les résultats obtenus par rapport à ceux d&amp;rsquo;une méthode de recherche de passages.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Prédiction du SRI à utiliser en fonction des critères linguistiques de la requête.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.239/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.239/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;En recherche d&amp;rsquo;information (RI), plusieurs techniques existent et sont utilisées par les systèmes pour répondre de manière efficace aux requêtes des utilisateurs. Nous nous intéressons dans ce papier à comment utiliser les caractéristiques linguistiques des requêtes pour prédire le(s) meilleur(s) système(s) à utiliser pour une requête donnée. Pour ce faire, nous avons utilisé 13 critères linguistiques définis dans (Mothe et al, 2005) pour catégoriser les requêtes de la campagne TREC 3, 5, 6 et 7. Chaque catégorie de requête est ensuite associée à un ou plusieurs systèmes. Les résultats montrent que notre méthode permet d&amp;rsquo;améliorer les performances de la recherche en fonction des campagnes TREC de 2,31% à 6,81% pour la P@15 et jusqu&amp;rsquo;à 16,27% pour la MAP.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Query Expansion by Local Context Analysis.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.13/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.13/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La tâche de notre recherche est de fournir le contexte de recherche à un moteur de&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Query expansion (QE) aims at improving information retrieval (IR) effectiveness by&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information entre des bases de connaissances</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous nous intéresserons à la recommandation de contenus, et plus par- ticulièrement au sein de bases de connaissances. Le sujet de thèse présenté ici se focalise sur la représentation de documents textuels en prenant en compte plusieurs échelles (phrase, para- graphe et document entier) et l&amp;rsquo;exploitation de celle-ci par un système de recommandation, soit au sein de la même base de connaissances, soit entre des bases différentes. Après un détail du corpus considéré pour ces travaux et un état de l&amp;rsquo;art sur les méthodes d&amp;rsquo;embedding actuelles, nous discuterons de l&amp;rsquo;utilité de l&amp;rsquo;exploitation de la structure du graphe du corpus pour la re- présentation, puis des perspectives du sujet et de sa contribution à la recherche d&amp;rsquo;information.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche et filtrage d&#39;information dans des transcriptions de conversations.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.307/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.307/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous nous intéressons dans cet article au problème de l&amp;rsquo;indexation de documents audio de type u conversation téléphonique ». Nous nous interrogeons en particulier sur le bien fondé de l&amp;rsquo;utilisation, pour ce type de documents, des méthodes d&amp;rsquo;indexation classiquement utilisées en recherche d&amp;rsquo;information textuelle. Pour répondre à ces questions, nous revisitons certaines hypothèses de la recherche d&amp;rsquo;information en étudiant la spécificité et l&amp;rsquo;applicabilité de ces hypothèses à des transcriptions de conversations téléphoniques. Nos observations nous conduisent à proposer les bases d&amp;rsquo;un système d&amp;rsquo;indexation pour ce type de documents qui comprend un module de découpage thématique de la conversation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Reclassement d&#39;images par le contenu.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.203/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.203/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une méthode permettant de reclasser les images fournies par un moteur de recherche par mots-clés à l&amp;rsquo;échelle du web et à l&amp;rsquo;état de l&amp;rsquo;art. Cette méthode utilise le contenu visuel des images et elle est basée sur l&amp;rsquo;idée que les images pertinentes doivent être semblables entre elles et que les images non pertinentes doivent être différentes entre elle et des images pertinentes. Cette idée a été implémentée en classant les images en fonction de la distance moyenne de celles-ci avec leurs plus proches voisines. Le reclassement seul selon cette méthode ne fait pas mieux que le classement original du système de recherche mais, combiné à celui-ci, il permet un gain en performance relatif d&amp;rsquo;environ 3% en termes de précision moyenne et d&amp;rsquo;environ 7% si l&amp;rsquo;on considère le complément à 1 de la précision moyenne. Ce gain est statistiquement significatif et il est apporté à un système déjà très performant pour l&amp;rsquo;exploitation de l&amp;rsquo;ensemble des informations textuelles associées aux images.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Semantic Clustering of Social Networks using Points of View.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.175/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.175/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les algorithmes classiques de détection de communautés dans les réseaux sociaux utilisent l&amp;rsquo;information structurelle pour détecter des groupes, i.e la topologie du graphe de relations. Toutefois, ils ne prennent en compte aucune information externe qui peut guider le processus et aider à la réalisation des analyses du réseau selon différentes perspectives. La méthode proposée utilise de façon conjointe, l&amp;rsquo;information sémantique du réseau social, repré- sentée par des points de vue, et son information structurelle. Elle permet la combinaison entre les relations sociales explicites, les arêtes du graphe social, et les relations implicites, dites sémantiques, correspondant par exemple à des intérêts ou des usages similaires.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Techniques d&#39;apprentissage supervisé pour l&#39;extraction d&#39;événements TimeML en anglais et français.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;identification des événements au sein de textes est une tâche d&amp;rsquo;extraction d&amp;rsquo;informations importante et préalable à de nombreuses applications. Au travers des spécifications TimeML et des campagnes TempEval, cette tâche a reçu une attention particulière ces der- nières années, mais aucun résultat de référence n&amp;rsquo;est disponible pour le français. Dans cet article nous tentons de répondre à ce problème en proposant plusieurs systèmes d&amp;rsquo;extraction, en faisant notamment collaborer champs aléatoires conditionnels, modèles de langues et k- plus-proches-voisins. Ces systèmes sont évalués sur le français et confrontés à l&amp;rsquo;état-de-l&amp;rsquo;art sur l&amp;rsquo;anglais. Les très bons résultats obtenus sur les deux langues valident notre approche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Analyse des noms agentifs dans les espaces vectoriels distributionnels</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;otre étude s&amp;rsquo;inscrit dans le cadre d&amp;rsquo;une thèse ayant pour but d&amp;rsquo;exploiter les modèles distributionnels pour décrire sémantiquement des classes de mots définies selon des critères morphologiques. Nous utilisons des indices morphologiques et formels fournis par une base lexicale pour cibler les noms agentifs déverbaux construits par suffixation en-eur. Nous montrons qu&amp;rsquo;il est possible de constituer un représentant prototypique de la classe sémantique des noms agentifs en-eur dans les modèles distributionnels. L&amp;rsquo;étude de ce représentant met en évidence que l&amp;rsquo;information sémantique véhiculée par le suffixe varie en fonction du corpus d&amp;rsquo;étude et du degré de lexicalisation des dérivés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de représentation pour la détection de source dans les réseaux sociaux.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Récemment, divers travaux se sont interessés à la détection de source de diffusion dans les réseaux sociaux : il s&amp;rsquo;agit de déterminer l&amp;rsquo;utilisateur à partir duquel une information propagée a initiallement été émise. Dans cet article, nous proposons une nouvelle méthode pour la détection de source de diffusion, basée sur des techniques d&amp;rsquo;apprentissage de représentation. Plutôt que de s&amp;rsquo;appuyer sur un modèle de diffusion appris a priori pour estimer la source des diffusions observées, l&amp;rsquo;idée est de projeter les utilisateurs du réseau dans un espace de représentation, dans lequel la source de diffusion peut être efficacement extraite en fonction des positions relatives des utilisateurs infectés par l&amp;rsquo;information propagée. Cela permet d&amp;rsquo;établir un modèle de prédiction bien moins sensible au bruit et à l&amp;rsquo;incomplétude des données que les modèles existants, pour un temps de calcul bien plus faible en prédiction. Le modèle proposé a en effet démontré de bonnes performances sur divers jeux de données réels et artificiels.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Audiovisual production invariant searching.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.333/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.333/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche de l&amp;rsquo;information non textuelle est un point fondamental dans l&amp;rsquo;industrie audiovisuelle où les besoins d&amp;rsquo;outils pour manipuler des contenus multimédia sont importants et diversifiés. Dans les documents vidéo, l&amp;rsquo;extraction de signature de style est un procédé extrêmement intéressant, puisqu&amp;rsquo;il fournit une nouvelle caractéristique pour la classification de contenus. Les documents vidéo peuvent avoir des caractéristiques et des propriétés très différentes. Cependant, on peut identifier des points communs à toutes les émissions politiques, ou toutes les retransmissions de matchs de football, ou encore tous les films réalisés par un même réalisateur. Ces points communs sont ce que nous appelons &amp;ldquo;invariants de production&amp;rdquo;. Un invariant de production caractérise un document ou une série de documents appartenant à une même &amp;lsquo;collection&amp;rsquo;, ou tourné par un même réalisateur, ou produit suivant les mêmes directives. Dans ce papier, nous proposons une transcription formelle de ce que nous appelons &amp;lsquo;un invariant de production&amp;rsquo; dans un segment vidéo à travers l&amp;rsquo;étude de l&amp;rsquo;évolution des caractéristiques de bas niveau. Nous proposons un algorithme pour l&amp;rsquo;extraction de segments invariants, applicable sur tout document audiovisuel, indépendamment de la nature des caractéristiques, de leur sens, et du type ou de la durée de l&amp;rsquo;invariant.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification avec style : Une application aux discours gouvernementaux.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une analyse lexicale d&amp;rsquo;un corpus composé des discours sur l&amp;rsquo;état de l&amp;rsquo;Union de 1790 à 2013 pour un total de 223 allocutions écrites par 41 présidents des Etats-Unis. Une classification automatique basée sur la fréquence d&amp;rsquo;occurrences de tous les lemmes indique que la chronologie correspond à un facteur important dans le regroupement des présidents, plus que les affinités de parti. Une attribution d&amp;rsquo;auteur indique que, pour 96% des discours, on détecte le bon président. En cas d&amp;rsquo;erreur, l&amp;rsquo;auteur proposé par la machine appartient très souvent au même parti et dans un espace temporal proche du véritable auteur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Comparaison du modèle vectoriel et de la pondération tf*idf associée avec une méthode de propagation d&#39;activation.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_19/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_19/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;objet de ce papier est de montrer qu&amp;rsquo;il est possible de mettre le modèle vectoriel et la pondération tf&lt;em&gt;idf associée en correspondance avec le calcul d&amp;rsquo;une résonance dans un réseau associatif basé sur une méthode très simple de propagation d&amp;rsquo;activation. Nous décrivons un réseau associatif associant termes et documents puis un calcul de résonance entre une requête et un document dans ce réseau. La pondération tf&lt;/em&gt;idf apparaît naturellement dans le calcul et nous expliquons comment chacun des facteurs s&amp;rsquo;interprète dans la propagation d&amp;rsquo;activation. Nous montrons que ce calcul, comme le cosinus, correspond au produit de l&amp;rsquo;évaluation de la spécificité et de l&amp;rsquo;exhaustivité du document vis-à- vis de la requête. La comparaison expérimentale réalisée sur les corpus CLEF3 et TREC3 révèle que, si l&amp;rsquo;on choisit adéquatement les fonctions qui régissent l&amp;rsquo;activation et la propagation d&amp;rsquo;activation, la méthode basée sur la résonance obtient des performances similaires à celles du modèle Okapi-BM25.&lt;/p&gt;</description>
    </item>
    <item>
      <title>DefAcro : mesure de qualité pour le choix de la définition des acronymes ambigus.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.255/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.255/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente un ensemble de mesures de qualité pour déterminer le choix de la meilleure définition pour un acronyme non défini dans la page Web le contenant. L&amp;rsquo;approche contextuelle que nous proposons utilise des statistiques calculées à partir de pages Web pour déterminer la définition appropriée. Les premiers résultats sont très satisfaisants car la défini- tion pertinente des acronymes est trouvée dans 92 à 98% des cas.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper offers a set of quality measures to determine the choice of the best ex- pansion for an acronym not defined in the Web page that uses it. The contextual approach we promote uses statistics computed on Web pages to determine the appropriate definition. The first results are very satisfactory because the relevant acronym expansion is found in 92 to 98% of the time.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Dimensionalité intrinsèque dans les espaces de représentation des termes et des documents.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.34/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.34/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;examen des propriétés des espaces de représentation des documents ou des mots en RI (typiquement, R navec n très grand) fournit de précieuses indications pour aider la recherche. Récemment, plusieurs travaux ont montré qu&amp;rsquo;il était possible d&amp;rsquo;étudier la dimensionalité réelle des données, appelée dimensionalité intrinsèque, en certains points de ces espaces (Houle et al., 2012a). Dans cet article, nous proposons de revisiter cette notion de dimension intrinsèque sous la forme d&amp;rsquo;un indice noté dans le cas particulier de la RI et d&amp;rsquo;étudier son utilisation pratique en RI. Plus précisément, nous montrons comment son estimation à partir de similarités de type RI, peut être utilisée dans les espaces de représentations des documents et les espaces de représentations de mots (Mikolov et al., 2013 ; Claveau et al., 2014). Ainsi, nous montrons d&amp;rsquo;une part que l&amp;rsquo;indice aide à caractériser les requêtes difficiles ; d&amp;rsquo;autre part, dans une tâche d&amp;rsquo;extension de requête, nous montrons comment cette notion de dimensionalité intrin- sèque appliquée à des mots permet de choisir au mieux les termes à étendre et leurs extensions.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Etude comparative de stratégies de sélection de prédicteurs pour l&#39;attribution d&#39;auteur.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.215/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.215/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;attribution d&amp;rsquo;auteur peut être vue comme une tâche en catégorisation de textes qui&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The authorship attribution problem can be viewed as a categorization problem. To determine the most effective features to discriminate between different writers (or categories), we have evaluated seven feature selection functions (e.g., pointwise mutual information, information gain, odds ratio, !2, or correlation coefficient).  We have also considered two selection functions proposed in the context of authorship attribution.  To compare these approaches, we have selected a newspaper corpus (Glasgow Herald) composed of 5,408 articles written by twenty columnists.  Using the KLD (Zhao &amp;amp; Zobel, 2007) and the Delta (Burrows, 2002) attribution scheme, we found that some simple selection functions tend to produce results comparable to more complex ones.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Etude de l&#39;impact du regroupement automatique de phrases sur un système de résumé multi-documents.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.183/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.183/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous comparons les résultats produits par différentes approches de résumé multi-documents. Nous opposons deux approches classiques à la nôtre qui place la modélisation de la diversité informationnelle du corpus au centre du processus. Nous évaluons également l&amp;rsquo;impact de différentes mesures de similarité entre phrases. Les expériences, menées sur le corpus RPM2, montrent qu&amp;rsquo;un regroupement des phrases en classes sémantiques améliore la qualité des résumés.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper introduces the experiences we led in order to evaluate the impact of a sentence unsupervised clustering algorithm on a multi-document summarization system. We compared this system to two others which implement classic summarization methods. We also evaluated the impact of different sentence similarity measures on the quality of the summaries. The experiences show that a clustering prior to sentence selection does improve the quality of the summaries.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Evaluation de la précision pour un système hypertexte.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.21/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.21/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Certains moteurs de recherche, par exemple Google, utilisent les liens hypertextes dans le processus de sélection des documents en réponse à une requête. Dans ce papier, nous présentons une nouvelle fonction de correspondance qui effectue un classement des réponses à partir d&amp;rsquo;une mesure d&amp;rsquo;appariement entre les mots clés d&amp;rsquo;une requête et le texte ancre associé aux liens hypertextes des pages. Nous avons évalué cette fonction de correspondance par des expérimentations sur la collection TREC-9 et nous concluons que pour certains types de requêtes, notre système fournit de meilleures réponses en terme de précision.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Influence de mesures de densité pour la recherche de passages et l&#39;extraction de réponses dans un système de questions-réponses.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.193/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.193/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous comparons différentes méthodes de filtrage et d&amp;rsquo;extraction d&amp;rsquo;une réponse candidate dans le cadre d&amp;rsquo;un système de questions-réponses. Ces expériences sont effectuées sur un sous-ensemble du corpus de la campagne Technolangue-EQueR, première campagne francophone de questions-réponses utilisant des questions et un corpus en français. Nous évaluons la méthode que nous avions retenue lors de notre participation à cette campagne. Celle-ci est basée sur une densité et une compacité des mots de la question dans le contexte d&amp;rsquo;une réponse candidate, elle est présentée et comparée à deux autres approches : l&amp;rsquo;une utilisant un décompte des mots communs, l&amp;rsquo;autre une similarité de type Cosine. Cela nous permet, également, d&amp;rsquo;envisager l&amp;rsquo;influence de la recherche de passage sur le module final d&amp;rsquo;extraction d&amp;rsquo;une réponse qui utilise cette compacité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Lisibilité et recherche d&#39;information : vers une meilleure accessibilité.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.241/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.241/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons en premier lieu une mesure de la lisibilité adap- tée à des lecteurs dyslexiques en utilisant des caractéristiques issues d&amp;rsquo;une analyse fine des causes des difficultés de lectures rencontrées. Nous proposons ensuite un cadre pour la prise en compte de la lisibilité dans la mesure de pertinence accordée par les systèmes de recherche d&amp;rsquo;informations, qui est généralement calculée sur la seule base de la similarité. Ce cadre part de l&amp;rsquo;hypothèse que les données thématiquement pertinentes existent en nombre suffisant pour qu&amp;rsquo;on choisisse les plus lisibles. On atteint un taux optimal de prise en compte de la lisibilité de 30% en observant l&amp;rsquo;évolution des performances dans le cadre de campagnes d&amp;rsquo;évaluation en recherche documentaire (CLEF) et en résumé (DUC).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Navigation conceptuelle dans une base de connaissances sur l&#39;usage des plantes en santé animale et végétale</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De plus en plus de bases de connaissances sont développées dans le domaine de l&amp;rsquo;envi- ronnement et du vivant. L&amp;rsquo;enjeu de ce travail est de rendre ces connaissances accessibles à des utilisateurs ayant des préoccupations variées. Notre cas d&amp;rsquo;étude concerne une base de connais- sances rassemblant environ 30 000 descriptions d&amp;rsquo;usage de plantes en Afrique, à effet pesticide, antimicrobien et antiparasitaire de synthèse. Dans cet article, nous proposons une architecture de système pour explorer et naviguer dans les connaissances grâce à l&amp;rsquo;analyse de concepts for- mels et proposons un nouvel algorithme faisant émerger un nouveau contexte d&amp;rsquo;emploi d&amp;rsquo;une plante dans un cas d&amp;rsquo;utilisation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ordonnancement d&#39;entités appliqué à la construction de snippets sémantiques.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.69/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.69/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les avancées de l&amp;rsquo;initiative Linked Open Data (LOD) ont permis de mieux structurer le Web des données. En effet, quelques jeux de données servent de centralisateurs (par exemple, DBpedia) et permettent ainsi de maintenir les différentes sources de données du LOD liées entre elles. Ces jeux de données ont également permis le développement de services de détection des entités du Web des données dans une page du Web des documents (par exemple, DBpedia Spot- light). Ainsi, pour permettre l&amp;rsquo;émergence de nouveaux usages qui combineront les deux Webs, nous proposons un algorithme qui ordonne les entités détectées dans une page Web en fonc- tion d&amp;rsquo;une requête exprimant un besoin d&amp;rsquo;information. Nous montrons que cet algorithme est significativement meilleur que les approches de l&amp;rsquo;état de l&amp;rsquo;art. Enfin, nous utilisons cet algo- rithme pour construire un système de génération de snippets sémantiques dont nous montrons expérimentalement l&amp;rsquo;utilité et l&amp;rsquo;utilisabilité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche de passages pertinents dans les fichiers logs par enrichissement de requêtes.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.239/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.239/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de question réponse sont considérés comme la prochaine génération des moteurs de recherche. Notre article s&amp;rsquo;intéresse à la première étape d&amp;rsquo;un tel processus qui consiste à rechercher des passages pertinents possédant des réponses. Une telle tâche peut se révéler difficile en raison de la complexité des données traitées, des fichiers logs dans notre cas. Notre contribution repose sur un double enrichissement de requêtes primitives en utili- sant une méthode d&amp;rsquo;apprentissage fondée sur la notion de &amp;lsquo;monde lexical&amp;rsquo;, des connaissances morpho-syntaxiques et une nouvelle fonction de pondération des termes. Cette fonction ori- ginale a pour objectif d&amp;rsquo;attribuer un poids élevé aux termes susceptibles d&amp;rsquo;être corrélés au contexte de réponse. Les expérimentations menées sur des données réelles montrent que notre protocole d&amp;rsquo;enrichissement des requêtes permet d&amp;rsquo;extraire les passages pertinents par rapport aux questions.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Rôle de la matrice d&#39;information et pondération des composantes dans les noyaux de Fisher pour PLSI.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.267/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.267/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Des similarités entre documents à base de catégories sémantiques latentes et de noyaux de Fisher ont été proposées pour la première fois il y a dix ans par T. Hofmann dans le contexte du &amp;ldquo;Probabilistic Latent Semantic Indexing&amp;rdquo;, puis étendues par Nyffenegger et al. (2006). Le présent article présente une étude approfondie et une révision de ces modèles par (1) une des- cription unifiée et simplifiée, (2) une étude du rôle de la matrice d&amp;rsquo;information de Fisher G (), et (3) une analyse de l&amp;rsquo;impact des paramètres associés aux catégories latentes. Il fournit de plus de nouveaux résultats expérimentaux sur une grande collection de document provenant du corpus d&amp;rsquo;évaluation TRECuAP.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Analyse des inférences pour la fouille d’opinion en chinois</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;a fouille d&amp;rsquo;opinion est une activité essentielle pour la veille économique, facilitée par les réseaux sociaux et forums dédiés. L&amp;rsquo;analyse repose généralement sur des lexiques de sentiments. Pourtant, certaines opinions sont exprimées au moyen d&amp;rsquo;inférences. Dans cet article, nous proposons une classification des inférences utilisées en chinois dans des commentaires touristiques, à des fins de fouille d&amp;rsquo;opinion, selon trois niveaux d&amp;rsquo;analyse (réalisation sémantique, modalité de réalisation, et mode de production). Nous démontrons l&amp;rsquo;intérêt d&amp;rsquo;analyser les différents types d&amp;rsquo;inférence pour déterminer la polarité des opinions exprimées en corpus. Nous présentons également de premiers résultats fondés sur des plongements lexicaux.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Annotation semi-automatique de grandes BD images : Approche par graphes de voisinage.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.205/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.205/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;annotation d&amp;rsquo;images constitue l&amp;rsquo;outil principal pour l&amp;rsquo;association d&amp;rsquo;une sémantique à une image. Dans cet article nous nous intéressons à l&amp;rsquo;annotation semi-automatique d&amp;rsquo;images. En effet, avec la grande masse de données gérées à travers le monde et surtout avec l&amp;rsquo;avènement du web, l&amp;rsquo;annotation manuelle de ces images est pratiquement impossible. Cet article présente un travail préliminaire sur une démarche basée sur les graphes de voisinage. La démarche que nous proposons offre, comme montré dans la section des expérimentations, des résultats d&amp;rsquo;annotation intéressants.&lt;/p&gt;</description>
    </item>
    <item>
      <title>D&#39;une compacité positionnelle à une compacité probabiliste pour un système de Questions / Réponses.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.271/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.271/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons une discussion sur la définition d&amp;rsquo;un score de compacité pour permettre l&amp;rsquo;extraction d&amp;rsquo;une réponse dans un système de Questions/Réponses. Ce score de compacité qui peut être succinctement décrit comme une fonction liée a la densité des termes de la question dans le voisinage d&amp;rsquo;une réponse candidate, est présenté en détail. Ensuite, une discussion nous amène à envisager une extension de ce score, initialement défini d&amp;rsquo;un point de vue positionnel, vers un modèle probabiliste ; cela afin de mieux prendre en compte des critères d&amp;rsquo;importance variable pour les mots de la question. Cette discussion est validée par des expériences où ce critère d&amp;rsquo;importance est modélisé à l&amp;rsquo;aide d&amp;rsquo;un calcul d&amp;rsquo;IDF (u Inverse Document Frequency »), et nous montrons que nous obtenons des résultats similaires à ceux obtenus lors de notre participation à la campagne d&amp;rsquo;évaluation EQueR des systèmes de Questions/Réponses.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Data-to-Text: Vers la génération de texte à partir de données non-linguistiques</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous nous intéressons à la problématique de la génération du langage natu- rel dont l&amp;rsquo;objectif est de transcrire un contexte d&amp;rsquo;entrée vers une description adéquate de ce contexte. Plus particulièrement, nous abordons la problématique du &amp;ldquo;data-to- text&amp;rdquo; qui se focalise sur les descriptions de données non linguistiques, comme les ta- bleaux numériques ou les graphiques. Dans ce papier, nous exposons l&amp;rsquo;état de l&amp;rsquo;art relatif à ce domaine : nous décrivons les mécanismes de base de la traduction neu- ronale automatique (NMT) qui sont les fondements des modèles de génération et les avancées récentes pour le cas particulier du &amp;ldquo;data-to-text&amp;rdquo;. Enfin, nous discutons des nouvelles problématiques dans ce domaine et présentons notre positionnement pour les prochaines recherches de thèse.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection de locuteurs dans les séries TV.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.51/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.51/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La segmentation de flux audio en locuteurs apparaît particulièrement délicate lors- qu&amp;rsquo;elle est appliquée à des films de fiction, où de nombreux personnages parlent dans des conditions acoustiques variables (musique de fond, bruitages, fluctuations dans l&amp;rsquo;intonation&amp;hellip;). Au-delà d&amp;rsquo;une telle variabilité acoustique, ce type de films exhibe cependant de la régularité sur le plan visuel, particulièrement dans les passages dialogués. Nous introduisons dans ce papier une méthode en deux temps pour procéder à la segmentation en locuteurs d&amp;rsquo;épisodes de séries TV : un premier regroupement en locuteurs est effectué localement, dans les limites de scènes visuellement identifiées comme des dialogues ; les locuteurs conjecturés sont ensuite comparés lors d&amp;rsquo;une deuxième phase de regroupement afin de détecter les locuteurs récurrents : cette deuxième étape de regroupement a lieu sous la contrainte que les différents locuteurs impliqués dans un même dialogue soient assignés à des groupes distincts. Les performances obtenues par notre approche sont comparées à celles qu&amp;rsquo;on obtient en appliquant aux mêmes données des outils standards de segmentation en locuteurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Expansion de requêtes par apprentissage.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.25/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.25/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose une approche d&amp;rsquo;expansion automatique de requêtes par appren- tissage. L&amp;rsquo;expansion de requêtes se fait par l&amp;rsquo;ajout de termes provenant de règles d&amp;rsquo;association entre termes. Le problème d&amp;rsquo;expansion de requêtes est modélisé comme un problème de classifi- cation superviséE qui vise à déterminer les règles d&amp;rsquo;association les plus adaptées pour enrichir une requête donnée. Un ensemble de données d&amp;rsquo;entraînement est construit en utilisant un algo- rithme d&amp;rsquo;exploration de règles d&amp;rsquo;association pertinentes, basé sur les algorithmes génétiques. La classification se fait par la méthode de l&amp;rsquo;arbre de décision et par la méthode Random Forest. Les expérimentations sont menées sur la collection de textes en français SDA95 de la campagne d&amp;rsquo;évaluation CLEF 2003. Les résultats montrent une amélioration des performances de la tâche RI&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction de propriétés de produits.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le travail présenté dans cet article vise à extraire automatiquement certaines carac- téristiques de produits à partir de descriptions textuelles fournies par un site marchand. La constitution d&amp;rsquo;un corpus de référence annoté révèle certains problèmes, provenant à la fois des textes et des particularités de la tâche. Pour l&amp;rsquo;aborder, nous avons testé deux approches : une méthode d&amp;rsquo;extraction fondée sur des dictionnaires et une méthode d&amp;rsquo;apprentissage automatique avec les CRF (Champs Aléatoires Conditionnels), pour lesquels nous avons essayé un grand nombre de modèles. Les résultats de nos expériences montrent les avantages et limites de ces deux méthodes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Filtrage de textes dans le but de produire un résumé de documents multiples.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.257/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.257/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre de la conférence d&amp;rsquo;évaluation DUC, nous avons développé un système de résumé automatique de documents multiples qui se base sur l&amp;rsquo;extraction des phrases clés. La méthode proposée utilise un algorithme génétique qui permet de combiner les phrases des documents sources pour former les extraits, qui seront croisés et mutés pour générer de nouveaux extraits. L&amp;rsquo;examen des résultats obtenus dans les deux sessions DUC&#39;04 et DUC&#39;07 a montré un écart significatif au niveau des performances du système développé. En effet, un phénomène de dérive génétique est observé lorsqu&amp;rsquo;on traite, en entrée de notre système, des textes de grande taille. Afin de remédier à cette dérive, nous proposons d&amp;rsquo;intégrer un module supplémentaire de filtrage qui a pour objectif la réduction du nombre des phrases des textes sources en entrée. Ce filtrage est effectué sur la base de la notion de dominance entre phrases qui permet d&amp;rsquo;éliminer un grand nombre de phrases du pool initial.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Identification et structuration hiérarchique des titres dans les documents HTML.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.285/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.285/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons une méthode pour automatiquement identifier et structurer hiérarchiquement les titres dans les documents HTML. Bien que la syntaxe HTML propose des balises de titres, l&amp;rsquo;usage de ces balises dans beaucoup de documents n&amp;rsquo;est pas correct ou ces balises ne sont pas utilisées. Notre méthode se base sur les propriétés visuelles, telles la taille ou la couleur de la police, obtenues grâce aux feuilles de style (CSS). L&amp;rsquo;hypothèse est que plus un élément est visible, plus son niveau dans la hiérarchie des titres est élevé. Nous avons extrait du Web un corpus de CSS que nous utilisons dans l&amp;rsquo;apprentissage d&amp;rsquo;un modèle de Markov caché. Les premiers résultats donnent une F-Mesure de 0,70 pour la structuration des titres et de 0,86 pour l&amp;rsquo;identification.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Langage de recherche d&#39;associations sémantiques à partir d&#39;une base de connaissances.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.255/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.255/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre de l&amp;rsquo;extraction d&amp;rsquo;associations sémantiques (liens complexes/chemins), nous définissons des requêtes d&amp;rsquo;extraction des chemins comme sorte d&amp;rsquo;extraction des relations complexes dans un graphe RDF reliant deux entités spécifiées. Plusieurs besoins d&amp;rsquo;extraction des chemins peuvent être formulés. Néanmoins, les langages d&amp;rsquo;interrogation RDF existants n&amp;rsquo;offrent pas de mécanisme adéquat pour formuler des requêtes destinées à l&amp;rsquo;extraction des chemins. Afin de pallier à cette défaillance, nous proposons un nouveau langage (PmSPARQL) permettant d&amp;rsquo;étendre le langage d&amp;rsquo;interrogation actuel de W3C (SPARQL). Les principaux ob- jectifs de PmSPARQL consistent à inclure des possibilités d&amp;rsquo;extraction d&amp;rsquo;associations séman- tiques et pouvoir les évaluer. Une évaluation des performances de notre approche sur des don- nées du monde réel et synthétiques est également présentée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Méthodologie pour une représentation multi-dimensionnelle des documents.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La représentation des documents et questions en Recherche d&amp;rsquo;Information (RI) est res- tée une représentation majoritairement uni-dimensionnelle (i.e., vecteur). Cette représentation a des limites : Comment par exemple représenter un document qui traite de plusieurs thèmes ou une question ambiguë ? Ces problèmes sont importants pour développer des systèmes de RI interactifs ou cherchant à diversifier les résultats. Les modèles actuels sont soit basés sur des heuristiques, soit sur des modèles latents qui pré-supposent un nombre limité de thèmes pour décrire les documents. L&amp;rsquo;approche basée sur les probabilités dites &amp;ldquo;quantiques&amp;rdquo; permet d&amp;rsquo;établir des bases formelles pour une représentation multi-dimensionnelle des documents (ou plus généralement, des objets d&amp;rsquo;information) qui dépasse les limites évoquées plus haut. Cet article décrit la méthodologie QIA ( Quantum Information Access) pour la représentation des documents, résume les résultats expérimentaux obtenus et décrit les perspectives.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèles de Document Parcimonieux basés sur les annotations et les word embeddings – Application à la personnalisation.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.21/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.21/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons dans cet article des modèles de langues parcimonieux sociaux de documents qui permettent de détecter les termes les plus importants du document et d&amp;rsquo;éliminer les termes communs ou non significatifs. La détection de ces termes est guidée et renforcée par les liens entre les termes du document et ses annotations sociales (tags). En prenant le contre- pied des approches classiques de personnalisation qui généralement s&amp;rsquo;intéressent en priorité aux profils utilisateurs ou à la fonction de correspondance, notre proposition porte sur la mise en avant des termes les plus importants des documents afin de mieux personnaliser les réponses. Les évaluations effectuées sur le corpus Social Book Search 2016 montrent que nos propositions apportent dans certains cas une amélioration aux modèles de l&amp;rsquo;état de l&amp;rsquo;art.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Semantic Clustering using Bag-of-Bag-of-Features.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.229/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.229/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le calcul de distances entre représentations textuelles est au coeur de nombreuses ap- plications du Traitement Automatique des Langues. Les approches standard initiallement déve- loppées pour la recherche d&amp;rsquo;information sont alors le plus souvent utilisées. Dans la plupart des cas, il est donc adopté une description sac-de-mots (ou sac-d&amp;rsquo;attributs) avec des pondérations de type TF-IDF ou des variantes, une représentation vectorielle et des fonctions classiques de similarité comme le cosinus. Dans ce papier, nous nous intéressons à l&amp;rsquo;une de ces tâches, à savoir le clustering sémantique d&amp;rsquo;entités extraites d&amp;rsquo;un corpus. Nous défendons l&amp;rsquo;idée que pour ce type de tâches, il est possible d&amp;rsquo;utiliser des représentations et des mesures de similarités plus adaptées que celles usuellement employées. Plus précisément, nous explorons l&amp;rsquo;utilisation de représentations alternatives des entités appelées sacs-de-vecteurs ou sacs-de-sacs-de-mots. Dans ce modèle, chaque entité est définie non pas par un unique vecteur, mais par un ensemble de vecteurs, chacun de ces vecteurs étant construit à partir d&amp;rsquo;une occurrence de l&amp;rsquo;entité. Pour utiliser cette représentation, nous utilisons et définissons des extensions des mesures classiques du modèle vectoriel (cosinus, Jaccard, produit scalaire&amp;hellip;). Ces différents constituants sont tes- tés sur notre tâche de clustering, et nous montrons que cette représentation en sac-de-vecteurs améliore significativement les résultats par rapport à une approche standard en sac-de-mots.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une approche non supervisée pour le typage et la validation d&#39;une réponse à une question en langage naturel : application à la tâche Entity de TREC 2010.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.191/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.191/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;entités nommées a été le sujet de nombreux travaux en recherche d&amp;rsquo;in- formation. Dans ce papier, nous cherchons à déterminer si une entité est d&amp;rsquo;un type donné, et ce de manière non-supervisée et quel que soit son type. Nous proposons pour cela une approche basée sur l&amp;rsquo;utilisation de modèles de langage estimés à partir du web. De plus, nous souhaitons déterminer si cette nouvelle information peut être utilisée efficacement pour améliorer le clas- sement des réponses (entités) candidates à une question en langue naturelle. Afin d&amp;rsquo;évaluer ces deux points, nous avons participé à la tâche Entity à TREC 2010.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une méthode pour l&#39;évaluation automatique de la difficulté d&#39;une requête.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.39/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.39/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans des applications de recherche documentaire, il est souvent utile d&amp;rsquo;avoir une me- sure de confiance dans l&amp;rsquo;ensemble de document trouvés, afin de pouvoir proposer un traitement spécifique (automatique ou interactif) des requêtes particulièrement difficiles, ou encore sim- plement avertir l&amp;rsquo;utilisateur de la faible fiabilité de l&amp;rsquo;information proposée. Pour cela, nous avons analysé différents indicateurs potentiels de performance de recherche par rapport aux requêtes données. Cet article se concentre sur les scores utilisés par différent types de systèmes de recherche documentaire pour le classement relatif des documents, et leur utilisation comme estimateurs absolus de performance. Nous allons montrer que, malgré une forte variation entre les scores fournis par différents systèmes, un grand nombre de ceux-ci peut effectivement être utilisé pour prédire la précision globale d&amp;rsquo;un ensemble de documents trouvés pour une requête.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers un passage à l&#39;échelle pour un SGBD d&#39;images.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.347/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.347/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Un système de gestion de bases d&amp;rsquo;images doit a priori s&amp;rsquo;appuyer sur un système de gestion de bases de données (SGBD). Dans cet article, nous examinons expérimentalement les limitations des SGBD relationnels. Nous identifions ainsi un certain nombre d’écueils et apportons&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;An image database system should use a database management system (DBMS). In this paper, we experiment relational DBMS limitations for such a purpose. We identify a number of pitfalls and provide some solutions too. Some are still partially supported. However, five key points have been identified so far: reducing the metadata size, introducing some redundant data, taking advantage of parallelism, classifying and distributing metadata, using different indexing schemes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification de Structures Arborescentes : Cas de Documents XML</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.301/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.301/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une méthode de classification structurelle de documents XML. Notre approche consiste d&amp;rsquo;abord à extraire automatiquement la structure arborescente de chaque document XML à classer, et ensuite à utiliser cette structure comme modèle de représentation pour la classification du document XML correspondant. L&amp;rsquo;appariement de ces structures est fondé sur un calcul de leurs similarités. Pour l&amp;rsquo;expérimentation nous avons utilisé un corpus INEX.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper we present a clustering method for XML documents. Our step is two- phase based: we first automatically extract the structure from the document; we then use it as model of representation to classify the document that it represents. The matching of the documents&amp;rsquo; structures is based on the calculation of their similarities. For the experimentation we used the INEX.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification par paires de mention pour la résolution des coréférences en français parlé interactif</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper19/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper19/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;et article présente et analyse les premiers résultats obtenus par notre laboratoire pour la construction d&amp;rsquo;un modèle de résolution des coréférences en français à l&amp;rsquo;aide de techniques de classifications parmi lesquelles les arbres de décision et les séparateurs à vaste marge. Ce système a été entraîné sur le corpus ANCOR et s&amp;rsquo;inspire de travaux antérieurs réalisés au laboratoire LATTICE (système CROC). Nous présentons les expérimentations que nous avons menées pour améliorer le système en passant par des classifieurs spécifiques à chaque type de situation interactive, puis chaque type de relation de coréférence.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Evaluation de la réponse d&#39;un système de question-réponse et de sa justification.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.273/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.273/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de question-réponse fournissent une réponse à une question en l&amp;rsquo;ex- trayant d&amp;rsquo;un ensemble de documents. Avec celle-ci ils fournissent également un passage de texte permettant de la justifier. On peut alors chercher à évaluer si la réponse proposée par un système est correcte et justifiée par le passage. Pour cela, nous nous sommes fondés sur la vérification de différents critères : le premier tient compte de la proportion et du type des termes communs au passage et à la question, le second de la proximité de ces termes par rapport à la réponse, le troisième compare la réponse à considérer avec celle obtenue par le système de question-réponse F RASQUES utilisé sur le passage à juger et le dernier est une vérification du type de la réponse. Les différents critères sont ensuite combinés grâce à un classifieur utilisant les arbres de décision.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Évaluation de modèles de classification automatique appliqués à la détection d&#39;opinions.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.271/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.271/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente et évalue différentes stratégies de classification automatique d&amp;rsquo;opinions.  Ces dernières sont exprimées dans des phrases que le système doit classifier comme renfermant ou non une opinion.  Dans ce but, nous avons retenu une classification basée sur le modèle Naïve Bayes et une autre basée sur des séparateurs à vaste marge (SVM). Comme alternative, nous suggérons un modèle basé sur le vocabulaire spécifique et le calcul d&amp;rsquo;un score normalisé (score Z).  Au moyen de la collection test NCTIR, nos expériences démontrent que notre modèle apporte significativement la meilleure performance et que la représentation par des vocables s&amp;rsquo;avère préférable aux lemmes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Evaluation modulaire d&#39;un système de questions-réponses sur un corpus de questions semi-spontanées.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.287/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.287/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une évaluation séquentielle du système de questions-réponses modulaire et stochastique SQuALIA. L&amp;rsquo;évaluation se fonde sur un corpus de question semi- spontanées obtenu en faisant poser 20 questions de référence à des adultes francophones, non francophones ou dyslexiques. Les expériences montrent que ce sont les fautes d&amp;rsquo;orthographe qui ont le plus d&amp;rsquo;impact sur les modules d&amp;rsquo;analyse. En moyenne le système parvient à ne trouver des réponses qu&amp;rsquo;à 60% des questions posées, ce qui conduit à imaginer l&amp;rsquo;intégration d&amp;rsquo;un correc- teur orthographique en amont des systèmes, plus de souplesse dans l&amp;rsquo;analyse, et la conservation de l&amp;rsquo;incertitude tout au long du processus en le formalisant à l&amp;rsquo;aide d&amp;rsquo;un modèle probabiliste.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Influence des lexiques d’émotions et de sentiments sur l’analyse des sentiments</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les consommateurs ont l&amp;rsquo;habitude de consulter les critiques postées sur internet avant d&amp;rsquo;acheter un produit. Mais, il est difficile pour le consommateur de connaître l&amp;rsquo;opinion globale du produit vu le nombre important de ces critiques. L&amp;rsquo;analyse des sentiments permet de détecter la polarité (positive, négative ou neutre) sur une opinion exprimée et donc de classer ces critiques. Notre but est de déterminer l&amp;rsquo;influence de l&amp;rsquo;expression des émotions sur l&amp;rsquo;analyse de la polarité des critiques de livres. Nous définissons des modèles de représentation &amp;ldquo;sac de mots&amp;rdquo; de critiques qui s&amp;rsquo;appuient sur un lexique contenant des mots porteurs de sentiments (positif, négatif) et d&amp;rsquo;émotions (anticipation, tristesse, peur, colère, joie, surprise, confiance, dégoût). Ce lexique permet de mesurer les types d&amp;rsquo;émotions ressenties par les lecteurs. L&amp;rsquo;apprentissage supervisé mis en oeuvre est de type forêt aléatoire (Random Forest). L&amp;rsquo;application concerne des critiques de la plateforme Amazon.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Interprétation linguistique de requêtes pour un moteur de questions réponses grand public.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.207/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.207/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit l&amp;rsquo;utilisation d&amp;rsquo;une plateforme de traitement automatique des langues naturelles pour le développement d&amp;rsquo;une fonction de réponses à des questions dans un moteur de recherche. Cette plateforme est utilisée pour faire une interprétation linguistique des re- quêtes. L&amp;rsquo;intérêt de cette approche est triple. Premièrement elle permet d&amp;rsquo;identifier uniquement les requêtes qui correspondent à des questions factuelles pour lesquelles le moteur a une ré- ponse précise. Deuxièmement, elle reconnait ces questions quelque soit leur forme linguistique y compris avec des erreurs. Troisièmement, elle désambiguïse certains mots de la requête. Une évaluation a pu montré que l&amp;rsquo;interprétation linguistique de la requête a permis la production d&amp;rsquo;une réponse à environ quatre fois plus de requêtes avec un taux de précision supérieur à 98% par rapport à une approche plus classique d&amp;rsquo;indexation de requêtes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Lecture Séquentielle de Documents pour la Classification.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.245/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.245/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons un nouveau modèle de lecture séquentielle permettant la classification automatique de documents textuels. Il est basé sur la modélisation d&amp;rsquo;un agent qui lit un docu- ment phrases après phrases et qui peut à tout moment décider d&amp;rsquo;associer un document à une ou plusieurs catégories données. L&amp;rsquo;algorithme proposé se base sur une formalisation de la classi- fication de texte en tant que Processus de Décision Markovien, et un apprentissage du modèle par des techniques de renforcement. Des experiences effectuées sur quatre corpus classiques du domaine montrent que l&amp;rsquo;approche proposée atteint des performances équivalentes à un SVM tout en lisant (en moyenne) que quelques phrases de chaque document.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle Neuronal de Recherche d’Information Augmenté par une Ressource Sémantique.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De nombreux travaux en recherche d&amp;rsquo;information (RI) ont montré l&amp;rsquo;apport de la sémantique des mots pour améliorer l&amp;rsquo;appariement de document-requête. D&amp;rsquo;une part, la sémantique symbolique dérivée de ressources externes permet de représenter des entités et leurs relations explicites. D&amp;rsquo;autre part, la sémantique distributionnelle inférée des corpus permet de représenter les relations sémantiques implicites d&amp;rsquo;un corpus. Dans cet article, nous proposons de combiner ces deux types de représentations sémantiques. Ainsi, nous présentons un modèle neuronal pour la RI ad-hoc qui exploite les représentations sémantiques latentes des documents et des requêtes en bénéficiant des concepts et des relations exprimés au sein d&amp;rsquo;une ressource externe. Les évaluations sur deux jeux de données prouvent l&amp;rsquo;efficacité de notre modèle par rapport aux modèles neuronaux profonds d&amp;rsquo;appariement de l&amp;rsquo;état de l&amp;rsquo;art.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèles de langue appliqués à la recherche d&#39;information contextuelle.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.213/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.213/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Il est reconnu que le contexte joue un rôle important en recherche d&amp;rsquo;information (RI). Or, très peu de systèmes opérationnels le considèrent. Dans cet article, nous considérons un des aspects du contexte u le domaine d&amp;rsquo;intérêt de l&amp;rsquo;usager. Nous caractérisons un domaine d&amp;rsquo;intérêt par un ensemble de documents. Nous utilisons une approche de modélisation de langue statistique pour établir un modèle de langue du domaine. Ce modèle est utilisé de trois façons : pour étendre la requête initiale, pour réordonner les documents retrouvés, et pour exploiter les relations lexicales spécifiques au domaine. Nos expériences montrent que nos modèles, qui tiennent compte du contexte, surpassent en performance le modèle traditionnel. Ces expérimentations montrent que le contexte doit être pris en compte si on veut améliorer la performance des systèmes de RI actuels.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèles de langue pour la mise à jour d&#39;un profil d&#39;entité.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-12/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-12/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous souhaitons renvoyer à partir de documents issus du Web, ceux apportant des informations nouvelles sur une entité donnée. Ces documents peuvent ainsi servir à mettre à jour un profil existant (par exemple une page Wikipedia) de cette entité. Notre approche se base initialement sur un appariement des mentions de l&amp;rsquo;entité afin de renvoyer un premier ensemble de documents pertinents, puis s&amp;rsquo;appuie sur des modèles de langue estimés à partir de différentes unités d&amp;rsquo;information. Nous avons évalué notre approche dans le cadre de la tâche &amp;ldquo;Cumulative Citation Recommendation&amp;rdquo; de TREC KBA 2013. Les résultats montrent l&amp;rsquo;intérêt des modèles de langue par rapport aux méthodes de l&amp;rsquo;état de l&amp;rsquo;art, et que la vitalité est mieux estimée en considérant tout le contenu des documents mentionnant l&amp;rsquo;entité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Query by Example for Symbolic Still Image Retrieval.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.363/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.363/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit et défini l&amp;rsquo;utilisation de requêtes par l&amp;rsquo;exemple (QBE) dans le cadre de recherche symbolique d&amp;rsquo;images photographiques. La nouveauté de cette approche consiste en l&amp;rsquo;utilisation conjointe d&amp;rsquo;indexation symbolique automatique et d&amp;rsquo;un formalisme de représentation de connaissances pour représenter le contenu des images. De plus, le mécanisme d&amp;rsquo;abstraction perm la recherche d&amp;rsquo;images par l&amp;rsquo;exemple et le bouclage de pertinence basés sur la représentation symbolique des images, et pas sur leur description signal de bas niveau. Nous montrons sur deux collections d&amp;rsquo;images d&amp;rsquo;un total de plus de 1100 photographies que la recherche par l&amp;rsquo;exemple fournit des résultats comparables à ceux par symboles en terme de mesures de rappel-précision.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Tied Spatial Transformer Networks for Character Recognition.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une nouvelle approche appliquée aux réseaux de neurones convolutionnels&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper reports a new approach applied to convolutional neural networks (CNNs),&lt;/p&gt;</description>
    </item>
    <item>
      <title>Translating Chinese Romanized Name into Chinese Idiographic Characters via Corpus and Web Validation.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.1/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La performance en recherche d&amp;rsquo;information translingue dépend de la qualité des ressources de traduction utilisées pour passer de la langue source (requête d&amp;rsquo;utilisateur) vers la langue cible des documents. Les listes de traduction de noms de personnes sont rares, et constituent en même temps des ressources essentielles pour la recherche d&amp;rsquo;information translingue entre des langues utilisant des jeux de caractères différents. Les dictionnaires de traduction d&amp;rsquo;entités nommées peuvent être extraits des corpus bilingues avec un certain succès, mais le problème du recouvrement de ces corpus bilingues, rares, reste présent. Dans cet article, nous présentons une technique pour retrouver la translittération en chinois de tous les noms chinois écrits en anglais. Notre système effectue la translittération du Pinyin (la romanisation standard du chinois) en caractères chinois via des validations effectuée sur corpus et sur le Web. Bien que les noms de famille en chinois constituent un ensemble peu important, les variétés des prénoms multi-syllabiques sont très importantes. Le traitement s&amp;rsquo;avère d&amp;rsquo;autant plus compliqué qu&amp;rsquo;à une translittération du Pinyin peut correspondre jusqu&amp;rsquo;à plus de cent caractères chinois différents. Notre méthode sélectionne la meilleure traduction des noms chinois écrits en Pinyin en filtrant les traductions impossibles et en utilisant un&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilité et perception de la diversité dans les systèmes de recommandation.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_47/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_47/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De récentes études ont montré que la diversité dans les systèmes de recommandation est positivement corrélée à la satisfaction des utilisateurs et renforce/facilite leur choix d&amp;rsquo;un item (Castagnos et al., 2010). Si l&amp;rsquo;impact de cette nouvelle dimension a été mesuré, les raisons d&amp;rsquo;un tel succès restent cependant encore inexpliquées. Forts de ce constat, notre objectif est d&amp;rsquo;analyser plus finement l&amp;rsquo;utilité réelle et perçue de la diversité dans les systèmes de recomman- dation. Dans cette optique, nous avons réalisé une étude auprès de 250 utilisateurs permettant de comparer 5 approches (mêlant filtrage collaboratif, filtrage par contenu et popularité) avec différents degrés de diversité. Les résultats montrent que la diversité dans les recommandations est perçue par les utilisateurs et améliore leur satisfaction, même si elle suscite parfois mé- fiance ou incompréhension. En outre, cette étude a mis en lumière la nécessité de constituer des modèles de préférences suffisamment divers pour générer de bonnes recommandations.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers une annotation sémantique des images web fondée sur des patrons RDF.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.66/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.66/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le but de cet article est de proposer une nouvelle méthode d&amp;rsquo;annotation sémantique d&amp;rsquo;images en RDF utilisant les facteurs contextuels de l&amp;rsquo;image. L&amp;rsquo;idée de base consiste tout d&amp;rsquo;abord à préparer différents patrons d&amp;rsquo;annotation RDF en utilisant une collection et une on- tologie de domaine, puis à projeter les documents de collection sur ces patrons vides afin de les instancier, et enfin à utiliser une mesure permettant d&amp;rsquo;ordonner les patrons du plus repré- sentatif au moins représentatif. Les expérimentations ont été réalisées sur une collection de 10 documents contenant des images dans le domaine du cinéma. Les résultats préliminaires obte- nus montrent l&amp;rsquo;intérêt de notre proposition ce qui nous encourage à augmenter l&amp;rsquo;échelle de nos expérimentations pour des travaux futurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>An Integrated Approach for Context-Aware Query Recommendation in Folksonomies.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_92/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_92/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;essor des sites collaboratifs sur Internet a permis la naissance de nouvelles formes d&amp;rsquo;indexations des contenus du Web, créées librement par les usagers et partagées au sein de réseaux sociaux, baptisées sous le nom de folksonomie. Considérées comme source de don- nées, ces dernières s&amp;rsquo;avèrent d&amp;rsquo;un grand intérêt pour la Recherche d&amp;rsquo;Information. Cependant, la démarche de recherche dans les folksonomies diffère des stratégies de recherche de la traditionnelle médiation des moteurs de recherche dans la mesure où elle ne prend pas en considéra- tion l&amp;rsquo;aspect social et comportemental des usagers. Ainsi, afin d&amp;rsquo;assister les usagers et de leur permettre l&amp;rsquo;accès le plus pertinent à l&amp;rsquo;information, nous proposons une approche basée sur le couplage des Modèles de Markov Cachés (MMC) et des concepts triadiques pour la prédiction des intentions de recherches dans les folksonomies. Les résultats obtenus sur une folksonomie réelle s&amp;rsquo;avèrent prometteurs et ouvrent de nombreuses perspectives&lt;/p&gt;</description>
    </item>
    <item>
      <title>Building a Knowledge Base Using Microblogs: the Case of Festivals and Location-Based Events.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les médias sociaux comme twitter sont très utilisés lors d&amp;rsquo;un évènement (conférence, catastrophe, évènement culturel&amp;hellip;) pour collaborativement commenter ou donner des avis sur son déroulement. Les utilisateurs du réseau social sont alors avertis via les personnes qu&amp;rsquo;ils suivent ou en recherchant les tweets portant sur l&amp;rsquo;évènement. Cependant compte tenu de la taille d&amp;rsquo;un tweet, l&amp;rsquo;information obtenue par un seul post est souvent très partielle. L&amp;rsquo;utilisation d&amp;rsquo;un ensemble de tweets sur un évènement peut permettre d&amp;rsquo;avoir une vue plus complète en combinant toutes les informations postées. Dans cet article, nous proposons un modèle de re- présentation d&amp;rsquo;une collection de microblogs basé sur une ontologie de domaine. Nous indiquons également comment populer cette ontologie en se basant à la fois sur la collection de tweets mais également sur des collections externes. Nous appliquons notre modèle au cas des tweets sur les festivals (collection issue du challenge CLEF 2016) et montrons comment il pourra être utilisé pour faire des recommendations.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification de documents combinant la structure et le contenu.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.261/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.261/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La démocratisation et l&amp;rsquo;évolution des logiciels de traitements de texte ont révolutionné le monde du document. Les auteurs construisent des documents dits structurés c&amp;rsquo;est-à-dire dont le contenu textuel s&amp;rsquo;organise autours de balises. Toutefois, la classification traditionnelle de documents n&amp;rsquo;utilise que le contenu textuel des documents et ignore les informations de structure. Dans ce papier, nous proposons une nouvelle représentation des documents structurés basée sur un vecteur pondéré associant un mot et une balise. Les poids sont calculés en adaptant les formules TF-IDF et TF-IEF. Cette représentation est construite à partir d&amp;rsquo;une représentation synthétique du document appelé arbre résumé. Pour évaluer notre approche, nous avons mené plusieurs expérimentations avec un système de classification basé sur le classifieur SVM light . Nous présentons les résultats de nos expérimentations menées sur les corpus REUTERS et INEX.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Construction de patrons lexico-syntaxiques d’extraction pour l’acquisition de connaissances à partir du web</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;et article présente une méthode permettant de collecter sur le web des informations complémentaires à une information prédéfinie, afin de remplir une base de connaissances. Notre méthode utilise des patrons lexico-syntaxiques, servant à la fois de requêtes de recherche et de patrons d&amp;rsquo;extraction permettant l&amp;rsquo;analyse de documents non structurés. Pour ce faire, il nous a fallu définir au préalable les critères pertinents issus des analyses dans l&amp;rsquo;objectif de faciliter la découverte de nouvelles valeurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Définition d&#39;un profil multidimensionnel de l&#39;utilisateur : Vers une technique basée sur l&#39;interaction entre dimensions.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.225/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.225/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La personnalisation d&amp;rsquo;un processus d&amp;rsquo;accès à l&amp;rsquo;information a pour objectif de délivrer à l&amp;rsquo;utilisateur une information appropriée à ses préférences, ses centres d&amp;rsquo;intérêts ou plus globalement son profil. Ce papier présente une technique de construction du profil de l&amp;rsquo;uti- lisateur qui s&amp;rsquo;inscrit dans une approche statistique utilisant le comportement de l&amp;rsquo;utilisateur comme source permettant de prédire implicitement son modèle. Cette technique s&amp;rsquo;articule plus particulièrement sur l&amp;rsquo;interaction entre dimensions du profil représentées par l&amp;rsquo;historique des recherches et centres d&amp;rsquo;intérêt de l&amp;rsquo;utilisateur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Enrichissement d&#39;ontologie par une base générique minimale de règles associatives - application aux maladies neurologies : les dystonies.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.289/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.289/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons d&amp;rsquo;utiliser une base générique minimale de règles as- sociatives entre termes (RA), afin d&amp;rsquo;enrichir automatiquement une ontologie de domaine exis- tante. Initialement, des RA non redondantes entre termes sont extraites à partir d&amp;rsquo;un corpus du domaine. Ensuite, le rapprochement des termes candidats est effectué grâce à la mise en cor- respondance entre les concepts de l&amp;rsquo;ontologie initiale et les prémisses des RA, moyennant trois mesures de distance que nous définissons. Les premiers résultats obtenus sur une ontologie du domaine propre à la maladie des dystonies s&amp;rsquo;avèrent encourageants.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Exploitation de syntagmes dans la découverte de thèmes</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_14/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.rjcri_2019_paper_14/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le but de cet article est d&amp;rsquo;étudier l&amp;rsquo;apport des syntagmes nominaux, verbaux et ad- jectivaux pour la découverte de thèmes ( topic modeling). Nous testons l&amp;rsquo;hypothèse qu&amp;rsquo;ajouter des syntagmes à la représentation des documents&amp;ndash; pour lesquels ne sont traditionnellement considérés que les mots simples&amp;ndash; permettrait d&amp;rsquo;améliorer la qualité d&amp;rsquo;un modèle de thèmes, en l&amp;rsquo;occurrence LDA. Des différences significatives sont attendues notamment lorsque plusieurs thèmes partagent le même vocabulaire. Nous présentons des résultats sur un corpus catégorisé de 20 000 résumés d&amp;rsquo;articles scientifiques. Il s&amp;rsquo;agit d&amp;rsquo;une étude de cas qu&amp;rsquo;il conviendrait de reproduire sur un corpus plus conséquent.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Identification d&#39;erreurs de traduction dans un dictionnaire de recherche d&#39;informations translingue et traduction de mots composés à l&#39;aide du World Wide Web.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.30/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.30/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;informations translingue sur des textes non parallèles nécessite une phase de traduction entre une requête dans une langue source et un document dans une langue cible. Afin d&amp;rsquo;obtenir les mêmes performances que dans le cas d&amp;rsquo;une requête monolingue sur un document dans la même langue que cette requête, il est nécessaire de trouver les bonnes traductions pour tous les termes de la requête en langue source. Malheureusement, les dictionnaires de traduction disponibles ne contiennent pas les traduc- tions exactes d&amp;rsquo;un grand nombre de mots composés qui peuvent être présents dans une requête. Les systèmes de recherche translingues utilisent des dictionnaires de traduction construits sta- tistiquement ou manuellement. Afin de traduire un mot composé, beaucoup de ces systèmes gé- nèrent toutes les traductions possibles mot à mot et vérifient la présence de ces traductions dans la base de donnée cible. La qualité de la recherche augmente lorsque il est possible d&amp;rsquo;utiliser des traductions de mots composés préalablement validées. Il reste cependant deux problèmes encore non résolus avec cette méthode consistant à générer et à valider toutes les traductions : (1) Si la traduction exacte d&amp;rsquo;un élément d&amp;rsquo;un mot composé ne figure pas dans le dictionnaire de traduction, la traduction qui sera validée par cette mé- thode ne sera pas la meilleure traduction. (2) Si la bonne traduction ne comprend pas le même nombre d&amp;rsquo;éléments que le mot composé source, la meilleure traduction ne sera pas non plus générée. Dans cet article, nous proposons deux méthodes pour identifier ces situations.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modélisation de l&#39;extraction des descripteurs visuels - Intégration de relations topologiques.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.215/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.215/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Malgré son rôle majeur dans l&amp;rsquo;annotation automatique, le processus d&amp;rsquo;extraction des descripteurs visuels n&amp;rsquo;est pas encore explicitement modélisé, et la contribution de chacune de ces étapes sur la qualité de l&amp;rsquo;annotation n&amp;rsquo;est pas suffisamment étudiée. Dans cet article, nous proposons un modèle (appelé phrasage) pour l&amp;rsquo;extraction des descripteurs visuels. Afin de construire des descripteurs plus riches, nous définissons, à partir de ce modèle, la prise en compte de relations topologiques entre régions d&amp;rsquo;intérêt via une nouvelle technique de regroupement. Des expérimentations sur le corpus VOC2009 montrent que notre approche améliore significativement les résultats de l&amp;rsquo;annotation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Passé, présent, futurs : induction de carrières professionnelles à partir de CV.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;extraction, la structuration et l&amp;rsquo;exploitation d&amp;rsquo;informations à partir de données textuelles brutes est une tâche complexe. L&amp;rsquo;apprentissage de représentation permet de dépasser la barrière syntaxique que représente le codage textuel et d&amp;rsquo;encoder les informations selon des règles définies. Les dernières avancées en apprentissage statistique ont permis d&amp;rsquo;améliorer considérablement l&amp;rsquo;analyse sémantique des textes. Dorénavant, le principal verrou technolo- gique se déplace vers le raisonnement afin d&amp;rsquo;extrapoler des connaissances non-explicites. Dans cet article, nous nous intéressons à l&amp;rsquo;apprentissage d&amp;rsquo;un espace latent sur un large corpus de CV pour l&amp;rsquo;induction de carrières professionnelles. Nous proposons d&amp;rsquo;abord un modèle de nor- malisation sémantique basé sur une architecture encodeur/décodeur pour réduire la diversité de dénomination des métiers puis nous développons des opérateurs de raisonnement pour mo- déliser la hiérarchie dans les organigrammes d&amp;rsquo;entreprises et prédire les enchaînements de postes dans les CV.&lt;/p&gt;</description>
    </item>
    <item>
      <title>SC-LSH: Une Méthode d&#39;Indexation pour une Recherche de Similarité Approximative dans l&#39;Espace Multidimensionnel.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.47/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.47/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Locality Sensitive Hashing (LSH) est l&amp;rsquo;une des techniques les plus prometteuses pour la résolution des problèmes de la recherche des plus proches voisins dans l&amp;rsquo;espace de grande dimension. Euclidien Exact LSH (E2LSH) est la variante la plus populaire du LSH qui a été appliquée avec succès dans de nombreuses applications multimédia. Toutefois, l&amp;rsquo;E2LSH présente des limitations qui affectent les performances de recherche. La principale limitation de l&amp;rsquo;E2LSH est l&amp;rsquo;espace mémoire important utilisé. Afin de parvenir à une bonne qualité de recherche, un grand nombre de tables de hachage est nécessaire. Ce papier propose un nouvel algorithme de hachage pour remédier au problème d&amp;rsquo;espace de stockage, tout en conservant la bonne qualité de recherche et un meilleur temps de calcul. Les résultats expérimentaux obtenus sur une base de données réelle à grand échelle montrent l&amp;rsquo;intérêt de notre approche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Séparation imprimé-manuscrit par étude de la linéarité et de la régularité du texte.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-13/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-13/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le but de cet article est de proposer une méthode pour la séparation entre manuscrit et imprimé dans des documents. La méthode proposée repose sur des descripteurs originaux appartenant&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper, we address the issue of separating handwriting from printed text in doc- ument images. We present a reliable method based on a novel set of features belonging to two different categories, linearity and regularity, invariant to translation and scaling. Specifically, a linearity measure derived from the histogram of segment lengths is introduced. The resulting framework is independant of the document layout, supports any latin langage used and provides a computationally efficient technique. Its performances, assessed on real documents, allow a recognition rate that exceeds 90%.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Traduction automatique de termes biomédicaux pour la recherche d&#39;information interlingue.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.303/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.303/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s&amp;rsquo;appuie sur une technique originale d&amp;rsquo;apprentissage supervisé de règles de réécriture et sur l&amp;rsquo;utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à desti- nation de n&amp;rsquo;importe quelle langue pourvu que leurs différences soient suffisamment régulières pour être apprises. Cette méthode de traduction est appliquée et évaluée sur une tâche de RI interlingue dans le domaine biomédical avec des requêtes dans différentes langues (français, espagnol, portugais, russe, italien); les bons résultats obtenus démontrent l&amp;rsquo;intérêt de cette ap- proche automatique pour la recherche d&amp;rsquo;information.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une méthode contextuelle d&#39;extension de requête avec des groupements de mots pour le résumé automatique.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.289/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.289/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous décrivons les différentes étapes de construction du système de&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper describes the different steps which lead to the construction of the LIP6 extractive summarizer. The basic idea behind this system is to expand question and title key- words of each topic with their respective cluster terms. Term clusters are found by unsupervised learning using a classification variant of the well-known EM algorithm. Each sentence is then characterized by 4 features, each of which uses bag-of-words similarities between expanded topic title or questions and the current sentence. A final score of the sentences is found by man- ually tuning the weights of a linear combination of these features ; these weights are chosen in order to maximize the Rouge-2 AvF measure on the Duc 2006 corpus.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation des liens entre documents structurés pour la recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.319/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.319/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article une approche pour rechercher des documents structurés qui intègre les liens existants entre les parties de documents ainsi que la composition structurelle des documents. Les liens entre les parties de documents sont caractérisés par des notions d&amp;rsquo;exhaustivité et de spécificité relatives, utilisées pour définir la valeur de pertinence des parties de documents. Nous proposons une approche par fonction de correspondance stratifiée pour utiliser ces éléments lors de la recherche de documents. Les expérimentations reportées ici portent sur le corpus de la compétition INEX 2008. Nos résultats sur la campagne d&amp;rsquo;évaluation nous placent en cinquième position sur 61 résultats officiels pour la tâche de recherche focalisée (Focused).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Algorithme de recherche approximative dans un dictionnaire fondé sur une distance d&#39;édition définie par blocs.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.54/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.54/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons un algorithme de recherche approximative de chaînes dans un dic- tionnaire à partir de formes altérées. Cet algorithme est fondé sur une fonction de divergence entre chaînes&amp;ndash; une sorte de distance d&amp;rsquo;édition: il recherche des entrées pour lesquelles la distance à la chaîne cherchée est inférieure à un certain seuil. La fonction utilisée n&amp;rsquo;est pas la distance d&amp;rsquo;édition classique (distance DL); elle est adaptée à un corpus, et se fonde sur la prise en compte de coûts d&amp;rsquo;altération élémentaires définis non pas sur des caractères, mais sur des sous-chaînes (des blocs de caractères).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Analyse formelle d’exigences en langue naturelle pour la conception de systèmes cyber-physiques</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;et article explore la construction de représentations formelles d&amp;rsquo;énoncés en langue naturelle. Le passage d&amp;rsquo;un langage naturel à une représentation logique est réalisé avec un formalisme grammatical, reliant l&amp;rsquo;analyse syntaxique de l&amp;rsquo;énoncé à une représentation sémantique. Nous ciblons l&amp;rsquo;aspect comportemental des cahiers des charges pour les systèmes cyber-physiques, c&amp;rsquo;est-à-dire tout type de systèmes dans lesquels des composants logiciels interagissent étroitement avec un environnement physique. Dans ce cadre, l&amp;rsquo;enjeu serait d&amp;rsquo;apporter une aide au concepteur. Il s&amp;rsquo;agit de permettre de simuler et vérifier, par des méthodes automatiques ou assistées, des cahiers des charges &amp;ldquo;systèmes&amp;rdquo; ex- primés en langue naturelle. Cet article présente des solutions existantes qui pourraient être combinées en vue de la résolution de la problématique exposée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage Actif avec une Méthode de Réordonnancement pour l&#39;Indexation et la Recherche de Vidéos.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.231/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.231/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche de vidéos peut être faite en ordonnant les échantillons en fonction de scores de probabilité produits par des classifieurs. Il est souvent possible d&amp;rsquo;améliorer la per- formance des systèmes par un réordonnancement de ces échantillons. Dans cet article, nous proposons une telle méthode et nous proposons également la combinaison de cette méthode avec un apprentissage actif pour l&amp;rsquo;indexation de vidéos. Les résultats expérimentaux montrent que la méthode de réordonnancement proposée a été en mesure d&amp;rsquo;améliorer la performance du système avec une augmentation d&amp;rsquo;environ 16-22% du score en moyenne sur la tâche d&amp;rsquo;indexa- tion sémantique en TRECVID 2010. En outre, elle a amélioré la performance du système d&amp;rsquo;in- dexation des vidéos par apprentissage actif, en considérant l&amp;rsquo;aire sous la courbe (AUC) comme mesure d&amp;rsquo;évaluation de la performance de l&amp;rsquo;apprentissage actif. Notre méthode de réordonnan- cement améliore la performance d&amp;rsquo;environ 20% en moyenne sur la collection TRECVID 2007.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Diversité de recommandations - Application à une plateforme de blogs et évaluation.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_39/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_39/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de recommandations (SR) ont pour objectif de proposer automatiquement à l&amp;rsquo;usager des objets en relation avec ses intérêts. Dans le contexte de la recherche documen- taire, les intérêts de l&amp;rsquo;usager peuvent être modélisés à partir des contenus des documents visités ou des actions réalisées. Pour tendre vers des recommandations plus pertinentes, nous propo- sons un modèle de SR qui construit une liste de recommandations répondant à un large spectre d&amp;rsquo;intérêts potentiels. L&amp;rsquo;orignialité de notre modèle est qu&amp;rsquo;il repose sur la notion de diversité, obtenue en agrégeant différentes mesures d&amp;rsquo;intérêt pour construire la liste de recommandations finale. Nous définissons également un protocole permettant d&amp;rsquo;évaluer l&amp;rsquo;intérêt de ces recom- mandations. Nous présentons enfin les résultats obtenus par notre SR basé sur la diversité dans le cadre de la recommandation de billets de blogs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction de zones informatives dans des images de formulaire en couleur.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-14/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-14/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons, dans cet article, une approche permettant de localiser des zones informatives dans des documents couleur, par extraction de zones rectangulaires de couleur homogène. L&amp;rsquo;objectif de ce travail est d&amp;rsquo;obtenir des ancres pour le répérage et l&amp;rsquo;extraction d&amp;rsquo;information textuelle. L&amp;rsquo;approche proposée repose sur trois étapes. La première consiste à procéder à un filtrage de bruit, tout en évitant de créer de nouvelles couleurs ou de causer des distortions des contours. Ensuite, une quantificiation de couleur est réalisée, en combinant des plans de différents espaces couleurs, pour détecter les régions homogènes dans une im- age. Enfin, nous détectons les composantes connexes répondant à un critère de rectangularité. L&amp;rsquo;approche est évaluée sur 134 images de document, avec des métriques de la littérature. Nous montrons dans les résultats l&amp;rsquo;importance du choix des plans de couleur utilisés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Feature Selection in Sentiment Analysis.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.273/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.273/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cette communication, nous proposons une nouvelle méthode pour la sélection des termes et la classification automatique de sentiments.  Pour déterminer les caractéristiques les plus adéquates d&amp;rsquo;une catégorie, nous nous appuyons sur le score Z. Cette mesure nous permet de définir les termes pertinents et, recourant à la mesure du gain d&amp;rsquo;information, nous pouvons également évaluer les termes dans le voisinage des termes pertinents.  Sur ces deux éléments, nous proposons un nouveau modèle de classification. Notre modèle a été évalué en recourant à deux collections tests et sur la base de plusieurs représentations.  La performance de notre modèle (validation croisée) s&amp;rsquo;avère égale voire supérieure à des approches connues basées sur le modèle SVM ou Naïve Bayes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Impact précoce du poids des balises pour la recherche d&#39;information ciblée.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.333/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.333/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article traite de l&amp;rsquo;intégration des balises XML dans la fonction de pondération des termes, pour la recherche d&amp;rsquo;information (RI) XML ciblée. Notre modèle permet de considérer un certain type d&amp;rsquo;information structurelle: les balises qui représentent la structure logique des documents (titre, section, paragraphe, etc.) ainsi que les balises liées à la mise en forme (gras, italique, centré, etc.). Nous prenons en compte l&amp;rsquo;influence des balises sous forme d&amp;rsquo;un poids en estimant la probabilité pour une balise de mettre en évidence les termes pertinents. Ensuite, ces poids sont intégrés à la fonction de pondération des termes. Des expérimentations sur une collection de grande taille dans le cadre de la compétition de RI XML, INEX 2008, ont montré une amélioration de la qualité des résultats en RI ciblée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modélisation de relations dans l&#39;approche modèle de langue en recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.305/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.305/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous abordons dans cet article le problème de la prise en compte de relations (par exemple de nature syntaxique ou sémantique) dans un modèle de langues en recherche d&amp;rsquo;infor- mation. En particulier, nous proposons, sur la base du modèle de langue, un cadre complet pour la prise en compte de relations, étiquetées ou non. Afin d&amp;rsquo;illustrer ce cadre, nous avons conduit une série d&amp;rsquo;expériences fondées sur différentes indexations structurées (grammaire de dépen- dances et graphes de relations entre concepts) dans le domaine médical. Nos résultats montrent que l&amp;rsquo;intégration d&amp;rsquo;information sur les relations entre termes améliore la qualité d&amp;rsquo;un système de recherche d&amp;rsquo;information sur la précision à 5 documents. Ils confirment aussi le bien-fondé du modèle que nous proposons.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Passage à l&#39;Echelle - Une méthodologie d&#39;étude de l&#39;influence du volume de collection sur les modèles de Recherche d&#39;Information.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.23/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.23/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Peu de travaux en Recherche d&amp;rsquo;Information (RI) ont jusqu&amp;rsquo;alors abordé les questions d&amp;rsquo;efficience et d&amp;rsquo;efficacité des systèmes de RI dans le contexte du passage à l&amp;rsquo;échelle dans la taille des corpus. Nous proposons une démarche expérimentale reproductible (pour l&amp;rsquo;étude de l&amp;rsquo;influence du passage à l&amp;rsquo;échelle sur les modèles de RI) basée sur la construction d&amp;rsquo;une col- lection sur laquelle une caractéristique donnée est la même quelle que soit la portion de collection selectionnée. Cette nouvelle collection dite &amp;lsquo;uniforme&amp;rsquo; peut être decoupée en sous- collections qui sont des &amp;rsquo; échantillons &amp;rsquo; de taille croissante de la collection entière et sur les- quelles des propriétés de modèles de RI sont étudiées. Nous appliquons notre démarche sur la collection WT10G de TREC9 avec comme caractéristique la répartition des documents pertinents et comme propriétés les métriques d&amp;rsquo;évaluation de RI.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Personnalisation de services Web: approche fondée sur la composition.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.237/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.237/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De nos jours, les exigences des clients contraignent souvent les entreprises à assurer une diversité de plus en plus accrue dans la gamme de leurs produits et services. Ceci a donné lieu, très récemment, au paradigme de personnalisation de masse. Ainsi les produits et services seront conçus de sorte à permettre un maximum de configurations différentes. La prolifération exponentielle du nombre de services offerts sur le Web et l&amp;rsquo;aspect cosmopolite de ce dernier motivent l&amp;rsquo;application de ce paradigme aux services Web. Dans cet article, nous présentons un cadre qui permet la personnalisation automatique de services Web. Il est fondé sur la transfor- mation de la configuration de l&amp;rsquo;offre de services enregistrée par le fournisseur de services dans un annuaire vers d&amp;rsquo;autres configurations répondant aux préférences des clients.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Processing Natural Language Queries to Disambiguate Named Entities and Extract Users&#39; Goals : Application to e-Tourism.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une étude qui s’inscrit dans le cadre d’un projet plus large qui&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper presents a study which is part of a broader project. This latter aims at providing&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information et analyse bibliographique appliquées à la mise à jour automatique de Swiss-Prot.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.319/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.319/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;But : Le but de cette étude est de découvrir de nouveaux articles scientifiques utiles pour la mise à jour de l&amp;rsquo;information dans la base de données de biologie moléculaire UniProtKB/Swiss-Prot. Notre hypothèse de base est qu&amp;rsquo;un article qui cite un autre article déjà référencé dans une entrée Swiss-Prot pour une protéine donnée est un bon candidat pour mettre à jour l&amp;rsquo;information de l&amp;rsquo;entrée de cette protéine dans la base. Méthodes : La procédure expérimentale pour tester cette hypothèse est la suivante : dans chaque entrée UniProtKB/Swiss-Prot nous séparons l&amp;rsquo;ensemble des références bibliographiques connues (ERB) en deux ensembles : l&amp;rsquo;ensemble des références connues (ERC) et l&amp;rsquo;ensemble des références à découvrir (ERD) par notre système. Notre système va proposer un ensemble de références possibles (ERP). Nous évaluons la performance de deux différentes méthodes en comparant la précision de notre détecteur de nouveauté, c&amp;rsquo;est-à-dire en mesurant le rapport entre ERD et ERP. La première méthode, guidée par les références (GR) analyse les références bibliographiques d&amp;rsquo;un article donné pour prévoir son intérêt pour la mise à jour de UniProtKB/Swiss-Prot. Pour cette approche, nous utilisons un analyseur HTML de bibliographie afin d&amp;rsquo;identifier dans notre corpus les articles citant des articles contenus dans ERB. La deuxième méthode, guidée par la recherche documentaire (GD) utilise un moteur de recherche pour classer par ordre de pertinence un ensemble d&amp;rsquo;articles en fonction d&amp;rsquo;une requête contenant le nom de la protéine et ses synonymes. Pour cette approche, nous avons récupéré l&amp;rsquo;ensemble des champs MEDLINE; résumé, titre, termes MeSH (Medical Subject Headings ou Mots clés médicaux) et les noms chimiques correspondants à ces PMID afin de les indexer dans le moteur de recherche. Résultats : On trouve une importante corrélation (0.74) entre les deux méthodes GR et GD. Toutefois des différences demeurent, en particulier, la précision des premiers documents retournés par méthode GD est sensiblement supérieure (0.46) à celle de la méthode GR (0.31). La fusion des deux méthodes par combinaison linéaire, qui obtient un gain significatif&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réseaux de neurones de quaternions pour le traitement du langage.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.31/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.31/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les algorithmes d&amp;rsquo;apprentissage automatique, comme les réseaux de neurones (NN), ont permis d&amp;rsquo;atteindre des performances notables dans de nombreuses tâches liées au traite- ment automatique du langage (TAL). En TAL les contenus sont généralement représentés dans des espaces lexicaux ou thématiques. Les méthodes de traitement des contenus- y compris celles basées sur des NN- opèrent donc dans des espaces où les relations statistiques entre les élé- ments du document sont faiblement considérées. Nous proposons de remédier à cette faiblesse en étendant les réseaux de neurones aux quaternions (QMLP) pour permettre une modélisation des dépendances cachées entres les données. L&amp;rsquo;architecture proposée est évaluée lors d&amp;rsquo;une tache d&amp;rsquo;analyse de dialogue parlés. Les résultats montrent que l&amp;rsquo;association du QMLP et d&amp;rsquo;une représentation structurée permet d&amp;rsquo;obtenir un gain en précision de 2% et 3% comparativement aux MLPs et à (Morchid et al., 2013) respectivement. Nous montrons finalement que la vitesse de convergence du QMLP est sensiblement supérieure à celle du MLP.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Système de recherche d&#39;information pour les tâches métier.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.301/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.301/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;usager peut avoir du mal à trouver les informations pertinentes dont il a besoin pour accomplir sa tâche métier. Pour résoudre ce problème nous présentons dans cet article l&amp;rsquo;architecture d&amp;rsquo;un système de recherche d&amp;rsquo;information applicable à un contexte métier qui permettra d&amp;rsquo;adapter les résultats de recherche d&amp;rsquo;information nécessaires aux tâches métier. Le système repose sur une proposition de modèle triptyque du contexte métier qui englobe la modélisation des trois parties interdépendantes du contexte : l&amp;rsquo;usager, la tâche et l&amp;rsquo;environnement. Le modèle est associé à un processus d&amp;rsquo;apprentissage et à un processus de mise en situation qui créée, selon la conjonction de tous les facteurs contextuels réunis, la situation particulière. Cette dernière sera le point d&amp;rsquo;entrée du système de recherche d&amp;rsquo;information. Nous expliquons comment ce système de recherche d&amp;rsquo;information pourra améliorer la recherche d&amp;rsquo;information dans un contexte métier en prenant en compte les aspects cognitifs, techniques et sociaux. Nous détaillons également dans cet article les différentes facettes du modèle de contexte proposé ainsi que les composantes associées.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Accès personnalisé à de multiples serveurs d&#39;informations.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.249/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.249/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit une approche de la recherche d&amp;rsquo;information permettant l&amp;rsquo;accès personnalisé à plusieurs serveurs d&amp;rsquo;information. L&amp;rsquo;accès à des serveurs d&amp;rsquo;informations distribués est souvent effectué en trois étapes, la première consiste à sélectionner les serveurs pertinents pour la requête, puis soumettre la requête à ces serveurs sélectionnés et finalement fusionner les résultats retournés par ces serveurs. L&amp;rsquo;objectif de cet article est d&amp;rsquo;intégrer l&amp;rsquo;utilisateur via son profil dans les processus de sélection et de fusions des résultats des serveurs. Nous avons testé notre approche sur les moteurs de recherches suivant : GOOGLE, YAHOO, ALTAVISTA, MSN, LYCOS, TEOMA, WISENUT, ALLTHWEB.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Analyse Expérimentale sur la structure des index documentaires et leur impact sur l&#39;efficacité de la recherche: Cas de collections volumineuses.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.26/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.26/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;inscrit dans le cadre général de la problématique du passage à l&amp;rsquo;échelle dans la taille des corpus en l&amp;rsquo;abordant plus précisément sous l&amp;rsquo;angle des limites des représentations locales et globales des index documentaires. Une analyse globale de la structure de ces index est présentée en utilisant des collections de référence TREC. Cette analyse est suivie d&amp;rsquo;une évaluation expérimentale de leur impact sur l&amp;rsquo;efficacité de la recherche.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Attribution d&#39;auteur par ensembles de séparateurs.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;attribution d&amp;rsquo;auteur peut être analysée comme une tâche particulière en catégorisation de textes.  Dans cette perspective, on définit d&amp;rsquo;abord une liste d&amp;rsquo;attributs pertinents (vocables dans cet article). Ensuite, on entraîne un modèle de classification afin de discriminer entre les auteurs potentiels. Pour améliorer la performance moyenne on peut s&amp;rsquo;appuyer sur un ensemble de séparateurs, la solution retenue étant celle de la majorité (bagging).  Afin de générer ce groupe de classifieurs, nous présentons deux formes de variations possibles, d&amp;rsquo;une part en perturbant les profils d&amp;rsquo;auteurs et, d&amp;rsquo;autre part, la liste des attributs. Afin de comparer l&amp;rsquo;efficacité de ces approches, nous avons extrait deux corpus d&amp;rsquo;articles de presse (Glasgow Herald) écrits par cinq journalistes, un dans le domaine du sport (1 948 articles) et le second en politique (987 articles). Sur la base de la performance obtenue par la méthode de divergence Kullback-Leibler (Zhao &amp;amp; Zobel, 2007), les stratégies plus complexes n&amp;rsquo;apportent pas toujours les améliorations escomptées.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Clustering de documents dans des collections hétérogènes.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.50/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.50/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La classification non supervisée (ou clustering) de documents permet d&amp;rsquo;organiser thématiquement une collection de documents de façon à faciliter l&amp;rsquo;accès à l&amp;rsquo;information, ou à proposer une vue synthétique du contenu d&amp;rsquo;un ensemble de documents. Néanmoins, quand la collection considérée contient des documents de type différent, cette hétérogénéité perturbe les résultats du clustering, en regroupant plus volontiers les documents selon leur type que selon leur thème. Nous présentons dans cet article une approche simple pour la prise en compte de l&amp;rsquo;hétérogénéité de la collection dans le clustering, en utilisant une sélection des traits de représentation qui s&amp;rsquo;appuie sur les différences de distributions des termes selon les types de document. Nous montrons l&amp;rsquo;intérêt de l&amp;rsquo;approche proposée en proposant une évaluation sur un corpus hétérogène constitué spécifiquement pour cette tâche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction automatique de termes-clés : Comparaison des méthodes non supervisées de la littérature.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente un état de l’art et une comparaison des méthodes non&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This article presents a state of the art and a comparison of unsupervised methods&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction de formules chimiques dans des documents manuscrits composites.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-15/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-15/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous abordons dans ces travaux, le problème de la segmentation de documents de cahiers de la chimie en zones homogènes. Les documents à traiter sont manuscrits sans contraintes composés de zones de textes, de tableaux et de graphiques, représentant l&amp;rsquo;expres- sion graphique de l&amp;rsquo;expérience réalisée. L&amp;rsquo;objectif de ce premier travail est d&amp;rsquo;extraire, dans chaque document, le bloc contenant le schéma graphique. Nous proposons une méthode d&amp;rsquo;ex- traction et de classification des structures élémentaires du document sur lesquels s&amp;rsquo;appuiera une technique de séparation verticale des blocs. Des descripteurs spécifiques tenant compte de la texture du texte et du graphique sont pris en compte. Des connaissances a priori sur la structure du document sont ensuite utilisées pour délimiter le bloc graphique. Les résultats ex- périmentaux obtenus sur une variété de documents de chimie sont de l&amp;rsquo;ordre de 92% de bonne extraction de graphique&lt;/p&gt;</description>
    </item>
    <item>
      <title>GraphDuplex: visualisation simultanée de N réseaux couplés 2 par 2.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.351/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.351/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;analyse des réseaux sociaux fait un usage intensif d&amp;rsquo;outils de visualisation et, dans le  domaine  de  la  recherche  d&amp;rsquo;information,  l&amp;rsquo;exploration  visuelle  de  réseaux  lexicaux  est utilisée comme une aide à la désambiguïsation ou au raffinement de la requête. Ces deux types de  réseaux se  trouvent associés  via  Internet lorsqu&amp;rsquo;un  contenu  textuel est  lié à  une activité  sociale  (méls,  blogs,  travail  collaboratif).  Dans  cet  article,  nous  présentons  un logiciel de visualisation simultanée de plusieurs réseaux, GraphDuplex, qui, combiné à des méthodes  statistiques,  permet  par  exemple  d&amp;rsquo;étudier  conjointement  un  réseau  social  (ou plusieurs)  et son  réseau lexical  associé.  GraphDuplex permet en particulier des requêtes dynamiques inter-réseaux, entre les noeuds ou les liens des deux réseaux.&lt;/p&gt;</description>
    </item>
    <item>
      <title>On the use of tolerant graded inclusions in information retrieval.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.321/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.321/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, un modèle de recherche d&amp;rsquo;information fondé sur la théorie des ensembles flous est considéré. Tout d&amp;rsquo;abord, nous montrons que le mécanisme de recherche dans un tel modèle peut être défini en termes d&amp;rsquo;inclusion graduelle. Cette approche est fortement liée à la notion de division dans un contexte de bases de données relationnelles. Dans un deuxième temps, nous mettons en évidence plusieurs axes d&amp;rsquo;extension de l&amp;rsquo;inclusion graduelle, l&amp;rsquo;objectif étant de rendre l&amp;rsquo;indicateur d&amp;rsquo;inclusion (et donc le mécanisme de matching document-requête) plus tolérant, aux exceptions notamment. Il est montré que l&amp;rsquo;utilisation de tels indicateurs d&amp;rsquo;inclusion tolérante permet de réduire le risque d&amp;rsquo;obtention de réponses vides.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Regroupement d’auteurs : Qui a écrit cet ensemble de romans ?</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente le problème du regroupement d&amp;rsquo;auteurs c&amp;rsquo;est-à-dire étant donné un ensemble n d&amp;rsquo;écrits, retournez le nombre k d&amp;rsquo;auteurs et regroupez dans k classes les textes par auteur. Liée au problème de l&amp;rsquo;attribution d&amp;rsquo;auteur, cette question possède toutefois la propriété d&amp;rsquo;être non-supervisée. Sur la base de deux collections de documents, une écrite en français, la seconde en anglais, diverses mesures de distance sont proposées et évaluées. Au niveau du choix des attributs, les m (avec m = 50 à 2 000) mots les plus fréquents ou les m unigrammes et bigrammes de lettres sont étudiés. Les résultats indiquent que la représentation par mots présente habituellement une meilleure performance que celle basée sur les bigrammes de lettres. La distance calculée par le cosinus offre une qualité moindre que des fonctions basées sur la norme L1 (à l&amp;rsquo;exemple de Canberra). Toutefois, le choix de la meilleure mesure de distance ne peut être fixée avec précision. Enfin, nous proposons d&amp;rsquo;appliquer une forme de ré-échantillonnage aléatoire (bootstrap) afin de tenir compte des variations lexicales. Nos résultats indiquent une variabilité importante des résultats face à des variantes lexicales. Enfin, une analyse détaillée révèle les difficultés et les raisons d&amp;rsquo;affectations erronées.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Représentations et régularisations pour la classification de sentiments.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.285/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.285/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les forums, les blogs et les recommandations sur les sites de vente en ligne constituent une source de données d&amp;rsquo;un nouveau genre présentant de forts enjeux économiques et scienti- fiques. L&amp;rsquo;exploitation de ces données permet de prédire efficacement les ventes de jeux vidéos et les entrées de cinéma. Le but de la fouille d&amp;rsquo;opinion est également d&amp;rsquo;affiner les profils d&amp;rsquo;uti- lisateurs et d&amp;rsquo;utiliser les sources ouvertes du web pour effectuer des sondages. Les algorithmes classiques de classification de documents ne fonctionnent pas de manière optimale sur ces don- nées, ce qui explique la dynamique de recherche actuelle sur le sujet. Nous comparons dans cet article différents descripteurs textuels sur la tâche de classification supervisée de polarité et nous montrons l&amp;rsquo;intérêt des descripteurs complexes (N-grammes, sous-séquences) par rapport aux unigrammes. Ces représentations riches aboutissent à une très grande dimensionnalité qui pose problème lors de l&amp;rsquo;apprentissage: nous proposons une nouvelle méthode de régularisa- tion basée sur la pénalisation des termes fréquents qui permet d&amp;rsquo;exploiter efficacement de tels espaces. Nous montrons l&amp;rsquo;intérêt de cette approche sur les données Amazon et Movie Reviews.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Résumé automatique guidé de textes: État de l’art et perspectives</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;es systèmes de résumé automatique de textes (SRAT) consistent à produire une représentation condensée et pertinente à partir d&amp;rsquo;un ou de plusieurs documents textuels. La majorité des SRAT sont basés sur des approches extractives. La tendance actuelle consiste à s&amp;rsquo;orienter vers les approches abstractives. Dans ce contexte, le résumé guidé défini par la campagne d&amp;rsquo;évaluation internationale TAC (Text Analysis Conference) en 2010, vise à encourager la recherche sur ce type d&amp;rsquo;approche, en se basant sur des techniques d&amp;rsquo;analyse en profondeur de textes. Dans ce papier, nous nous penchons sur le résumé automatique guidé de textes. Dans un premier temps, nous définissons les différentes caractéristiques et contraintes liées à cette tâche. Ensuite, nous dressons un état de l&amp;rsquo;art des principaux systèmes existants en mettant l&amp;rsquo;accent sur les travaux les plus récents, et en les classifiant selon les approches adoptées, les techniques utilisées, et leurs évaluations sur des corpus de références. Enfin, nous proposons les grandes étapes d&amp;rsquo;une méthode spécifique devant permettre le développement d&amp;rsquo;un nouveau type de systèmes de résumé guidé.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Segmentation thématique : apport de la vectorisation.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.247/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.247/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous nous intéressons à la segmentation thématique d&amp;rsquo;émissions télé- visées à partir de la transcription automatique de leur bande-son. La segmentation thématique de textes a fait l&amp;rsquo;objet de travaux depuis de nombreuses années, et les techniques mises en oeuvre reposent souvent sur des descriptions de contenu et des calculs de similarité utilisés en recherche d&amp;rsquo;information. Dans cet article, nous proposons une technique s&amp;rsquo;inspirant des tra- vaux de morphologie mathématique utilisés en segmentation d&amp;rsquo;image. Nous montrons de plus que la technique d&amp;rsquo;appariement par vectorisation proposée par (Claveau et al., 2010) peut être utilisée dans l&amp;rsquo;étape clef de calcul de similarité entre les segments. Nous évaluons cette approche sur deux corpus d&amp;rsquo;émissions de télévision. Les résultats obtenus au travers de ces ex- périences dépassent nettement ceux des approches existantes et montrent le bien-fondé de notre démarche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une approche de représentation de l&#39;information en RI basée sur les sousarbres.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.335/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.335/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier propose une approche de recherche d’information basée sur l’utilisation&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The paper proposes an approach to information retrieval based on the use of a conceptual structure both for indexing document and expressing user queries. The conceptual structure is hierarchical and it is formally represented as a weighted tree. In this approach, the evaluation of queries is based on the comparison of minimal sub-trees containing the two sets of nodes corresponding to the concepts expressed in the document and the query respectively. The comparison is based on the computation of a multiple-valued degree of inclusion. Some candidate implications are discussed on the basis of their respective semantics. The proposed approach generalizes standard fuzzy information retrieval and its evaluation on benchmark example is also presented.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vectorisation des processus d&#39;appariement document-requête.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.313/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.313/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans la plupart des applications de RI, calculer rapidement la proximité entre do- cuments et requêtes est crucial. Avec les modèles vectoriels, ce calcul se fait généralement de manière très efficace. Cependant, lorsque les requêtes sont très longues ou dans le cas de SRI basés sur des modèles plus avancés, ce calcul devient plus complexe et coûteux. Dans cet article, nous proposons une technique simple pour transformer n&amp;rsquo;importe quel processus d&amp;rsquo;ap- pariement requête-document fournissant un score en un problème de calcul de distance entre vecteurs. Cette approche peut ainsi bénéficier des bonnes performances des outils existants d&amp;rsquo;indexation et de recherche approximative dans des espaces de grandes dimensions. Au tra- vers de quelques expériences, nous montrons par ailleurs que cette représentation n&amp;rsquo;entraîne pas de baisse importante de qualité des résultats, et, lorsque de nombreux documents sont à retourner, améliore même le rappel par rapport au SRI original, à taille de résultat égal.&lt;/p&gt;</description>
    </item>
    <item>
      <title>ANASTASIA : recommandation de séquences d&#39;activités spatiotemporelles.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Avec l&amp;rsquo;augmentation du nombre et de la variété des activités accessibles par les utili- sateurs, la recommandation personnalisée de séquences d&amp;rsquo;activités devient un enjeu important. Or, la plupart des systèmes de recommandation ne tiennent pas compte des contraintes tem- porelles liées aux activités, ce qui rend la recommandation difficile à suivre par un utilisateur. Dans cet article, nous décrivons une nouvelle approche pour la recommandation de séquences d&amp;rsquo;activités limitées dans le temps et concurrentes. Elle s&amp;rsquo;appuie sur l&amp;rsquo;historique des activités des utilisateurs pour extraire des motifs comportementaux et intègre différents éléments contextuels (popularité, informations démographiques et spatio-temporelles). Nous présentons un protocole d&amp;rsquo;évaluation et un jeu de données qui permettra l&amp;rsquo;évaluation de notre approche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Bagging de caractéristiques pour l&#39;authentification d&#39;auteur.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_94/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_94/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les travaux en authentification d&amp;rsquo;auteur ont montré la difficulté de dépasser une stratégie simple telle qu&amp;rsquo;un classifieur linéaire opérant sur des représentations de type sac de caractéristiques des documents. Nous proposons pour surmonter cette difficulté d&amp;rsquo;utiliser les techniques de bagging de caractéristiques qui reposent sur l&amp;rsquo;apprentissage d&amp;rsquo;un ensemble de classifieurs appris sur des sous-ensembles aléatoires de caractéristiques, puis sur le vote de ces classifieurs en test.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The authorship attribution literature demonstrates the difficulty to design classifiers that outperform simple strategies such as linear classifiers operating on bag of features rep- resentation of documents. To overcome this difficulty we propose to use Bagging techniques that rely on learning classifiers on different random subsets of features, then to combine their decision by making them vote.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Clustering Spectral semi-supervisé avec propagation automatique des contraintes par paires.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.20/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.20/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans un monde guidé par les données, la classification est un outil essentiel pour ai- der les utilisateurs à appréhender la structure de ces données. Les techniques d&amp;rsquo;apprentissage supervisé permettent d&amp;rsquo;obtenir de très bonnes performances lorsque l&amp;rsquo;on dispose d&amp;rsquo;une base an- notée, mais un risque de sur-apprentissage existe toujours. Il existe de nombreuses techniques de classification non supervisée qui cherchent à construire la structure des données sans dispo- ser de données d&amp;rsquo;entraînement. Mais dans des contextes difficiles les résultats sont moins bons que ceux de l&amp;rsquo;apprentissage supervisé. Pour améliorer les performances, un bon compromis est d&amp;rsquo;apporter de la connaissance seulement sur les éléments (classes et objets) ambigües. Dans ce contexte, cet article s&amp;rsquo;intéresse au Clustering Spectral et à l&amp;rsquo;ajout de contrainte par paires. Nous introduisons une nouvelle généralisation de la propagation des contraintes qui maximise la qualité de partitionnement tout en réduisant les coûts d&amp;rsquo;annotation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>EDOLA : Une nouvelle méthode d&#39;alignement d&#39;ontologies OWL-Lite.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.351/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.351/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;alignement d&amp;rsquo;ontologies revêt toute son importance dans des applications nécessi- tant la prise en compte d&amp;rsquo;une interopérabilité sémantique. Plusieurs approches d&amp;rsquo;alignement d&amp;rsquo;ontologies existent dans la littérature. Elles sont basées sur les mesures de similarités. Dans ce papier, une nouvelle méthode d&amp;rsquo;alignement d&amp;rsquo;ontologies OWL-Lite est décrite. Le module d&amp;rsquo;alignement implémente une nouvelle approche d&amp;rsquo;alignement d&amp;rsquo;ontologies qui défi- nit un modèle global de calcul de similarité, tout en remédiant au problème de l&amp;rsquo;intervention de l&amp;rsquo;utilisateur dans le processus d&amp;rsquo;alignement. Les tests expérimentaux réalisés sur les ontologies de benchmark montrent une nette amélioration des métriques de rappel et de précision.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Génération d&#39;images semi-synthétiques de documents anciens à des fins d&#39;évaluation de performances et d&#39;apprentissage.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-16/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-16/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous étudions comment des données semi-synthétiques permettent d&amp;rsquo;évaluer finement les performances d&amp;rsquo;algorithmes ou de fournir des données d&amp;rsquo;apprentissage à un système de traitement ou d&amp;rsquo;analyse d&amp;rsquo;images de documents. Les images semi-synthétiques que nous générons reproduisent fidèlement les défauts des documents anciens liés aux moyens d&amp;rsquo;impression anciens ou à la dégradation de l&amp;rsquo;encre des caractères. La première expérimenta- tion réalisée dans cet article vise à comparer les performances de différents descripteurs texture dans l&amp;rsquo;optique d&amp;rsquo;une segmentation d&amp;rsquo;images. La seconde expérience met en évidence le fait que l&amp;rsquo;utilisation d&amp;rsquo;images semi-synthétiques permet d&amp;rsquo;enrichir quantitativement et qualitativement une base d&amp;rsquo;apprentissage utilisée par une méthode de prédiction de résultats de binarisation d&amp;rsquo;images de documents et d&amp;rsquo;améliorer les résultats de 15%.&lt;/p&gt;</description>
    </item>
    <item>
      <title>GVC: a graph-based Information Retrieval Mode.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.337/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.337/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;GVC is a new information retrieval model that is based on Graph Vertices Comparison (GVC). It implements a new similarity measure to compare documents and users&amp;rsquo; queries based on graph matching. In this model, graphs are composed of two types of nodes. Documents, queries and indexing terms are viewed as vertices of this bipartite graph where each edge goes from a document or a query ufirst type of nodes- to an indexing term u second type of nodes-. Edges reflect the relationship that exists between documents or queries on the one hand and indexing terms on the other hand; they are set according to the tf.idf principal. Our method implements similarity propagation over graph edges using an iterative process. We evaluate the model using 4 different collections (TREC 2004 Novelty Track, CISI, Cranfield and Medline). We show that considering precision at 5 documents, GVC outperforms Okapi model from 9% to 62%, depending on the collections.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Identification de descripteurs pour la caractérisation de registres</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;&amp;lsquo;article présente une étude des descripteurs linguistiques pour la caractérisation d&amp;rsquo;un texte selon son registre de langue (familier, courant, soutenu). Cette étude a pour but de poser un premier jalon pour des tâches futures sur le sujet (classification, extraction de motifs discriminants). À partir d&amp;rsquo;un état de l&amp;rsquo;art mené sur la notion de registre dans la littérature linguistique et sociolinguistique, nous avons identifié une liste de 72 descripteurs pertinents. Dans cet article, nous présentons les 30 premiers que nous avons pu valider sur un corpus de textes français de registres distincts.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Intrégration des facteurs temps et autorité sociale dans un modèle bayésien de recherche de tweets.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.301/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.301/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une approche sociale pour la recherche d&amp;rsquo;information dans les microblogs intégrant diverses sources d&amp;rsquo;évidence au sein d&amp;rsquo;un réseau bayésien. Notre contribu- tion consiste à étendre la notion classique de pertinence, basée sur la similarité textuelle, par de nouveaux facteurs tels que l&amp;rsquo;importance sociale des blogueurs et la magnitude temporelle des microblogs. Dans ce papier, l&amp;rsquo;importance sociale d&amp;rsquo;un blogueur est assimilée à son in- fluence dans le réseau et est évaluée par un score de PageRank déduit sur le réseau de diffusion des microblogs. Nous proposons d&amp;rsquo;estimer la magnitude temporelle selon le nombre de voisins temporels qui incluent les termes de la requête. Afin de valider notre approche, une évaluation expérimentale à été menée sur la collection de microblogs de référence TREC Tweets2011. Les résultats montrent que notre modèle présente un gain de 24% par rapport à la médiane des résultats officiels de TREC Microblog 2011.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Nouvelle approche de clustering par kernel-pattern via la densité en triades.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.25/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.25/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La détection des communautés est devenue un domaine de recherche majeur ces dernières années. Plusieurs algorithmes appliqués aux graphes orientés ont été developpés. Ces derniers se focalisent sur la densité de liens à l&amp;rsquo;intérieur des communautés et considèrent la relation entre les noeuds comme symmétrique, car ils ignorent l&amp;rsquo;orientation des liens, ce qui biaise les résultats en produisant des communautés non-significatives. Ce document propose un algorithme basé sur l&amp;rsquo;extraction des kernels via la distribution des triades, utilisant l&amp;rsquo;optimi- sation de la nouvelle métrique Kernel Degree Clustering (KDC), et trouve des communautés plus sémantiques que la modularité, en accord à la notion de centralisation de l&amp;rsquo;information. Les expérimentations montrent que la nouvelle approche produit les résultats préconisés que ceux produits par certains algorithmes de détection de communautés de l&amp;rsquo;état de l&amp;rsquo;art.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Prise en compte des liens pour améliorer la recherche d&#39;information structurée.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.363/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.363/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous présentons deux adaptations de l&amp;rsquo;algorithme PageRank aux collections de documents XML et les résultats d&amp;rsquo;expérimentation obtenus pour la collection Wikipedia utilisée dans INEX 2007. Ces adaptations que nous appelons &amp;lsquo;DOCRANK&amp;rsquo; et &amp;lsquo;HITS_docrank&amp;rsquo; permettent un reclassement des résultats renvoyés par l&amp;rsquo;exécution de base (base run) pour en améliorer la qualité. Nos expérimentations sont effectuées sur les résultats renvoyés par les trois systèmes les mieux classés pour la tâche &amp;lsquo;Focused&amp;rsquo; d&amp;rsquo;INEX 2007. Les évaluations que nous avons menés ont montrés des améliorations de la qualité des résultats (voir très significatives pour certaines &amp;rsquo;topics&amp;rsquo;, ex : 491, 521, etc.). La meilleure amélioration obtenue pour les résultats renvoyés par le système de l&amp;rsquo;université DALIAN (pour l&amp;rsquo;ensemble des 107 topics d&amp;rsquo;INEX 2007) était de l&amp;rsquo;ordre de 3.78%.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Proposition d&#39;une nouvelle structure de document pour améliorer la recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.36/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.36/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Actuellement l&amp;rsquo;information contenue dans les bibliothèques numériques n&amp;rsquo;est pas totalement décrite et son exploitation est insuffisante. La description de l&amp;rsquo;information en utilisant des métadonnées nous semble une bonne solution pour envisager une recherche d&amp;rsquo;information plus pertinente. Notre proposition est fondée sur la création et l&amp;rsquo;introduction au sein du document de &amp;ldquo;tags sémantiques&amp;rdquo; capables de décrire, dans notre cas, des thèses doctorales. Nous présentons l&amp;rsquo;analyse de quatre outils de Traitement Automatique des Langues (TAL) capables d&amp;rsquo;extraire automatiquement des concepts. Ensuite, nous proposons une base de concepts fondée sur l&amp;rsquo;analyse des structures logique et sémantique des thèses. Nous présentons ensuite un nouveau modèle du document, en utilisant le XML Schéma, qui contient les nouveaux &amp;ldquo;tags sémantiques&amp;rdquo; sur lesquels nous nous appuierons lors de sessions de recherche pour fournir à l&amp;rsquo;utilisateur l&amp;rsquo;information pertinente.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information dans les documents numériques : vers une variation des modalités d&#39;exécution procédurale.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.255/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.255/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;ette recherche teste l&amp;rsquo;efficacité cognitive d&amp;rsquo;un nouveau système technique facilitant la recherche d&amp;rsquo;information dans les documents numériques. Ce système utilise un dispositif de prévisualisation par transparence permettant à l&amp;rsquo;utilisateur de consulter des pages en profondeur. Une expérimentation a été conduite auprès de 36 participants (jeunes et âgés). La tâche consistait à trouver un appartement cible possédant un ou plusieurs critères spécifiques dans un site web d&amp;rsquo;agence immobilière spécialement conçu. Deux versions de ce site ont été testées. L&amp;rsquo;une u habituelle » présentant les caractéristiques classiques de recherche, page par page; l&amp;rsquo;autre u transparente » qui permettait à l&amp;rsquo;utilisateur de pré- visualiser les pages choisies et de ne sélectionner que les pages pertinentes. Les résultats ont montré un effet très significatif du type de version en faveur de la version transparente.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une Indexation conceptuelle pour un filtrage par dimensions.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.257/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.257/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le but de résoudre des requêtes multi-dimensions, nous proposons une indexation conceptuelle à l&amp;rsquo;aide d&amp;rsquo;un méta thésaurus médical (UMLS). Nous étudions l&amp;rsquo;impact de cette indexation par rapport à une indexation à base de mots. Nous montrons que l&amp;rsquo;usage du méta thésaurus est délicat à mettre en oeuvre mais peut donner des résultats supérieurs à une indexation par mots. Nous définissons ensuite la notion de dimensions des requêtes. En utilisant une organisation hiérarchique des concepts du méta thésaurus, nous proposons une technique simple pour filtrer le corpus en fonction des dimensions de la requête. Les expérimentations, menées sur la collection ImageCLEFmed 2005, montrent que l&amp;rsquo;indexation conceptuelle avec la prise en compte des dimensions de la requête améliorent les résultats de 16%.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers un modèle d&#39;indexation sémantique adapté aux dossiers médicaux de patients.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.325/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.325/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier présente un modèle d&amp;rsquo;indexation sémantique adapté aux dossiers électro- niques de patients. Ce modèle servira de support à des processus de recherche d&amp;rsquo;information médicale, permettant à terme de promouvoir l&amp;rsquo;expérience collective des médecins. Compte tenu de la spécificité de ce type de documents, le processus d&amp;rsquo;indexation est basé sur la succes- sion d&amp;rsquo;étapes d&amp;rsquo;annotation sémantique fondée sur l&amp;rsquo;utilisation de MeSH (Medical Subject Hea- dings), de désambiguïsation répondant au problème d&amp;rsquo;homonymie, d&amp;rsquo;extraction de valeurs cli- niques, puis de pondération des concepts. Le schéma de pondération tient compte du niveau de description de l&amp;rsquo;index (document ou dossier) ainsi que de la localisation des concepts dans le document et dans la hiérarchie de MeSH et ce, dans le but de traduire à la fois leur spéci- ficité et leur centralité. Le modèle d&amp;rsquo;indexation proposé est évalué sur un corpus de dossiers électroniques de patients et montre son efficacité pour ce type de documents.&lt;/p&gt;</description>
    </item>
    <item>
      <title>AGATHE : une architecture générique à base d&#39;agents et d&#39;ontologies pour la collecte d&#39;information sur domaines restreints du Web.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.367/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.367/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La collecte pertinente d&amp;rsquo;information sur le Web est une tâche très complexe et les moteurs de recherche actuels, reposant sur des méthodes d&amp;rsquo;indexation et de recherches basées sur des mots-clés, ont de très faibles taux de précision. Les recherches qu&amp;rsquo;ils réalisent sont essentiellement lexicales statistiques et ne prennent pas en compte leurs contextes sous- jacents. En se limitant à des domaines restreints, la prise en compte de ces contextes est possible et doit conduire à des collectes plus pertinentes. Dans ce papier, est proposée une collecte coopérative d&amp;rsquo;information à base d&amp;rsquo;agents logiciels et d&amp;rsquo;ontologies. Ensuite, une architecture logicielle générique, AGATHE, mettant en oeuvre ce type de collecte et permettant le développement de systèmes de collecte relatif à un ou plusieurs domaines, est présentée en détail.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de représentation pour la diffusion d&#39;Information dans les réseaux sociaux.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-13/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-13/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Depuis l’émergence des réseaux sociaux en ligne il y a une dizaine d’années,&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Modeling the diffusion of information on social media has mainly been treated as a diffusion process on known graphs, and under closed world assumptions. We introduce here a new approach to this problem whose principle is to learn a mapping of the observed interacting users onto a latent representation space in such a way that information diffusion can be modeled efficiently using a heat diffusion process. Since its parameters are directly learned from cascade samples, the model does not rely on any pre-existing diffusion structure. Experiments show the effectiveness of the proposed ideas both in terms of prediction quality and inference speed.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Construction d’un corpus multilingue annoté en relations de traduction</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;es relations de traduction, qui distinguent la traduction littérale d&amp;rsquo;autres procédés, constituent un sujet d&amp;rsquo;étude important pour les traducteurs humains (Chuquet &amp;amp; Paillard, 1989). Or les traitements automatiques fondés sur des relations entre langues, tels que la traduction automatique ou la méthode de génération de paraphrases par équivalence de traduction, ne les ont pas exploitées explicitement jusqu&amp;rsquo;à présent. Dans ce travail, nous présentons une catégorisation des relations de traduction et nous les annotons dans un corpus parallèle multilingue (anglais, français, chinois) de présentations orales, les TED Talks. Notre objectif à plus long terme sera d&amp;rsquo;en faire la détection de manière automatique afin de pouvoir les intégrer comme caractéristiques importantes pour la recherche de segments monolingues en relation d&amp;rsquo;équivalence (paraphrases) ou d&amp;rsquo;implication. Le corpus annoté résultant de notre travail sera mis à disposition de la communauté.&lt;/p&gt;</description>
    </item>
    <item>
      <title>DocWare: Vers l&#39;entreposage et l&#39;analyse multidimensionnelle de documents.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.48/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.48/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;augmentation du nombre de documents numériques gérés par les entreprises n&amp;rsquo;a fait qu&amp;rsquo;accroître les difficultés d&amp;rsquo;exploitation des informations textuelles. Ces difficultés sont en grande partie liées aux volumes à manipuler, mais également à l&amp;rsquo;hétérogénéité des sources et aux normes de structuration des informations documentaires. Il devient alors nécessaire, voire indispensable, de disposer d&amp;rsquo;outils d&amp;rsquo;intégration rendant les informations utiles accessibles, permettant de les manipuler et de les analyser. A cette fin, nous proposons le concept d&amp;rsquo;entrepôt de documents permettant d&amp;rsquo;intégrer et d&amp;rsquo;organiser des informations hétérogènes. Ces informations peuvent alors être analysées selon plusieurs points de vue (analyse multidimensionnelle) afin d&amp;rsquo;en déduire de nouvelles informations ou connaissances.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Étude préliminaire à la recherche de photographies muséales en mobilité.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.rjc5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article étudie la problématique de l’indexation et de la recherche d’image dans&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper studies the problem of images indexing and retrieval related to museum&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation multi-critères et différentes approches de combinaison.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.353/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.353/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier s&amp;rsquo;inscrit dans la continuité de travaux sur l&amp;rsquo;indexation et la recherche d&amp;rsquo;in- formation menés au LIUPPA sur des critères géographiques. L&amp;rsquo;information géographique a trois composantes : le spatial, le temporel et le thématique. Notre équipe a déjà travaillé sur le spatial et le temporel de façon indépendante. Aujourd&amp;rsquo;hui nous cherchons à combiner ces différentes composantes. Pour cela nous proposons d&amp;rsquo;utiliser une approche statistique, réser- vée habituellement à l&amp;rsquo;analyse plein-texte d&amp;rsquo;un document, pour le spatial et le temporel. Cette approche sera qualifiée de u carroyage ». Toutefois nous cherchons aussi à extraire les liens sémantiques existants entre les informations géographiques. Pour cela nous étudions un autre type de combinaison, qualifiée d&amp;rsquo;u approche par motifs ».&lt;/p&gt;</description>
    </item>
    <item>
      <title>Mesurer la proximité entre corpus par de nouveaux méta-descripteurs.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.37/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.37/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Devant le nombre d&amp;rsquo;algorithmes de classification existants, trouver l&amp;rsquo;algorithme qui sera le plus adapté pour classer un corpus de documents est une tâche difficile. La méta- classification apparaît aujourd&amp;rsquo;hui très utile pour aider à déterminer, en fonction des expé- riences passées, quel devrait être l&amp;rsquo;algorithme le plus pertinent par rapport à notre corpus. L&amp;rsquo;idée sous jacente est que &amp;ldquo;si un algorithme s&amp;rsquo;est montré particulièrement adapté pour un cor- pus, il devrait avoir le même comportement sur un corpus assez similaire&amp;rdquo;. Dans cet article, nous proposons de nouveaux méta-descripteurs reposant sur les notions de similarités pour améliorer l&amp;rsquo;étape de méta-classification. Les expérimentations menées sur différents jeux de données réelles montrent la pertinence de nos nouveaux descripteurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>On Combining Text and MeSH Searches to Improve the Retrieval of MEDLINE documents.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.271/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.271/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;MEDLINE est le plus grand répertoire au monde de résumés biomédicaux. Il demeure le point de départ de toute recherche d&amp;rsquo;information pour beaucoup de biologistes malgré la disponibilité croissante de l&amp;rsquo;intégralité des articles sur le Web. Chaque entrée MEDLINE est indexée manuellement avec des termes MeSH et afin d&amp;rsquo;améliorer la recherche, les champs MeSH ont déjà été utilisés avec succès dans des techniques de upseudo relevance feedback » et d&amp;rsquo;expansion de requête. Néanmoins, ces expériences ont peu exploité la structure des champs MeSH. Cet article étudie l&amp;rsquo;impact de la structure des champs MeSH dans une méthode qui combine des recherches portant sur les champs de texte libre et les champs MeSH contenus dans les entrées d&amp;rsquo;un vaste sous-ensemble de MEDLINE. Les requêtes MeSH sont générées par la technique u Offer Weight » de Robertson. La méthode utilisée est évaluée avec l&amp;rsquo;ensemble standard de l&amp;rsquo;épreuve ad hoc de l&amp;rsquo;atelier génomique de TREC 2005. Les résultats montrent que notre approche améliore la recherche de manière significative.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Plateforme d&#39;étiquetage dynamique pour la fouille d&#39;opinion.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les plateformes sociales (Twitter, blogs, forums), vecteurs de la diversité des points de vue de la collectivité, constituent un vivier de données convoité pour la fouille d&amp;rsquo;opinion et l&amp;rsquo;analyse de sentiments. Dans ce cadre, les méthodes appliquées en classification n&amp;rsquo;apprennent souvent que des sorties relativement frustes : celles-ci se réduisent à une polarité ou à une gradation linéaire. Est-il possible d&amp;rsquo;apprendre des motifs plus riches avec un nombre raison- nable d&amp;rsquo;exemples ? Notre démarche est appliquée au ressenti à l&amp;rsquo;égard de marques. L&amp;rsquo;enjeu est d&amp;rsquo;analyser l&amp;rsquo;image de marque à l&amp;rsquo;aide d&amp;rsquo;un ensemble de traits lexicaux, structurés par leurs relations sémantiques. Pour prédire un tel motif par apprentissage supervisé, il est avant tout nécessaire de disposer d&amp;rsquo;un jeu de données étiquetées. Pour cela, nous avons mis en place une plateforme collaborative pour l&amp;rsquo;étiquetage de messages issus du web social en traits séman- tiques et sentiments. Afin d&amp;rsquo;optimiser les étiquetages, la plateforme est sous-tendue par des mécanismes dynamiques à double vocation : filtrer les messages non pertinents et restructurer la grille d&amp;rsquo;analyse spécifique à chaque marque au fur et à mesure des annotations.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information dans un corpus bruité (OCR).</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.271/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.271/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article désire mesurer la perte de performance lors de la recherche d&amp;rsquo;information dans une collection de documents scannés. Disposant d&amp;rsquo;un corpus sans erreur et de deux versions renfermant 5 % et 20 % d&amp;rsquo;erreurs en reconnaissance, nous avons évalué six modèles de recherche d&amp;rsquo;information basés sur trois représentations des documents (sac de mots, n-grammes, ou trunc-n) et trois enracineurs. Basé sur l&amp;rsquo;inverse du rang du premier document pertinent dépisté, nous démontrons que la perte de performance se situe aux environs de- 17 % avec un taux d&amp;rsquo;erreur en reconnaissance de 5 % et s&amp;rsquo;élève à u 46 % si ce taux grimpe à 20 %. La représentation par 4-grammes semble apporter une meilleure qualité de réponse avec un corpus bruité. Concernant l&amp;rsquo;emploi ou non d&amp;rsquo;un enracineur léger ou la pseudo-rétroaction positive, aucune conclusion définitive ne peut être tirée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche de microblogs : quels critères pour raffiner les résultats des moteurs usuels de RI ?</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.317/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.317/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Depuis quelques années, les services de microblogs, comme Twitter, attirent l&amp;rsquo;attention des internautes. Cet attrait peut s&amp;rsquo;expliquer par la facilité et la rapidité avec laquelle les internautes peuvent partager des informations, le plus souvent en temps réel. Les microbloggeurs, en parallèle de leur publication de microblogs, cherchent également souvent à collecter des informations récentes sur leurs derniers sujets d&amp;rsquo;intérêt. Trouver les meilleurs résultats pour un sujet demeure dépendant des caractéristiques des microblogs (comme par exemple la longueur très faible des messages, la qualité du langage utilisé, la fiabilité du diffuseur. . . ). Dans cet article, nous proposons d&amp;rsquo;évaluer l&amp;rsquo;impact de certains critères sur la qualité des résultats renvoyés sur un sujet donné. Nous considérons trois groupes de critères : ceux liés au contenu des microblogs, ceux liés à leur hypertextualité et enfin ceux liés aux auteurs des microblogs. Nos résultats expérimentaux utilisent la collection TREC Tweets 2011 et montrent l&amp;rsquo;intérêt de critères tels que l&amp;rsquo;hypertextualité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Regrouper des résultats SPARQL par comparaison de leurs contenus tels qu’ils sont agencés dans la base RDF interrogée.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une nouvelle approche permettant de regrouper les résultats d&amp;rsquo;une requête SPARQL selon leurs similitudes. Afin de comparer les résultats, l&amp;rsquo;originalité de notre approche est de considérer pour chaque résultat les données constituant ce résultat telles qu&amp;rsquo;elles sont présentes et agencées dans la base RDF interrogée. Nous ne nous limitons donc pas à comparer les résultats entre eux, mais nous les re-contextualisons dans la base où ils ont été sélectionnés afin de tenir compte non seulement des ressources des résultats mais aussi de leurs liaisons avec les autres ressources dans la base, c&amp;rsquo;est à dire leurs voisinages. À partir des résultats et de leurs voisinages, nous déterminons des motifs descriptifs communs permet- tant de grouper de manière hiérarchique les résultats par degré de similitude, offrant ainsi à l&amp;rsquo;utilisateur une navigation et une compréhension plus aisées des résultats.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Structure et proximité pour la recherche documentaire.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.373/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.373/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Notre étude compare les performances d&amp;rsquo;un système de recherche d&amp;rsquo;information basé sur la proximité des occurrences des termes de la requête dans les documents avec un système classique de modèle de langue avec lissage de Dirichlet et le modèle Okapi BM25 . Notre modèle basé sur la proximité calcule en chaque position du document une valeur d&amp;rsquo;autant plus grande que des occurrences de tous les termes de la requête sont proches de cette position. De plus pour le modèle à proximité nous testons dans le cas de documents structurés l&amp;rsquo;hypothèse que les termes apparaissant dans les titres doivent être considérés comme proches des positions de toute la section correspondant à ce titre.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Système de recherche d&#39;informations spatiales basé sur le croquis à main levée.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.337/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.337/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La quantité de données géographiques disponibles a considérablement augmenté ces dernières années. L&amp;rsquo;évolution du Web qui permet de partager et d&amp;rsquo;accéder à n&amp;rsquo;importe quel type d&amp;rsquo;information a encore augmenté cette disponibilité. Cependant, l&amp;rsquo;interrogation de données géographiques est souvent vue comme une opération difficile et coûteuse, car ces données ont des structures complexes et sont disponibles en différents formats et à différentes échelles. Récemment, des systèmes ont été développés pour permettre aux utilisateurs de dessiner ce qu&amp;rsquo;ils recherchent au lieu de traduire leurs demandes dans un langage d&amp;rsquo;interrogation textuelle. Ces systèmes essayent de combler le fossé entre l&amp;rsquo;utilisateur et ces données ; celui-ci peut se concentrer sur sa demande plutôt que sur la formulation de requête. Afin de faciliter ce processus, les données géographiques doivent être reformulées pour répondre à ce nouveau type d&amp;rsquo;interrogation. Ce papier présente un nouveau modèle de données géographiques comme base d&amp;rsquo;un système de recherche d&amp;rsquo;information géographique basé sur le croquis à main levée (Sketch).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Annotation automatique d’images: le cas de la déforestation</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper12/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper12/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;et article correspond à un état de l&amp;rsquo;art sur le thème de l&amp;rsquo;annotation automatique d&amp;rsquo;images d&amp;rsquo;observation de la terre pour la détection de la déforestation. Nous nous intéressons aux différents challenges que recouvre le domaine et nous présentons les méthodes de l&amp;rsquo;état de l&amp;rsquo;art puis les pistes de recherche que nous envisageons.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;utomatic image annotation : the case of deforestation. This paper aims to present the state of the art of the methods that are used for automatic annotation of earth observation image for deforestation detection. We are interested in the various challenges that the field covers and we present the state of the art methods and the future research that we are considering.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Applying a family of IR models to text description-based service retrieval.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.24/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.24/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans l&amp;rsquo;étude rapportée dans cet article, nous appliquons et étudions une famille de modèles de Recherche d&amp;rsquo;Information (RI) afin de traiter le problème de la recherche de services, dont la description correspond aux requêtes des utilisateurs exprimées sous forme libre. Ainsi, nous appliquons quatre modèles qui, au meilleur de notre connaissance, n&amp;rsquo;ont été appliqués dans aucune des approches existantes de RI pour la découverte de services. Les deux pre- miere sont basés sur des modèles à base de factorisation de matrices appliquée à l&amp;rsquo;indexation sémantique latente (Latent Semantic Indexing, LSI). Le troisième étend la recherche avec les termes extraits du lexique WordNet. Le dernier modèle étend également la requête, mais avec des termes extraits d&amp;rsquo;un thesaurus de co-occurrence généré automatiquement. Les résultats ex- périmentaux que nous avons obtenus montrent que le dernier modèle étudié surpasse les autres que ceux de l&amp;rsquo;état de l&amp;rsquo;art sur la découverte de services à base de RI.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Automatic annotation of incomplete and scattered bibliographical references in Digital Humanities papers.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.329/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.329/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;extraction d&amp;rsquo;informations bibliographiques depuis un texte non structuré demeure un probléme ouvert que nous abordons, via des approches d&amp;rsquo;apprentissage automatique, dans le domaine des Humanités Numériques. Nous présentons dans cet article le projet BILBO, soutenu par un Google Digital Humanities Award avec le soutien du projet ANR CAAS : constitution de 3 corpus de référence correspondant à trois localisations des références, élaboration d&amp;rsquo;un modéle d&amp;rsquo;annotation puis évaluation. Les champs aléatoires conditionnels (CRFs) sont utilisés pour l&amp;rsquo;annotation des références bibliographiques et des machines à vecteurs supports (SVMs) pour l&amp;rsquo;identification des références au sein du texte. De nombreuses expériences sont conduites afin de déterminer les meilleures propriétés devant être exploitées par les modèles numériques.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Clustering optimal de gènes fondé sur une mesure de similarité sémantique.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_73/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_73/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans de nombreux domaines d&amp;rsquo;application de l&amp;rsquo;analyse de données ou de la recherche d&amp;rsquo;information, il est utile de grouper de façon non supervisée des objets par similarité sans qu&amp;rsquo;il soit aisé de les représenter par des vecteurs de propriétés numériques. En biologie moléculaire, la similarité permet de capturer soit la structure complexe des objets (cas des molécules ou des séquences) soit la sémantique de leur description (cas des maladies ou des gènes). De nombreuses mesures de similarité ont été proposées mais une fois converties en dissimilarité en vue du clustering, ces mesures ne présentent pas forcément les bonnes propriétés d&amp;rsquo;une métrique. Le clustering d&amp;rsquo;objets pour lesquels on ne dispose que d&amp;rsquo;une matrice de dissimilarité requiert d&amp;rsquo;utiliser des méthodes adéquates. Nous proposons ici une évaluation comparative du clustering de gènes sur la base d&amp;rsquo;une mesure de similarité sémantique sur les termes de la Gene Ontology, IntelliGO. Nous nous appuyons sur quatre benchmarks que nous avons définis pour comparer les performances du clustering hiérarchique ascendant, du clustering C-means flou, et du clustering après plongement de la matrice de dissimilarité dans un espace Euclidien. Nous utilisons précisément une méthode de plongement qui tient compte du fait que la dissimilarité n&amp;rsquo;est pas une vraie métrique.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Construire et évaluer une application de veille pour l&#39;information sur les événements sismiques.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.287/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.287/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le développement d&amp;rsquo;applications opérationnelles de veille pour des domaines spéci- fiques nécessite l&amp;rsquo;intégration de nombreuses techniques et outils issus du champ de la recherche d&amp;rsquo;information et du traitement automatique des langues. Dès lors, un des défis présidant à une telle intégration est la prise en compte des limitations propres à chacune de ces techniques et outils en termes d&amp;rsquo;influence sur le résultat final du système. Plus précisément, nous pré- sentons dans cet article une application pour la surveillance des informations concernant les événements sismiques sur le Web. Nous nous attachons à présenter les différents composants nécessaires à une telle application, les solutions proposées pour ces différents composants et une évaluation indépendante de chacune de ces solutions ainsi qu&amp;rsquo;une analyse de leur influence sur le résultat global du système.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection de communautés multi-relationnelles dans les réseaux sociaux.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.29/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.29/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;explosion des réseaux sociaux a rendu indispensable leur analyse et leur exploration, notamment pour la détection des communautés. Plusieurs méthodes ont été proposées afin de détecter des composantes possédant des propriétés structurelles spécifiques en termes de graphe au détriment de l&amp;rsquo;aspect sémantique régissant les différents liens entres les entités du réseau. Dans cet article, nous présentons une nouvelle approche pour la détection de com- munautés dans les réseaux sociaux dont la principale originalité est la prise en considération aussi bien des liens structurels entre les entités que des attributs sémantiques les décrivant. Nous proposons tout d&amp;rsquo;abord d&amp;rsquo;exploiter les techniques de l&amp;rsquo;Analyse Relationnelle de Concepts pour modéliser les différentes interactions et nous introduisons par la suite une nouvelle mé- thode d&amp;rsquo;exploration, appelée &amp;lsquo;Req_Navigation&amp;rsquo;, pour l&amp;rsquo;identification des communautés multi- relationnelles. L&amp;rsquo;étude expérimentale menée sur une collection de données réelles a montré des résultats prometteurs et ouvre plusieurs perspectives.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Exploitation des signaux sociaux pour estimer la pertinence a priori d&#39;une ressource.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-14/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-14/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous proposons une approche de recherche d&amp;rsquo;information (RI) qui&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper we propose an information retrieval (IR) approach which takes into account the social content associated with a resource to measure its a priori relevance to a query. We show how these characteristics, which are of the form of actions (social signals) such as the number of &amp;rsquo;like&amp;rsquo; and &amp;lsquo;share&amp;rsquo;, can be combined to quantify social properties such as popularity and reputation. We propose to model these properties as a priori probabilities that we integrate into a language model. We evaluated the effectiveness of our approach on the IMDb dataset containing 32706 documents and their social characteristics collected from several social networks. Our experimental results are very promising and show the interest of integrating social properties in search model to enhance IR.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation de documents multimédia par réseaux d&#39;opérateurs.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.385/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.385/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le franchissement du fossé sémantique entre les descriptions au niveau signal et au niveau sémantique est le principal problème à résoudre pour l&amp;rsquo;indexation multimédia. Les ap- proches les plus avancées prennent en compte plusieurs types de descripteurs, plusieurs moda- lités et/ou le contexte pour améliorer la détection des concepts. Afin de maîtriser la complexité liée à l&amp;rsquo;intégration de données et de traitement hétérogènes que cela suppose, nous proposons une approche à base d&amp;rsquo;opérateurs organisés en réseaux flots de données. Un type unique de don- nées, les numcepts, et un type unique d&amp;rsquo;unités de traitements, les opérateurs, sont utilisés à tous les niveaux dans ces réseaux. Cette approche offre une grande flexibilité pour la conception des systèmes d&amp;rsquo;indexation et elle facilite les expérimentations sur les architectures correspondantes. Nous décrivons une instance de ce modèle et plusieurs numcepts et opérateurs. L&amp;rsquo;approche a été testée sur les corpus TRECVID 2004 et 2005. Nous avons implémenté 7 réseaux et étudié l&amp;rsquo;influence de variations sur la précision moyenne des concepts détectés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Organisation du contenu du Web selon la perspective des systèmes complexes adaptatifs.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.283/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.283/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le web continue à croître à une vitesse phénoménale. Trouver l&amp;rsquo;information pertinente sur le web reste toujours un grand défi. La large distribution, l&amp;rsquo;ouverture et la grande dynamique qui caractérisent le web, en font un système qui exhibe toutes les caractéristiques des systèmes complexes. Afin d&amp;rsquo;appréhender la complexité d&amp;rsquo;un tel système, il faudrait alors imaginer des mécanismes de maintenance, de filtrage et d&amp;rsquo;organisation de son contenu qui puissent prendre en compte sa dynamique évolutive et sa distribution. Intégrer des mécanismes d&amp;rsquo;auto- organisation est une perspective attractive qui répond à ces exigences. Cet article analyse le web selon la perspective des systèmes complexes adaptatifs (CAS). Il examine quelques comportements caractéristiques des CAS et montre que le web exhibe des comportements similaires. Cette analyse sera illustrée par un système d&amp;rsquo;organisation du contenu du web, adoptant la vision CAS et utilisant le paradigme multi-agents.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réordonnancement de réponses par transformation d&#39;arbres pour un système de question-réponse oral interactif.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.361/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.361/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les techniques traditionnelles de recherche d&amp;rsquo;information montrent des limites pour extraire certaines réponses précises contenues dans des documents. Cet article présente une méthode de recherche d&amp;rsquo;informations adaptée au contexte d&amp;rsquo;un système de question-réponse oral interactif en domaine ouvert. Cette méthode vise à améliorer la sélection des meilleures réponses. Nous proposons une approche consistant à mesurer un coût de transformation entre deux arbres textuels qui rend compte des reformulations possibles entre un texte décrivant l&amp;rsquo;in- formation recherchée (question) et un passage de document. Nous présentons ensuite une éva- luation de la méthode sur le corpus Clef et analysons les résultats mesurés. Nos perspectives présentent des voies d&amp;rsquo;amélioration et incluent l&amp;rsquo;exploitation des transformations d&amp;rsquo;arbres trou- vées par notre méthode pour fournir des informations à l&amp;rsquo;utilisateur sur le déroulement de la recherche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>REVISE, un outil d&#39;évaluation précise des systèmes questions-réponses.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.385/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.385/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Des campagnes d&amp;rsquo;évaluations sont organisées chaque année pour évaluer des systèmes de questions-réponses sur la validité des résultats fournis. Pour les équipes, il s&amp;rsquo;agit ensuite de réussir à mesurer la pertinence des stratégies développées ainsi que le fonctionnement des com- posants. À ces fi ns, nous décrivons un outil générique d&amp;rsquo;évaluation de type boîte transparente qui permet à un système produisant des résultats intermédiaires d&amp;rsquo;évaluer ses résultats. Nous illustrerons cette démarche en testant l&amp;rsquo;impact d&amp;rsquo;une nouvelle défi nition de la notion de focus.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Sélection de Caractéristiques pour le Filtrage de Spams.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.349/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.349/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La sélection des caractéristiques est une étape importante dans les systèmes de classification. Elle vise la réduction du nombre de caractéristiques tout en essayant de préserver ou d&amp;rsquo;améliorer la performance du classifieur utilisé. Dans cet article, nous proposons une démarche de sélection de caractéristiques, basée sur l&amp;rsquo;apprentissage automatique, dans le contexte du filtrage de spams qui est considéré comme une tâche de catégorisation de textes. Notre approche consiste à évaluer individuellement chacun des attributs décrivant les messages textuels afin d&amp;rsquo;ordonner les caractéristiques puis en sélectionner un sous-ensemble suite à une évaluation de performances effectuée en utilisant des classifieurs bayésiens (Naive Bayes) ou de type SVM (Support Vector Machines). Nous avons entrepris une comparaison expérimentale en testant plusieurs combinaisons qui correspondent à des variations des types de classifieurs, des stratégies de sélection (forward/backward) et des méthodes d&amp;rsquo;évaluation individuelle des attributs, et nous avons obtenu des résultats intéressants. En effet, dans certains cas, nous avons abouti à une réduction significative du nombre de caractéristiques, accompagnée d&amp;rsquo;une amélioration des performances.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Using BLSTM for Interpretation of 2D Languages - Case of Handwritten Mathematical Expressions.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons une extension à l’utilisation classique des réseaux de type BLSTM&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this work, we study how to extend the capability of BLSTM networks to process&lt;/p&gt;</description>
    </item>
    <item>
      <title>Connaître la Couleur des Objets pour Segmenter les Images et Améliorer la Recherche d&#39;Images sur le Web.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.401/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.401/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les résultats des moteurs actuels de recherche d&amp;rsquo;images sur le web sont très bruités, c&amp;rsquo;est-à-dire que quand nous cherchons un objet précis, un grand nombre d&amp;rsquo;images retournées par le système ne concerne pas la requête : environ 50% de ces images sont hors-sujet. Dans cet article, nous expliquons comment utiliser la connaissance de la couleur des objets pour trouver l&amp;rsquo;objet recherché dans les images, et nous proposons également deux méthodes pour connaître automatiquement la couleur d&amp;rsquo;un objet, afin que le traitement dans son ensemble puisse être complètement automatique. Les résultats obtenus montrent que cette méthode permet de réduire le bruit dans les images retournées d&amp;rsquo;environ 20% si nous gardons 25% des images, et fournit en même temps une segmentation automatique de l&amp;rsquo;objet qui pourrait servir par exemple pour le groupement ou pour l&amp;rsquo;apprentissage d&amp;rsquo;objets.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection d’influenceurs dans des médias sociaux</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper14/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper14/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;es influenceurs ont la capacité d&amp;rsquo;avoir un impact sur d&amp;rsquo;autres individus lorsqu&amp;rsquo;ils interagissent avec eux. Détecter les influenceurs permet d&amp;rsquo;identifier les quelques individus à cibler pour toucher largement un réseau. Il est possible d&amp;rsquo;analyser les interactions dans un média social du point de vue de leur structure ou de leur contenu. Dans nos travaux de thèse, nous abordons ces deux aspects. Nous présentons d&amp;rsquo;abord une évaluation de différentes mesures de centralité sur la structure d&amp;rsquo;interactions extraites de Twitter puis nous analysons l&amp;rsquo;impact de la taille du graphe de suivi sur la performance de mesures de centralité. Nous abordons l&amp;rsquo;aspect linguistique pour identifier le changement d&amp;rsquo;avis comme un effet de l&amp;rsquo;influence depuis les messages d&amp;rsquo;un forum.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Différentes interprétations d&#39;un modèle de RI à base d&#39;inclusion graduelle.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.295/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.295/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Récemment, un modèle théorique de RI à base d’inclusion graduelle a été proposé&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Recently, a theoretical fuzzy IR system, based on gradual inclusion measures, has been proposed (Bosc et al., 2008b). In this model, derived from the division of fuzzy relations, the gradual inclusion of a query in a document is modeled by a fuzzy implication. In previous papers, we have shown that, under some assumptions, this model can be seen as a Vector Space Model. This paper also studies other interpretations of our fuzzy IR models based on gradual inclusions. It is shown that the fuzzy models can be interpreted as language models for IR. The links with logical models to IR are also recalled. More generaly, this paper discusses the links between these models, shown from the angle of our fuzzy models.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Fusion de systèmes pour la recherche de passages dans des textes.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.295/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.295/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;es systèmes de recherche d&amp;rsquo;information (RI) présentent une grande variabilité dans la liste des documents qu&amp;rsquo;ils retrouvent en réponse à une même requête. Dans cet article nous étudions l&amp;rsquo;apport de la fusion des résultats des systèmes pour la RI. Ainsi, nous utilisons les résultats obtenus sur un ensemble de 50 requêtes par différents systèmes qui ont participé à la tâche TREC de sélection de phrases pertinentes. Nous étudions la fusion par union et par intersection des résultats des systèmes, et nous montrons que la fusion aveugle apporte des améliorations peu sensibles. Nous étudions également une fusion plus &amp;quot; intelligente &amp;quot; des systèmes qui prend en considération la difficulté des requêtes et la variabilité des réponses des systèmes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Identification de phénomènes dans l&#39;analyse d&#39;interactions humaines: Les traces d&#39;interactions humaines, un nouveau domaine d&#39;application pour la RI.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.397/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.397/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;étude socio-cognitive des interactions humaines médiatisées par ordinateur passe&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The socio-cognitve study of human computer-mediated interactions can be done through the analysis of increasingly larger and complex corpora composed of audio-video recording and interaction logÞles. In this article, we present and model the querying of such corpora with IR methods. We show that these models afford the transformation of certain inter- action analysis research questions into known IR problems. We describe the results of our Þrst implementations of RI algorithms for querying interaction corpora.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation conceptuelle par propagation. Application à un corpus d&#39;articles scientifiques liés au cancer.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-15/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-15/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Si la recherche d&amp;rsquo;information conceptuelle a montré son efficacité dans différents contextes, elle nécessite de disposer de corpus de ressources indexées avec des concepts issus d&amp;rsquo;une ontologie de domaine. Or le processus d&amp;rsquo;indexation est souvent lourd et fastidieux et des solutions doivent être imaginées pour assister les experts dans cette tâche. Nous avons étendu notre méthode de propagation d&amp;rsquo;indexations vectorielles au cas de l&amp;rsquo;indexation con- ceptuelle, ce qui nous permet de suggérer à l&amp;rsquo;utilisateur une indexation conceptuelle pour une nouvelle ressource, lorsque celle-ci est positionnée sur une carte sémantique. Pour cela nous maximisons une fonction objectif PHVXUDQW OD VLPLODULWp HQWUH O¶indexation proposée et celles des documents présents dans le voisinage du document à annoter. Cette méthode est appli- quée à l&amp;rsquo;indexation de publications scientifiques dans le domaine du cancer.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle de langue par type de doxel pour l&#39;indexation de documents structurés.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.361/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.361/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons dans cet article, une utilisation d&amp;rsquo;un modèle de langue pour une re- cherche d&amp;rsquo;information sur des documents structurés. Nous présentons également un usage de ressources exogènes et endogènes pour l&amp;rsquo;indexation et les requêtes. Les ressources endogènes sont les syntagmes extraits du corpus lui même, et les ressources exogènes proviennent de liens (forward links) extraits de Wikipedia. Nous montrons qu&amp;rsquo;un modèle de langue avec un lissage de type Dirichlet est plus adapté à la recherche d&amp;rsquo;information sur des documents structurés qu&amp;rsquo;un lissage par interpolation linéaire de Jelinek-Mercer. Finalement, nous utilisons cette corres- pondance probabiliste dans un schéma de type Fetch and Browse, allant du document complet vers des parties du document (doxels). Ces propositions nous ont permis d&amp;rsquo;obtenir 4 mesures en tête de l&amp;rsquo;évaluation officielle de la campagne INEX 2009, sur les huit mesures proposées cette année.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Quels problèmes pour la recherche d’information médicale au Mali ?</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;entreprise Bupa a effectué une enquête entre juin et juillet 2010 dans 12 pays à travers le monde. Selon cette enquête au moins trois répondants sur cinq faisaient des recherches d&amp;rsquo;information relatives à leur santé sur Internet. La plupart de ces personnes cherchent en majorité des informations sur une maladie ou les symptômes d&amp;rsquo;une maladie puis sur les médicaments. Dans la plupart des cas, un moteur de recherche général est utilisé. Une autre étude menée aux Etats-Unis en 2013 montre que 75% des interrogés ayant déjà consulté internet pour effectuer un diagnostic n&amp;rsquo;ont pas ressenti le besoin de vérifier les sources. La recherche d&amp;rsquo;information dans le domaine médical est confrontée à des enjeux qui lui sont propres : la qualité et la fiabilité des résultats sont cruciales, et ils doivent tenir compte des variations de connaissances (et de terminologies) des professionnels de la santé face aux patients. L&amp;rsquo;application de la RI au domaine médical permet toutefois, en la restreignant à une langue de spécialité, de disposer de ressources terminologiques et sémantiques (ex : UMLS) permettant des traitements riches. L&amp;rsquo;objectif de cet article est de lister les principaux problèmes de recherche qui se posent dans le contexte de la RI médicale sur internet. Chaque problème est illustré par un scénario d&amp;rsquo;usage.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Répondre à des questions à réponses multiples : premières expérimentations.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_26/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_26/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Une des difficultés majeures des systèmes de question-réponse concerne l&amp;rsquo;extraction des bonnes réponses depuis les documents sélectionnés par un moteur de recherche. En effet, il est souvent difficile de procéder à un recoupement des candidats réponses, notamment dans le cas des questions qui attendent plusieurs réponses. Afin de nous focaliser sur les condi- tions d&amp;rsquo;extraction et de recoupement de réponses multiples, nous avons construit un corpus en u conditions idéales » pour une dizaine de questions à réponses multiples. Nous mesurons en- suite l&amp;rsquo;apport de plusieurs techniques d&amp;rsquo;extraction et de validation des réponses et comparons les résultats obtenus sur ce corpus par deux systèmes de question-réponse : celles du système de question-réponse FIDJI (orienté vers les campagnes d&amp;rsquo;évaluation) et celles de Citron spécialisé dans l&amp;rsquo;extraction et le recoupement de réponses multiples.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Thésaurus distributionnels pour la recherche d&#39;information et vice-versa.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.79/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.79/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les thésaurus distributionnels sont utiles à de nombreuses tâches du Traitement Auto- matique des Langues. Dans cet article, nous abordons les problèmes de leur construction et de leur évaluation sous l&amp;rsquo;angle de la recherche d&amp;rsquo;information. Deux contributions sont proposées. D&amp;rsquo;une part, en poursuite des travaux initiés par (Claveau et al., 2014), nous montrons com- ment les techniques de RI peuvent être utilisées avec succès pour construire ces thésaurus. Au moyen d&amp;rsquo;une évaluation directe par comparaison avec des lexiques de référence et au travers de plusieurs expérimentations, nous montrons que les résultats obtenus par certains modèles de RI dépassent les performances des systèmes état-de-l&amp;rsquo;art. D&amp;rsquo;autre part, nous utilisons la RI comme cadre applicatif pour proposer une évaluation indirecte des thésaurus produits. Là encore, cette évaluation valide l&amp;rsquo;approche. Mais surtout, elle permet de mettre en regard les performances obtenues sur cette tâche avec celles des évaluations directes utilisées dans la littérature. Les différences constatées remettent en cause en partie ces pratiques d&amp;rsquo;évaluation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle de contexte documentaire par doxels pondérés - Application à un modèle de langue contextuel pour la recherche de documents stucturés.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.341/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.341/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article porte sur la recherche de parties de documents appelées doxels. Nous défi- nissons la notion de contexte documentaire d&amp;rsquo;un doxel, en utilisant deux éléments : 1) un lissage de type Dirichlet sur des doxels, et 2) une interprétation du contexte d&amp;rsquo;un doxel par des pro- pagations du contenu des autres doxels de contexte. Nous montrons que cette interprétation de contexte documentaire est exprimable par des combinaisons du contenu intrinsèque lissé et des contenus propagés, non lissés, des doxels. Cette expression est donc compatible avec des im- plantations à base de fichiers inverses. Nous avons étudié différentes propagations sur le corpus INEX 2009, en constatant systématiquement une forte augmentation des résultats en contexte, par rapport à une approche par modèle de langue de référence hors contexte.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation de la couleur pour l&#39;extraction de tableaux dans des images de documents.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les tableaux sont des éléments complexes qui peuvent perturber l’analyse automatique de la structure d’une image de document. Dans cet article, nous présentons une méthode fondée sur l’alternance de couleurs de lignes pour extraire des tableaux colorés à bordures non matérialisées. Les résultats expérimentaux obtenus à partir d’une base d’images de documents à mise en page variée, permettent de valider l’intérêt de cette approche.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Tables are complex elements that can disturb the automatic analysis of the structure of an image of a document. In this article, we present a method based on the alternation of the color of lines to extract color tables that are not materialized by physical rulings. Experimental results, obtained on a dataset of document images with various layouts, enable to validate the interest of this approach.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vues et mises à jour de données semi-structurées : une analyse de dépendances.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.369/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.369/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans ce papier nous étudions le problème classique de l&amp;rsquo;impact d&amp;rsquo;une mise à jour sur une vue, dans le cadre de données semi-structurées. Nous faisons les hypothèses suivantes: (i) le document source est modélisé par un arbre ordonné étiqueté par des symboles d&amp;rsquo;arité variable, (ii) une vue V est une requête arbre dont l&amp;rsquo;évaluation sur le document source fournit la vue partielle du document souhaitée (iii) une classe de mises à jour C est également donnée par une requête arbre sélectionnant les noeuds à modifier. Nous étudions alors le problème suivant: étant donné une requête de vue V et une classe de mise à jour C est-il possible de détecter si la vue V est indépendante de toute mise à jour q de C ? Nous montrons que le problème est en général NP-difficile. Nous exhibons une condition suffisante évaluable en temps polynomial assurant l&amp;rsquo;indépendance d&amp;rsquo;une vue V par rapport à une classe de mises à jour C ainsi que certaines sous-classes de requêtes de vues pour lesquelles le problème devient polynomial.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprendre à ordonner la frontière de crawl pour le crawling orienté.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-16/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-16/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le crawling orienté consiste à parcourir le Web au travers des hyperliens en orientant son parcours en direction des pages pertinentes. Pour cela, ces crawlers ordonnent leurs téléchargements suivant une stratégie d&amp;rsquo;ordonnancement. Dans cet article, nous proposons d&amp;rsquo;ap- prendre cette fonction d&amp;rsquo;ordonnancement à partir de données annotées. Une telle approche nous permet notamment d&amp;rsquo;intégrer un grand nombre de traits hétérogènes et de les combiner. Nous décrivons une méthode permettant d&amp;rsquo;apprendre une fonction d&amp;rsquo;ordonnancement indépen- dante du domaine pour la collecte thématique de documents. Nous évaluons notre approche sur de &amp;ldquo;longs&amp;rdquo; crawls de 40 000 documents sur 15 thèmes différents issus de l&amp;rsquo;OpenDirectory, et montrons que notre méthode permet d&amp;rsquo;améliorer la précision de près de 10% par rapport à l&amp;rsquo;al- gorithme Shark Search. Enfin, nous discutons les avantages et inconvénients de notre approche, ainsi que les pistes de recherche ouvertes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Approche lexicale de la simplification automatique de textes médicaux</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper20/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper20/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;otre travail traite de la simplification automatique de textes. Ce type d&amp;rsquo;application vise à rendre des contenus difficiles à comprendre plus lisibles. À partir de trois corpus comparables du domaine médical, d&amp;rsquo;un lexique existant et d&amp;rsquo;une terminologie du domaine, nous procédons à des analyses et à des modifications en vue de la simplification lexicale de textes médicaux. L&amp;rsquo;alignement manuel des phrases provenant de ces corpus comparables fournit des données de référence et permet d&amp;rsquo;analyser les procédés de simplification mis en place. La substitution lexicale avec la ressource existante permet d&amp;rsquo;effectuer de premiers tests de simplification lexicale et indique que des ressources plus spécifiques sont nécessaires pour traiter les textes médicaux. L&amp;rsquo;évaluation des substitutions est effectuée avec trois critères : grammaticalité, simplification et sémantique. Elle indique que la grammaticalité est plutôt bien sauvegardée, alors que la sémantique et la simplicité sont plus difficiles à gérer lors des substitutions avec ce type de méthodes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Coûts de distance d&#39;édition pour la Recherche d&#39;Information XML.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.357/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.357/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;information structurée (RIS) sur documents de type XML permet de retourner des parties de documents répondant plus précisément aux besoins des utilisateurs. Ces derniers, parfois exprimés sous forme de requêtes structurées, peuvent tout comme les documents être représentés sous forme d&amp;rsquo;arbres. Notre approche utilise ces représentations arborescentes et mesure la pertinence des éléments XML au travers de la distance d&amp;rsquo;édition. Cette dernière se définit comme la somme des coûts minimaux d&amp;rsquo;opérations de suppression, d&amp;rsquo;insertion et de substitution permettant de rendre les arbres isomorphes. Attribuer un coût à ces opérations a donc une conséquence directe sur la qualité de l&amp;rsquo;appariement. C&amp;rsquo;est ce problème que nous nous proposons d&amp;rsquo;étudier dans cet article. Nous avons évalué notre approche au travers de la tâche SSCAS d&amp;rsquo;INEX 2005 et sûr la tâche DATACENTRIC d&amp;rsquo;INEX 2010. Les résultats que nous obtenons montrent son intérêt.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Evolution des profils d&#39;entités à l&#39;aide d&#39;un modèle de langue sensible au temps.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.40/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.40/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Retrouver des informations importantes en temps sur une entité nommée particulière est un réel challenge. En effet, cela implique d&amp;rsquo;être capable de détecter l&amp;rsquo;entité dans les documents, mais en plus d&amp;rsquo;être capable de qualifier d&amp;rsquo;importante, au regard de l&amp;rsquo;entité, l&amp;rsquo;information véhiculée par le document. Dans cet article, nous formalisons un modèle de langue sensible au temps, et nous l&amp;rsquo;utilisons dans les profils d&amp;rsquo;entités. Nous mettons en place un ensemble de méta critères qui utilisent pleinement l&amp;rsquo;amélioration du profil d&amp;rsquo;entité. L&amp;rsquo;utilisation de méta critères nous assure d&amp;rsquo;avoir un système non dépendant de l&amp;rsquo;entité et donc place notre approche dans le domaine du semi-supervisé. Nous évaluons notre approche sur les données de la campagne d&amp;rsquo;évaluation TREC sur la tâche KBA 2013 et nous obtenons de bonnes performances et des conclusions intéressantes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Mesure de similarité pondérée dans l&#39;espace 2D: Application à la reconnaissance de visages.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.373/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.373/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose une nouvelle mesure de similarité pondérée basée sur des matrices pour la classification et la reconnaissance de visages. Le calcul de distances s&amp;rsquo;effectue entre deux matrices caractéristiques obtenues par deux méthodes bidimensionnelles à savoir l&amp;rsquo;Analyse en Composantes Principales (ACP2D) et l&amp;rsquo;Analyse Discriminante Linéaire (ADL2D). Les poids de pondération utilisés sont l&amp;rsquo;inverse des valeurs propres de la matrice de covariance des matrices de visages triés dans l&amp;rsquo;ordre décroissant. Quant à la stratégie de classification des images test, elle est l&amp;rsquo;affectation au plus proche voisin. Pour évaluer les performances de la distance proposée, des tests de simulations ont été menés sur la base de visages internationale ORL. Cette dernière a été partitionnée en deux sous bases de 200 images chacune, l&amp;rsquo;une pour l&amp;rsquo;apprentissage et l&amp;rsquo;autre pour le test. Les résultats montrent l&amp;rsquo;efficacité et la supériorité de la distance pondérée vis-à-vis les distances de Yang et Frobenius.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle d&#39;espaces de communautés basé sur la théorie des ensembles d&#39;approximation dans un système de filtrage hybride.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.303/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.303/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de filtrage ont pour but de distribuer des informations de façon personnalisée aux utilisateurs, tout en s&amp;rsquo;adaptant en permanence au besoin en information de chacun. Dans un système de filtrage hybride s&amp;rsquo;appuyant sur le filtrage collaboratif, la production de recommandations se base sur des communautés d&amp;rsquo;utilisateurs qui sont généralement formées conformément au seul critère de proximité des évaluations des utilisateurs sur les recommandations reçues dans le passé. De plus ces communautés restent généralement implicites. Nous proposons un modèle d&amp;rsquo;espaces de communautés multicritères et explicites, et des mesures se basant sur la théorie des ensembles d&amp;rsquo;approximation pour analyser la dépendance entre les critères de formation des communautés. Le modèle d&amp;rsquo;espaces de communautés permet de diversifier les recommandations qui peuvent émaner de communautés variées. Les mesures permettent de comparer des critères entre eux afin de déterminer une priorité entre les critères dans la tâche d&amp;rsquo;amélioration du positionnement des utilisateurs dans les communautés.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Modèle de recherche contextuelle orientée contenu pour un corpus de documents XML.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.377/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.377/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre de corpus de documents XML, la recherche par mots-clés reste le moyen le plus utilisé pour un utilisateur dont le besoin d&amp;rsquo;information est vague, ou encore parce qu&amp;rsquo;il ne connaît pas précisément la structure des documents. Dans cet article nous présentons notre approche de recherche de noeuds pertinents à une requête orientée contenu &amp;lsquo;Content Only&amp;rsquo; composée de simples mots clés dans un corpus de documents XML en prenant en compte la pertinence contextuelle. Le processus de recherche que nous proposons repose sur une méthode de propagation de pertinence.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Proposition de cadres d&#39;évaluation adaptés à un système de RI personnalisé.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.409/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.409/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;évaluation d&amp;rsquo;un système de recherche d&amp;rsquo;information (RI) personnalisé consiste prin- cipalement à mesurer ses performances. Les cadres d&amp;rsquo;évaluation classiques en RI basés sur les approches orientées laboratoire méritent d&amp;rsquo;être étendues et révisées vu que le contexte de recherche de l&amp;rsquo;utilisateur n&amp;rsquo;est pas considéré dans le protocole d&amp;rsquo;évaluation et les col- lections de test. Nous présentons dans ce papier des cadres d&amp;rsquo;évaluation adaptés à un sys- tème de RI personnalisé. Ces cadres sont basés sur l&amp;rsquo;enrichissement des collections TREC par des contextes/profi ls utilisateur simulés. Plus précisément, un protocole issu de TREC adhoc consiste à construire des profi ls utilisateur à partir des sessions de recherche simulées par les domaines d&amp;rsquo;intérêts prédéfi nis dans TREC adhoc. Le protocole issu de TREC H ARD consiste à construire le profi l à partir des sessions de recherche simulées par les sujets des requêtes de la collection. Les résultats obtenus confi rment la stabilité de la performance de notre modèle de RI personnalisé selon les cadres proposés sur des collections de test différentes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information dans les bases d&#39;images de manuscrits anciens par une caractérisation multiéchelle des écritures.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.413/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.413/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;-Dans cet article, nous proposons une approche originale de la caractérisation des écritures&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The aim of this scientific work is to propose an original approach of writers characterization based on the handwriting multi scale decomposition into two main features: curvature and orientation. For every shape point, those two dimensions are extracted by a Curvelets analysis before getting joined together in a compact signature. Curvelets are a specialised version of anisotropic wavelets which are well adapted to the representation of discontinuities along shapes. This is a new geometric multi scale transform for which  atoms  are  indexed  by  their  position,  scale  and  orientation. They  integrate  the  concept  of directionnality and allow a sparse representation of images containing objects with many borders, as it is the case of handwritings. For each image, this characterization is synthesized in a compact and single signature used in our information retrieval system dedicated to medieval and humanistic writings. This tool provides very promising results to the use of experts in histories, literatures and palaeographers.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réponse à des tests de compréhension.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_84/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_84/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons une adaptation d&amp;rsquo;un système de questions-réponses existant pour une tâche de réponse à des questions de compréhension de textes. La méthode proposée pour sélectionner les réponses correctes repose sur la reconnaissance d&amp;rsquo;implication textuelle entre les hypothèses et les textes. Les spécificités de cette méthode sont la généra- tion d&amp;rsquo;hypothèses par réécriture syntaxique, et l&amp;rsquo;évaluation de plusieurs critères de distance, adaptés pour gérer des variantes de termes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Solving Concept mismatch through Bayesian Framework by Extending UMLS Meta-Thesaurus.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.311/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.311/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La plupart des systèmes de Recherche d&amp;rsquo;Information sont basés sur la correspondance exacte entre termes, même si de nombreuses recherches portent sur le problème de la corres- pondance entre variantes de termes issus de mots synonymes, d&amp;rsquo;une formulation multilingue, ou sur l&amp;rsquo;utilisation de termes experts très précis. Résoudre ces problèmes nécessite une analyse particulière pour combler l&amp;rsquo;écart entre l&amp;rsquo;information contenue dans les documents et le besoin de l&amp;rsquo;utilisateur. Dans ce travail, nous proposons une solution par enrichissement d&amp;rsquo;un méta- thésaurus. Nous proposons d&amp;rsquo;exploiter les relations entre les concepts du thesaurus, mais aussi de les enrichir à travers l&amp;rsquo;analyse des termes associés aux concepts. La correspondance est effectuée en utilisant une dérivation de concepts à travers un réseau Bayésien. Une validation de notre proposition est réalisée sur la collection de test ImageCLEFmed 2005 avec l&amp;rsquo;aide de la ressource UMLS 2005.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Time-efficient Logo Spotting using Text/Non-text Separation as Preprocessing and Approximate Nearest Neighbor Search.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-26/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-26/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans les systèmes de vision par ordinateur et plus particulièrement les systèmes de recherche&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Searching for the most similar matches to high dimensional feature vectors is the most&lt;/p&gt;</description>
    </item>
    <item>
      <title>Towards Incremental Learning with Deep Convolutional Networks</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les réseaux de neurones profonds sont des modèles d&amp;rsquo;apprentissage puissants. Cependant, ils requièrent du temps et des ressources importantes pour être entraînés. Nous proposons d&amp;rsquo;appliquer une approche d&amp;rsquo;apprentissage incrémentale pour entrainer ces réseaux en utilisant les informations présententes dans des modèles pré-entrainés. Nous souhaitons pour cela étudier les relations entre les architectures des réseaux, les catégories à apprendre, la quantité de données disponibles et la &amp;rsquo;nature&amp;rsquo; de ces données. Nous présentons nos résultats sur l&amp;rsquo;effet des variations des architectures des réseaux en accord avec les données. Nous étudions l&amp;rsquo;entrai- nement de modèles dans des cas où le pouvoir discriminant d&amp;rsquo;un modèle doit être augmenté, y compris avec le même jeu de données sur lequel ils ont déjà été entraînés. Les résultats vont vers une architecture spécifique pour chaque tâche. Ce travail est réalisé dans le contexte de réseau convolutionnel et les performances sont mesurées en terme de précision pour la classification d&amp;rsquo;image&lt;/p&gt;</description>
    </item>
    <item>
      <title>Annotation collective dans le contexte RI : définition d&#39;une plate-forme pour expérimenter la validation sociale.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.385/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.385/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Avec l&amp;rsquo;avènement du Web participatif, les lecteurs de documents électroniques sont de plus en plus actifs. En particulier, des systèmes d&amp;rsquo;annotation leur permettent de commen- ter, de reformuler, de critiquer, etc. des passages de documents. Les approches de RI qui ne considéraient jusqu&amp;rsquo;alors que le contenu des documents tendent actuellement à exploiter cette dimension participative du Web. L&amp;rsquo;activité des lecteurs (annotations et débats suscités) peut par exemple améliorer rappel et précision des résultats de RI. Dans des travaux précédents, nous suggérions de discriminer les annotations sur leur u validité sociale » (degré de confirmation exprimé par le groupe dans le débat associé) avant de les prendre en compte dans les processus de RI. Cet article décrit une plate-forme d&amp;rsquo;expérimentation visant à comparer les algorithmes de validation sociale proposés avec la perception humaine du consensus. Cette expérimentation toujours en cours a mobilisé 173 participants, les données recueillies sont en cours d&amp;rsquo;analyse.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification de questions par traduction.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_103/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_103/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous nous intéressons à la classification de questions pour un système de questions-réponses en français. Faisant le constat d&amp;rsquo;un manque de corpus annoté en français, nous nous interrogeons sur la possibilité d&amp;rsquo;exploiter les corpus anglais existants, en utilisant des traducteurs automatiques. Nous avons mené une série d&amp;rsquo;expériences en faisant varier le sens de traduction des corpus et les attributs fournis au classifieur. Les résultats mon- trent qu&amp;rsquo;il est possible de s&amp;rsquo;approcher des performances monolingues en traduisant le corpus d&amp;rsquo;apprentissage.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification multi-label à grande dimension pour la détection de concepts médicaux</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper22/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.rjcpaper22/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;ans ce papier, nous présentons une méthode pour associer de façon automatique des concepts à des images. Nous nous focalisons plus particulièrement sur des images médicales à annoter avec des concepts UMLS. Nous avons développé deux modèles de transfert d&amp;rsquo;apprentissage à partir des réseaux CNN VGG19 et ResNet50 . Nous avons utilisé des modèles avec des techniques simples et que nous avons optimisés pour l&amp;rsquo;apprentissage. Les résultats que nous avons obtenus en utilisant les données de la tâche ImageCLEF 2017 sont encourageants et comparables à ceux des autres participants.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Factorisation en matrices non négatives pour le filtrage collaboratif.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.315/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.315/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de filtrage collaboratif (FC) aident un utilisateur à trouver l&amp;rsquo;information qui l&amp;rsquo;intéresse à partir des jugements d&amp;rsquo;autres utilisateurs. Ces systèmes sont utilisés princi- palement par des sites Web pour faire des recommandations. En général, les systèmes de FC demandent aux utilisateurs de fournir des jugements sur des articles de leur choix, exprimés sous la forme d&amp;rsquo;une note, un réel positif borné. L&amp;rsquo;objectif d&amp;rsquo;un système est alors de compa- rer les goûts des utilisateurs afin de prédire les notes qui n&amp;rsquo;ont pas été fournies au système. Nous proposons un nouvel algorithme pour effectuer ces prédictions, basé sur la méthode de réduction dimensionnelle appelée factorisation en matrices non négatives, connue en analyse d&amp;rsquo;images et de textes. Nous testons l&amp;rsquo;approche sur une tâche de recommandation de films, et montrons qu&amp;rsquo;elle possède des performances comparables à l&amp;rsquo;état de l&amp;rsquo;art. De plus, la méthode présente les avantages d&amp;rsquo;être très simple à implanter, de faible complexité, et permet d&amp;rsquo;identifier des groupes de films dont les notes sont corrélées entre les utilisateurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Fusion d&#39;informations pour l&#39;indexation de photos.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.425/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.425/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une méthode d&amp;rsquo;indexation de photos appliquée à la reconnaissance de personnes dans des photos personnelles afin de permettre à un utilisateur de les retrouver à partir de requêtes correspondant à des identifiants de personnes. Cette méthode utilise la fusion d&amp;rsquo;index-FUSINDEX- issus de l&amp;rsquo;analyse de la photo elle-même et de l&amp;rsquo;analyse des com- mentaires textuels et oraux qui lui ont été associés. Ces analyses sont effectuées par différents moteurs d&amp;rsquo;indexations dédiés qui sont intégrés au sein d&amp;rsquo;un système global d&amp;rsquo;indexation et de recherche de photos. Le cadre théorique utilisé par la méthode de fusion définie est celui des fonctions de croyance afin de gérer au mieux l&amp;rsquo;incertitude et l&amp;rsquo;imprécision des moteurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Généralisation des opérateurs de dérivation de Galois en recherche d&#39;information basée sur l&#39;analyse formelle de concepts.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.373/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.373/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;information basée sur l&amp;rsquo;analyse formelle de concepts repose généra- lement sur l&amp;rsquo;utilisation de la structure de treillis des concepts formels. Les noeuds de ce treillis (i.e. les concepts formels) peuvent être interprétés comme des paires hréponse,requêtei. A ce jour, la quasi-majorité des travaux existant en ce sens utilisent l&amp;rsquo;opérateur de dérivation de Ga- lois classique (opérateur de suffisance). Il s&amp;rsquo;avère que cet opérateur se restreint à l&amp;rsquo;expression de requêtes conjonctives. Pour palier à ces limites, nous proposons de généraliser l&amp;rsquo;utilisation d&amp;rsquo;opérateurs de dérivation en s&amp;rsquo;inspirant de la théorie des possibilités. Nous montrons que ces nouveaux opérateurs permettent de considérer aussi bien des requêtes conjonctives que dis- jonctives ainsi que la négation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation spatiale et temporelle basée sur un principe de &#34;tuilage&#34; : contribution à la recherche d&#39;information géographique dans des documents textuels faiblement structurés.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.327/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.327/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La plupart des moteurs de recherche nécessitent, pour fonctionner, une indexation préalable des documents. Certaines de ces approches sont limitées compte tenu de contextes particuliers ou de la forme particulière de l&amp;rsquo;information recherchée. Notre contribution porte sur la construction d&amp;rsquo;index adaptés à la facette spatiale et temporelle spécifique au contexte de l&amp;rsquo;information géographique tout en permettant une compatibilité avec les outils de recherche génériques. Ce travail présente une stratégie générique d&amp;rsquo;indexation basée sur le principe du u tuilage ». Elle s&amp;rsquo;applique aussi bien sur la composante spatiale que temporelle mais peut également être utilisée sur la composante thématique. Nous évaluons ensuite l&amp;rsquo;apport de cette approche à la recherche d&amp;rsquo;information géographique.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Localisation automatique de champs de saisie sur des images de formulaires couleur par isomorphisme de sous-graphe.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une approche permettant la localisation de champs de saisie&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper presents an approach for spotting textual fields in colored forms. We&lt;/p&gt;</description>
    </item>
    <item>
      <title>Prédiction de la polysémie pour un terme biomédical.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.52/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.52/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La polysémie est la caractéristique d&amp;rsquo;un terme à avoir plusieurs significations. La prédiction de la polysémie est une première étape pour l&amp;rsquo;Induction de Sens (IS), qui permet de trouver des significations différentes pour un terme, ainsi que pour les systèmes d&amp;rsquo;extraction d&amp;rsquo;information. En outre, la détection de la polysémie est importante pour la construction et l&amp;rsquo;en- richissement de terminologies et d&amp;rsquo;ontologies. Dans cet article, nous présentons une nouvelle approche pour prédire si un terme biomédical est polysémique ou non, avec l&amp;rsquo;objectif à long terme d&amp;rsquo;enrichir les ontologies biomédicales après avoir désambiguïser les termes candidats. Cette approche est basée sur l&amp;rsquo;utilisation de techniques de méta-apprentissage, plus précisé- ment sur des méta-descripteurs. Dans ce contexte, nous proposons la définition de nouveaux méta-descripteurs, extraits directement du texte, et d&amp;rsquo;un graphe de co-occurrences des termes. Notre méthode donne des résultats très satisfaisants, avec une exactitude et F-mesure de 0.978.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Profil utilisateur dans les réseaux sociaux: Etat de l’art</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les réseaux sociaux sont de plus en plus utilisés; les utilisateurs y échangent des in- formations et fournissent des éléments sur leur profil. Ces données peuvent être utilisées pour modéliser un individu selon les activités qu&amp;rsquo;il réalise sur le réseau social: il s&amp;rsquo;agit du profil de l&amp;rsquo; utilisateur. Ces profils peuvent ensuite être analysés et exploités selon le domaine d&amp;rsquo;applica- tion. Par exemple, les publicités proposées sur les réseaux sociaux sont différentes pour chaque utilisateur selon les préférences de ces derniers. Cet article correspond à un état de l&amp;rsquo;art sur les informations constituant un profil utilisateur ainsi que sur la représentation des profils. Nous indiquerons également les pistes de recherche pour nos travaux dans ce domaine.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;entités nommées dans les journaux radiophoniques par contextes hiérarchique et syntaxique.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.421/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.421/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier présente une approche pour la recherche d&amp;rsquo;entités nommées dans des transcriptions radiophoniques. Nous allons utiliser les structures des entités nommées afin d&amp;rsquo;améliorer le taux de leur reconnaissance. En effet, l&amp;rsquo;espace des entités peut être représenté par une structure hiérarchique (arbre). Ainsi, un concept peut être vu comme un noeud dans l&amp;rsquo;arbre, et une entité comme un parcours dans la structure de l&amp;rsquo;espace. Nous allons montrer l&amp;rsquo;apport de cette représentation en utilisant le modèle des Champs Aléatoires Conditionnels (CAC). La comparaison de notre approche avec la méthode des Modèles de Markov Cachés (MMC) montre une amélioration de la reconnaissance en utilisant les CAC Combinés. Nous montrons également l&amp;rsquo;impact de l&amp;rsquo;utilisation des informations a priori dans le processus en incluant les informations syntaxiques des transcriptions comme nouveau contexte.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation du Web pour la reconnaissance de mots manuscrits hors vocabulaire.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-17/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-17/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de reconnaissance de l&amp;rsquo;écriture manuscrite s&amp;rsquo;appuient sur des diction- naires prédéfinis obtenus à partir de corpus d&amp;rsquo;entraînement. La taille de ces dictionnaires ré- sulte d&amp;rsquo;un compromis entre le taux de reconnaissance des mots du vocabulaire (DV) et la cou- verture du dictionnaire. Si la taille est limitée, beaucoup de mots hors vocabulaire (HV) restent non reconnus. Pour améliorer la reconnaissance des mots HV, sans augmenter le dictionnaire, nous introduisons une étape supplémentaire qui exploite des ressources Web. Après une pre- mière classification des séquences des caractères en DV-HV, Wikipédia est utilisée pour créer des dictionnaires dynamiques pour chaque mot HV. Un décodage final est effectué sur le diction- naire dynamique afin de déterminer le mot le plus probable pour la séquence HV. Nous validons notre approche avec des expériences menées sur la base RIMES. Les résultats montrent que des améliorations sont obtenues par rapport à la reconnaissance avec un dictionnaire statique.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers un modèle de langue mixte concepts-mots pour la recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.387/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.387/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La majorité des modèles de langue appliqués à la recherche d&amp;rsquo;information repose sur l&amp;rsquo;hypothèse d&amp;rsquo;indépendance des mots apparaissant dans les documents et les requêtes. Plus précisément, ces modèles sont estimés à partir des mots simples sans considérer les éventuelles relations sémantiques et conceptuelles. Pour pallier ce problème, deux grandes approches ont été explorées : la première intègre des dépendances d&amp;rsquo;ordre surfacique entre les mots (bi-grammes, bi-termes), et la seconde repose sur l&amp;rsquo;utilisation des ressources sémantiques pour capturer les dépendances entre les mots. Le modèle de langue que nous présentons dans cet article s&amp;rsquo;inscrit dans la seconde approche. Nous proposons de lever la contrainte d&amp;rsquo;indépendance des mots par une représentation des documents et requêtes intégrant les concepts qu&amp;rsquo;ils recèlent.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Amélioration d&#39;un corpus de requêtes à l&#39;aide d&#39;une méthode non-supervisée.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_101/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_101/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une méthode d&amp;rsquo;amélioration d&amp;rsquo;un corpus de requêtes par regroupe- ment des mots qui sont graphiquement similaires. L&amp;rsquo;approche utilisée est basée sur une distance d&amp;rsquo;édition normalisée et sur des propriétés statistiques distributionnelles; elle ne s&amp;rsquo;appuie sur aucune base de connaissances. Cette méthode a été développée pour résoudre un problème in- dustriel: l&amp;rsquo;amélioration d&amp;rsquo;un corpus de libellés de produits diversement orthographiés. Le but de l&amp;rsquo;algorithme est de retrouver l&amp;rsquo;écriture la plus compréhensible pour l&amp;rsquo;humain comme pour la machine (par ex. système de requêtes).&lt;/p&gt;</description>
    </item>
    <item>
      <title>BicMIN : Développement et validation d’une nouvelle méthode de classification croisée des séquences de protéines</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les biologistes proposent des classifications de protéines, la classification non supervisée de séquences de protéines en groupes fonctionnels appelés aussi familles permettent de valider ces classifications. Ce problème est très important en bioinformatique, particulièrement depuis l&amp;rsquo;avènement des méthodes à grande échelle qui produisent une énorme quantité de séquences à analyser. Nous avons conçu, implémenté et validé une nouvelle méthode de bi-regroupement basée sur la présence de courts motifs conservés dans les séquences biologiques. Cette méthode applique alternativement plusieurs cycles de classification. BicMIN est un algorithme de bi-regroupement qui résulte de ce travail de recherche. Il produit plusieurs résultats intéressants: une partition et une hiérarchie des protéines, une collection de motifs qui soulignent les régions intéressantes pour des analyses plus approfondies. BicMIN a été validé sur plusieurs données qui représentent des caractéristiques de la classification non supervisée. Notre algorithme donne de meilleur résultats en le comparant avec autres méthodes de classification déjà publiées.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Exploitation des connaissances d&#39;UMLS pour la recherche d&#39;information médicale. Vers un modèle bayésien d&#39;indexation.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.443/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.443/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;information à base de connaissances est largement étudiée, mais avec peu de succès. Dans cet article, nous étudions l&amp;rsquo;impact de l&amp;rsquo;exploration d&amp;rsquo;une base de connais- sance, nommée méta thésaurus UMLS pour la recherche d&amp;rsquo;information médicale. D&amp;rsquo;abord, l&amp;rsquo;in- dexation par concepts d&amp;rsquo;UMLS extrait dans des textes ne montre qu&amp;rsquo;une légère amélioration de MAP(Mean Average Precision) par rapport à l&amp;rsquo;indexation par termes. Nous intégrons ensuite les étiquettes sémantiques des concepts dans une indexation multicouche qui donne des résul- tats encourageants pour la collection ImageCLEF 2006. Pourtant, nous notons un problème de rappel dans les cas où le concept de la requête est plus général que celui des documents. Afin de résoudre ce problème, nous proposons un modèle basé sur un réseau bayesien pour capturer les liens générique-spécifique entre concepts de la requête et ceux des documents.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation de blocs extraits de pages Web en utilisant le rendu visuel.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.393/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.393/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente un modèle d&amp;rsquo;indexation de pages Web basé sur leur rendu visuel. Dans ce modèle, une page Web n&amp;rsquo;est plus considérée comme un tout, mais comme la combinai- son d&amp;rsquo;un ensemble de blocs dont chacun porte sa sémantique propre. L&amp;rsquo;indexation d&amp;rsquo;une page Web est réalisée en deux étapes : (1) construction d&amp;rsquo;un arbre hiérarchique de blocs visuels, en s&amp;rsquo;appuyant sur la disposition visuelle des blocs de la page (2) indexation textuelle de chaque bloc par un vecteur de termes et tenant compte de l&amp;rsquo;importance de ces blocs et de l&amp;rsquo;indexation des blocs contenants, contenus ou voisins.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Inférence semi-automatique et interactive de règles sans vérité terrain.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-15/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-15/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La conception de systèmes de reconnaissance de documents à partir de documents&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Dealing with non annotated documents for the design of a document recognition&lt;/p&gt;</description>
    </item>
    <item>
      <title>Interface de visualisation avec retour de pertinence pour la recherche d&#39;images.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.329/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.329/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le domaine de la recherche d&amp;rsquo;images est encore un problème ouvert en comparaison avec les résultats obtenus dans le domaine de la recherche de textes. C&amp;rsquo;est encore plus vrai en ce qui concerne la recherche d&amp;rsquo;images par le contenu sémantique. Dans cet article, nous proposons une nouvelle technique de recherche d&amp;rsquo;images permettant, par la communication avec l&amp;rsquo;utilisateur, d&amp;rsquo;extraire de façon rapide et conviviale son objectif. Ici nous proposons une interface graphique 2D adaptée au problème de la recherche d&amp;rsquo;images permettant une commu- nication bidirectionnelle : du système vers l&amp;rsquo;utilisateur pour visualiser les résultats courants de la recherche et de l&amp;rsquo;utilisateur vers le système pour qu&amp;rsquo;il fournisse des informations de type retour de pertinence pour rafiner sa requête. Le retour de pertinence est uniquement sous forme de validation d&amp;rsquo;images résultats (ou exemples positifs). Cette approche a été implémentée et testée sur une base de données de 1000 images. Les résultats préliminaires sont prometteurs. Une comparaison avec une interface traditionnelle est montrée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Introduction de la sémantique d&#39;un document sous le modèle de langage.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.433/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.433/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La plupart des systèmes de recherche d&amp;rsquo;information  classiques se basent sur une indexation par termes simples. Cependant, ces derniers délivrent beaucoup de résultats en réponse aux requêtes des utilisateurs. Ceci est du en partie au fait que le contenu sémantique d&amp;rsquo;un document (ou d&amp;rsquo;une requête) ne peut pas être capturé précisément par un simple ensemble de mots clés indépendants. Deux directions sont explorées pour incorporer la sémantique dans les modèles de langage. La première se base sur l&amp;rsquo;exploitation des liens entre termes tout en utilisant une même unité d&amp;rsquo;indexation. La seconde se base sur l&amp;rsquo;utilisation d&amp;rsquo;unités d&amp;rsquo;indexation plus  complexes en plus de l&amp;rsquo;utilisation de termes simples. Dans ce papier est détaillée l&amp;rsquo;approche que nous proposons pour incorporer la dimension sémantique de document, et qui rentre dans le cadre de la seconde direction.&lt;/p&gt;</description>
    </item>
    <item>
      <title>MAD : une plateforme mobile pour l&#39;annotation de document vers la classification.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-17/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-17/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Aujourd&amp;rsquo;hui, l&amp;rsquo;incroyable explosion de l&amp;rsquo;acquisition mobile d&amp;rsquo;images ou de documents parait sans limite. Bien qu&amp;rsquo;il soit facile de les partager sur les réseaux sociaux ou sur le cloud, il est encore très difficile de les classer automatiquement, de les trier ou de rechercher à l&amp;rsquo;inté- rieur de cette base de connaissance. Pour répondre à ce défi, nous devons d&amp;rsquo;abord proposer une annotation automatique pertinente pour pouvoir utiliser par la suite une recherche lexicale ro- buste. C&amp;rsquo;est l&amp;rsquo;objectif de cet article que de proposer une plate-forme mobile pour l&amp;rsquo;annotation de document automatique, claire, efficace et rapide qui permet d&amp;rsquo;envisager une recherche en texte clair. Notre approche repose sur une nouvelle méthode d&amp;rsquo;annotation automatique de do- cuments basée sur la reconnaissance de zones saillantes comme le logo. Les résultats montrent la pertinence de l&amp;rsquo;approche, nous obtenons une moyenne rappel de 80,6 % et une précision de 100%. La précision (100%) met en évidence la robustesse de l’approche que nous proposons.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Points d&#39;intérêt dans les vidéos HDR - Premiére évaluation différentielle de la quantité et de la qualité des points d&#39;intérêt spaciaux et spatio-temporels obtenus sur des vidéos classiques et HDR.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.389/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.389/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La HDR (High Dynamic Range) permet de représenter des images d&amp;rsquo;une manière analogue à la représentation de notre système de vision et de manière plus complexe que dont nous disposons à l&amp;rsquo;heure actuelle sur notre ordinateur. Cet article propose d&amp;rsquo;analyser le comportement des extracteurs de points d&amp;rsquo;intérêt spatiaux et spatio-temporels lors de leur utilisation sur des vidéos HDR en les comparant avec leur utilisation sur des vidéos classique afin de déterminer l&amp;rsquo;influence des informations supplémentaires apportées par la HDR. Cette étude permet ainsi de vérifier si les détecteurs de points peuvent être utilisés directement dans leur expression habituelle ou s&amp;rsquo;il est nécessaire de les modifier pour s&amp;rsquo;adapter à cette nouvelle forme de représentation des images.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information orientée contenu dans les documents XML par agrégation partielle des sources de pertinence.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.401/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.401/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Représentation sémantique de questions pour interroger le Web sémantique.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.80/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.80/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les bases de connaissances du Web sémantique sont généralement représentées sous&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The knowledge base of the semantic Web are often represented by RDF triple repository that form a graph. It requires to use a dedicated language as SPARQL for interrogating them, that is generally not known by non-expert users. Moreover, it also require to know the knowledge base schema. To overcome these problems, the development of question answering systems in natural language is currently growing. In this paper, we propose a new method for the semantic analysis of questions, based on graph transformations, using very general con- straints on the request structure, and that keeps ambiguities that are solved globally at the final step by interrogating the knowledge base. We also developed a method for dealing with lexical gap for identifying databse relations based on WordNet. We obtain good results on relation identification, and the global system show promising results.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle Bayésien pour l&#39;Agrégation des documents XML.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.335/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.335/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous nous intéressons à la recherche agrégée dans des documents structurés XML. Pour cela, nous proposons un modèle de recherche d&amp;rsquo;information structurée basé sur les réseaux bayésiens. Les relations de dépendances entre requête-termes d&amp;rsquo;indexa- tion et termes d&amp;rsquo;indexation-éléments sont quantifiées par des mesures de probabilité. Dans ce modèle, la requête de l&amp;rsquo;utilisateur déclenche un processus de propagation pour trouver des éléments. Ainsi, au lieu de récupérer une liste d&amp;rsquo;éléments potentiellement (ou partiellement) pertinents vis-à-vis la requête, notre objectif est de rassembler dans un agrégat des éléments pertinents, non-redondants et complémentaires susceptibles de mieux répondre à la requête. Nous avons évalué notre approche sur une collection de documents XML issus d&amp;rsquo;INEX 2005 et avons présenté quelques résultats expérimentaux mettant en évidence l&amp;rsquo;impact de l&amp;rsquo;agrégation de tels éléments.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Alignement des ontologies : Utilisation de WordNet et une nouvelle mesure structurelle.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.401/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.401/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;interopérabilité sémantique entre sources d&amp;rsquo;information hétérogènes est une problématique importante du fait du nombre croissant de sources d&amp;rsquo;information disponibles sur le web. L&amp;rsquo;utilisation des ontologies est une voie très prometteuse pour permettre l&amp;rsquo;interopérabilité, seulement les ontologies eux même peuvent être hétérogènes. L&amp;rsquo;alignement des ontologies est le noyau de cette interopérabilité, cependant la génération automatique des correspondances entre deux ontologies est d&amp;rsquo;une extrême difficulté qui est dû aux divergences (conceptuelle, habitudes, etc.) entre communautés différentes de développement des ontologies. Ce travail est une proposition d&amp;rsquo;un algorithme d&amp;rsquo;alignement de deux ontologies de même domaine en utilisant différentes techniques, en particulier nous utilisons WordNet et nous introduisons une nouvelle mesure de similarité structurelle entre deux entités de deux ontologies déférentes qui est basée sur la position structurelle des entités à comparer au sein de leurs ontologies.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Expertise et système de recherche d&#39;informations en dialogue naturel : vers une considération des connaissances utilisateur.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.335/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.335/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier présente le principe général d&amp;rsquo;un agent rationnel dialoguant qui prend en compte le profil utilisateur afin d&amp;rsquo;adapter ses réactions. Sur la base de la théorie de l&amp;rsquo;interaction nous proposons de modéliser les connaissances de l&amp;rsquo;utilisateur sur le domaine de recherche. Dans un second temps, des règles de comportement de l&amp;rsquo;agent sont mises en oeuvre sur la base de résultats expérimentaux en ergonomie cognitive. La prise en compte du modèle utilisateur est illustrée pour le cas d&amp;rsquo;une recherche sur Internet.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Filtering and Ranking for Social Media Monitoring.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_21/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_21/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La veille sur les média sociaux est aujourd&amp;rsquo;hui une activité commune parmi le person- nel de relations publiques et de communication, qui doit surveiller autour d&amp;rsquo;entités, projets et produits. Cette tâche n&amp;rsquo;est pas facile car 1) l&amp;rsquo;information se trouve sur plusieurs média diffé- rents et 2) les mots clés nécessaires sont souvent ambigus. Ce papier adresse la classification et le trie de résultats provenants de média sociaux. Les évaluations avec un corpus expérimental prouve l&amp;rsquo;éfficassité de la classification et aussi du gain en performance avec le trie. Les deux approches dépassent les techniques conventionnelle.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Identification Semi-Automatique de Mots-Germes pour l’Analyse de Sentiments et son Intensité</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le but d&amp;rsquo;exploiter les opinions dans les tweets, cet article présente une classification à partir du sentiment contenu au sein des tweets. Nous présentons une méthode d&amp;rsquo;identifi- cation de nouveaux mots-germes. Ils sont utilisés pour la prédiction de l&amp;rsquo;intensité de sentiments des mots en co-occurrence avec ces mots-germes. Ensuite, le calcul de similarités entre sen- timents est appliqué en utilisant: la mesure de la similarité entre deux mots et l&amp;rsquo;utilisation de plongement de mots (e.g. word2vec, GloVE) couplé à la mesure cosinus. Les résultats montrent l&amp;rsquo;importance de l&amp;rsquo;utilisation de mots-germes adaptés aux tweets, ainsi que la taille et le prétrai- tement de corpus. Pour conclure, nous avons obtenu les meilleurs résultats grâce à l&amp;rsquo;application de la méthode utilisant le plongement de mots couplée à la mesure cosinus.&lt;/p&gt;</description>
    </item>
    <item>
      <title>La recherche d&#39;information évolutive dans des documents de type encyclopédique : l&#39;apport de techniques linguistiques.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.449/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.449/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous présentons la notion d&amp;rsquo;information évolutive : le développement de ce concept s&amp;rsquo;inscrit dans le cadre d&amp;rsquo;un projet de recherche industriel visant la recherche automatique de segments textuels nécessitant une mise à jour de l&amp;rsquo;information dans un but éditorial. Pour répondre à cet objectif nous faisons l&amp;rsquo;hypothèse de la nécessité d&amp;rsquo;associer des techniques issues de la recherche d&amp;rsquo;information à des techniques linguistiques.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this article we present the concept of evolving information : the development of this concept lies within the scope of an industrial research project aiming at the automatic search for textual segments requiring an update of information with a leading aim. To meet this aim we make the assumption of the need for associating techniques resulting from the search for information linguistic techniques.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Quels facteurs de pertinence pour la recherche de produits ecommerce ?</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.12/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.12/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Un moteur de recherche e-commerce vise à fournir un accès rapide et efficace à des produits qui correspondent aux besoins et aux préférences de l&amp;rsquo;utilisateur parmi une liste de produits similaires ou étroitement liés. Nous avons participé à la campagne d&amp;rsquo;évaluation u Living Lab for Information Retrieval » qui proposait une tâche de recherche de produits évaluée par des utilisateurs réels lors de scénarios de recherche réelle sur un site de e-commerce. L&amp;rsquo;évaluation expérimentale a montré des résultats prometteurs de notre modèle. Dans ce papier, nous proposons une analyse des fichiers logs issus de notre modèle afin d&amp;rsquo;identifier des facteurs d&amp;rsquo;efficacité liés à la requête et aux produits. L&amp;rsquo;objectif de cette étude est d&amp;rsquo;ouvrir des pistes de recherche pour la formalisation de modèles de recherche de produits.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information médicale pour le patient: Impact de ressources terminologiques.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.65/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.65/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le droit d&amp;rsquo;accès au dossier clinique par les patients est inscrit dans le code de Santé Publique. Cependant, ce contenu reste difficile à comprendre. Nous proposons une expérience, où les requêtes des patients sont utilisées pour retrouver les documents pertinents. Nous util- isons le moteur de recherche Indri, basé sur le modèle statistique de la langue, et des ressources sémantiques. L&amp;rsquo;accent est mis sur la variation terminologique (e.g. synonymes, abréviations) pour faire le lien entre la langue des experts et des patients. Différentes combinaisons de ressources et du paramétrage de Indri sont testées, essentiellement à travers l&amp;rsquo;expansion des requêtes. Notre système montre jusqu&amp;rsquo;à 0,7660 de P@10 et 0,6793 de NDCG@10.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Représentation par graphe de mots manuscrits dans les images pour la recherche par similarité.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-18/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-18/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans ce papier, nous proposons une nouvelle approche de la recherche de mots par similarité reposant sur une structure de graphes intégrant des informations sur la topologie, la morphologie locale des mots ainsi que des informations contextuelles dans le voisinage de&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Effective information retrieval on handwritten document images has always been a challenging task. In this paper, we propose a novel handwritten word spotting approach based on graph representation. The presented model comprises both topological and morphological signatures of handwriting. Skeleton-based graphs with the Shape Context labeled vertexes are established for connected components. Each word image is represented as a sequence of graphs. In order to be robust to the handwriting variations, an exhaustive merging process based on DTW alignment results introduced in the similarity measure between word images. With respect to the computation complexity, an approximate graph edit distance approach using bipartite matching is employed for graph matching. The experiments on the George Washington dataset and the marriage records from the Barcelona Cathedral dataset demonstrate that the proposed approach outperforms the state-of-the-art structural methods.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Sélection adaptative de Services de Recherche d&#39;Information web par l&#39;analyse du besoin et du comportement de l&#39;utilisateur.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.395/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.395/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre de travaux de recherche sur la modélisation du besoin et du comporte- ment de l&amp;rsquo;utilisateur, nous décrivons une approche de sélection de Services de Recherche d&amp;rsquo;In- formation (SRI) web adaptés au besoin de l&amp;rsquo;utilisateur. Un système expérimental intégrant une modélisation de l&amp;rsquo;utilisateur par un profil représentant ses centres d&amp;rsquo;intérêt, une modélisation du comportement par un mécanisme de récupération des interactions utilisateurs et une base de SRI généralistes et verticaux, est présenté. Nos axes de recherche portent sur la construction d&amp;rsquo;un modèle de sélection de SRI à partir de caractéristiques issues de la littérature et du profil utilisateur. La technique envisagée pour apprendre notre modèle repose sur la mise en oeuvre d&amp;rsquo;un apprentissage par renforcement utilisant la théorie des processus de décision markoviens.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Survey of the Adequate Descriptor for Content-Based Image Retrieval on the Web: Global versus Local Features.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.445/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.445/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;On reconnait actuellement, dans les systèmes de recherche d&amp;rsquo;image par contenu, deux méthodes pour la description du contenu des images : à travers des attributs locaux ou à travers des attributs globaux. Dans ce papier, nous proposons deux méthodes pour la recherche d&amp;rsquo;image qui sont basées sur la similitude visuelle. La première caractérise les images par des attributs globaux, alors que la seconde est basée sur les attributs locaux. Concernant le descripteur global, les attributs sont calculés sur l&amp;rsquo;ensemble de l&amp;rsquo;image, alors que pour le descripteur local, les attributs sont définis sur les régions de l&amp;rsquo;image. L&amp;rsquo;objectif de ce papier est d&amp;rsquo;évaluer les performances des attributs locaux contre les attributs globaux pour la recherche des images Web par contenu.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation de la théorie des graphes et de la distance d&#39;édition pour la recherche d&#39;information sur documents XML.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.349/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.349/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;information sur documents semi-structurés de type XML (RIS) permet de renvoyer à l&amp;rsquo;utilisateur des granules documentaires se focalisant sur les besoins exprimés. La requête et les documents structurés pouvant être vus comme des hiérarchies d&amp;rsquo;éléments imbriqués, nous considérons que leur proximité structurelle peut être évaluée au travers de la similarité entre leurs arborescences respectives. Dans ce cadre, nous proposons un modèle de RIS combinant au calcul de score sur le contenu une mesure de similarité structurelle basée sur la distance d&amp;rsquo;édition (le coût minimal d&amp;rsquo;opérations pour transformer un arbre en un autre). Nous propageons et combinons les scores ainsi obtenus en prenant en compte le voisinage de chacun des noeuds dans l&amp;rsquo;arborescence de nos arbres document. Nous avons évalué notre approche au travers de la tâche SSCAS de la campagne d&amp;rsquo;évaluation INEX 2005 et nos premiers résultats montrent l&amp;rsquo;intérêt d&amp;rsquo;une telle approche.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers un modèle de Recherche d&#39;Information Sociale pour l&#39;accès aux ressources bibliographiques.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.403/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.403/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Adaptation du modèle de langue pour le tri des réponses dans les BD.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.28/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.28/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;information sur le web est de plus en plus extraite depuis des bases de données (BD) où les langages d&amp;rsquo;interrogation sont basés sur une recherche exacte. L&amp;rsquo;utilisateur se trouve confronté au problème de réponses nombreuses lorsque sa requête est peu sélective. Pour remédier à ce problème, plusieurs approches ont été proposées, à l&amp;rsquo;instar de celles utilisant les techniques de relaxation des requêtes. D&amp;rsquo;autres travaux proposent de classifier les résultats. Une autre classe d&amp;rsquo;approches, au quelle on s&amp;rsquo;intéresse, suggère l&amp;rsquo;adaptation des techniques de la recherche d&amp;rsquo;information (RI) pour trier les résultats dans les BD. On propose dans cet article, une adaptation du modèle de langue de la RI pour trier les tuples retournés selon leur score de pertinence vis-à-vis la requête. Ce score est évalué par un modèle de langue bi-gramme qui combine, à travers un lissage par interpolation, les probabilités d&amp;rsquo;occurrence des valeurs des attributs dans l&amp;rsquo;ensemble des tuples retournés ainsi que dans la BD. Nous avons évalué l&amp;rsquo;efficacité de notre approche sur une table contenant&lt;/p&gt;</description>
    </item>
    <item>
      <title>Aide à l&#39;interprétation de documents juridiques - une approche centrée utilisateur.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.457/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.457/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous présentons un projet de recherche en cours visant à améliorer les interactions d&amp;rsquo;utilisateurs de différentes catégories professionnelles avec un système d&amp;rsquo;information dédié au droit du transport et de la logistique. L&amp;rsquo;objectif vise à concevoir et à mettre au point un environnement numérique de travail (ENT) destiné à un public professionnel (entreprises de la filière logistique, juristes, risk managers, assureurs, avocats, &amp;hellip;) et non professionnel (usagers ou salariés des transports). Après avoir posé la question de l&amp;rsquo;appropriation des contenus dans le cadre des documents numériques, nous décrirons les spécificités de notre corpus de travail. Nous placerons alors notre projet dans un cadre théorique actuellement novateur au sein des sciences cognitives, celui de l&amp;rsquo;énaction. Ceci nous amènera à proposer une approche résolument centrée utilisateur dans la conception de l&amp;rsquo;ENT. Nous terminerons par une description des spécifications du futur ENT, qui privilégie une démarche interprétative dans la formulation/reformulation de requêtes, ainsi que la représentation graphique des données.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Annotation de vidéos par paires rares de concepts.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-18/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-18/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La détection d’un concept visuel dans les videos est une tâche difficile, spécialement&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Single visual concept detection in videos is a hard task, especially for infrequent concepts or for those difficult to model. This question becomes even more difficult in the case of concept pairs. Two main directions may tackle this problem: 1) combine the predictions of their corresponding detectors in a way that is widely used in information retrieval, or 2) build super- vised learners for these pairs of concepts by generating annotations based on the occurrences of the two individual concepts. Each of these approaches have advantages and drawbacks. The major problem with the second method is the need of a set of annotated samples, especially for the positive class. If there are some concepts which are infrequent, this scarcity is increasing even more for pairs formed by their combinations. On the other hand, there may be two frequent concepts but they co-occur rarely conjointly in the same document. Some studies suggested to overcome this problem by harvesting samples from the web, but this solution is expensive in terms of time and money. In this work, we compare the two approaches without using any exter- nal resources. Our evaluation was carried in the context of the concept pair detection subtask of the TRECVID 2013 semantic indexing (SIN) task, and the results showed that in the case of videos, if we do not use external information resources, the approaches which combine the two concepts detectors can be more efficient than learning based methods, in contrast to what was shown previously in the case of still images. The described methods outperform the best official&lt;/p&gt;</description>
    </item>
    <item>
      <title>Automatic relevant Source Discovery over the Internet based on user profile.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.401/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.401/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La rapide croissance d’Internet ces dernières années a rendu difficile la découverte&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The enormous growth of the Web in recent years has made difficult the discovery of new sources of interest on a given topic, even thanks to an existing set of relevant sources. To address this problem, we introduce an approach to provide users with new relevant sources of information by exploiting their needs. It aims at combining a personalized crawler with a collaborative filtering system. We study the interest of exploiting the user profile during the crawling process in order to avoid collecting and indexing all available Web documents. We also discuss issues and the development of such a system.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Étude préliminaire de reconnaissance d’écriture sur des documents historiques</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce travail s&amp;rsquo;intéresse à l&amp;rsquo;extraction d&amp;rsquo;informations dans les registres comptables de la Comédie-Italienne du XVIII e siècle. Ces derniers renferment des informations précieuses pour des chercheurs en sciences humaines et sociales qui travaillent sur l&amp;rsquo;acculturation des acteurs italiens de cette époque. L&amp;rsquo;extraction d&amp;rsquo;informations, dans des documents anciens non encore étudiés, est un processus long et complexe qui demande une expertise à chaque étape : détection et segmentation en blocs, lignes ou mots, extraction de caractéristiques, reconnaissance d&amp;rsquo;écri- ture manuscrite. Les réseaux de neurones récurrents, de type BLSTM, avec un décodage CTC constituent une des méthodes les plus prometteuses en reconnaissance d&amp;rsquo;écriture, pour réaliser l&amp;rsquo;étiquetage d&amp;rsquo;une séquence donnée en entrée et produire un résultat de reconnaissance. Cet article présente une étude préliminaire de l&amp;rsquo;utilisation de ce type de réseau de neurones pour une première tâche : la reconnaissance des titres des pièces de théâtre, dans des documents historiques multilingues (français et italien) utilisant un vocabulaire fermé et essentiellement composé d&amp;rsquo;entités nommées.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Expansion de requêtes pour la recherche d&#39;information multilingue.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.405/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.405/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Exploitation des contributions des usagers liées au social bookmarking pour améliorer la Recherche d&#39;Information.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.367/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.367/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les moteurs de recherche communs exploitent le contenu des documents qu&amp;rsquo;ils indexent. Or, les internautes créent également des données explicites (tags, annotations, commentaires, notes, données de géoréférencement, etc.) et implicites (clics, logs, etc.) qu&amp;rsquo;il semble utile de prendre en compte pour améliorer l&amp;rsquo;indexation. Nos travaux concernent actuellement deux problématiques. Premièrement, comment analyser les bookmarks sociaux pour en extraire les centres d&amp;rsquo;intérêts des individus et leurs tendances tout en prenant en compte la dimension temporelle? Cette analyse permettrait de mieux les modéliser pour personnaliser leur recherche d&amp;rsquo;information ou leur recommander de l&amp;rsquo;information, par exemple. Deuxièmement, comment indexer des photos géoréférencées présentes sur des plateformes de partage afin de mieux les valoriser?&lt;/p&gt;</description>
    </item>
    <item>
      <title>L&#39;intégrale de Choquet discrète pour l&#39;agrégation de pertinence multidimensionnelle.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_64/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_64/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans ce papier, nous nous intéressons à étudier le problème de l&amp;rsquo;agrégation multi- critères dans le domaine de la recherche d&amp;rsquo;information (RI). Nous proposons une nouvelle ap- proche basée sur l&amp;rsquo;intégrale de Choquet pour l&amp;rsquo;agrégation de pertinence multidimensionnelle. La principale originalité de cet opérateur, outre sa capacité à modéliser des interactions entre les différentes dimensions de pertinence, est sa capacité à généraliser de nombreuses fonctions d&amp;rsquo;agrégation classiques. L&amp;rsquo;évaluation de l&amp;rsquo;efficacité de notre approche est effectuée dans une tâche de recherche de tweets, où les critères conjointement utilisés sont, la pertinence théma- tique, l&amp;rsquo;autorité et la fraîcheur. Les résultats expérimentaux obtenus sur la collection de test fournie par la tâche Microblog de TREC 2011 montrent la pertinence de notre proposition.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche multi-terminologique de l&#39;information de santé sur l&#39;Internet.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.409/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.409/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;informations et des connaissances médicales devient de plus en plus facile et accessible sur Internet pour le professionnel de santé, l&amp;rsquo;étudiant, mais aussi pour le patient et le cyber citoyen. CISMeF (Catalogue et Index des Sites Médicaux Francophones) est un outil visant à cataloguer et indexer les sources les plus importantes d&amp;rsquo;information de santé institutionnelles en France afin de les mettre à disposition du public. L&amp;rsquo;indexation des ressources Internet est mono-terminologique du fait qu&amp;rsquo;elle soit fondée exclusivement sur le thésaurus MeSH (traduit par l&amp;rsquo;US National Library of Medicine). En 2007, l&amp;rsquo;équipe CISMeF oriente ses objectifs vers un univers multi-terminologique qui s&amp;rsquo;appuie sur un extracteur automatique multi-terminologique et le développement préindustriel d&amp;rsquo;un serveur multi- terminologique médical. Le projet de recherche d&amp;rsquo;information multi-terminologique a débuté par l&amp;rsquo;intégration d&amp;rsquo;une terminologie complémentaire du MeSH concernant les substances chimiques et nous projetons d&amp;rsquo;intégrer les terminologies médicales françaises (CCAM) et celles traduites en français (CIM-10, SNOMED) afin d&amp;rsquo;améliorer la recherche d&amp;rsquo;information de CISMeF dans un contexte hétérogène.&lt;/p&gt;</description>
    </item>
    <item>
      <title>RI-TAL : le TAL au service de la RI.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Comment le Traitement Automatique des Langues peut-il servir la Recherche d’Information?&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;How may Natural Language Processing serve Information Retrieval? This paper&lt;/p&gt;</description>
    </item>
    <item>
      <title>Utilisation des syntagmes nominaux dans un système de recherche d&#39;information en langue arabe.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.341/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.341/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans un contexte riche, un système de recherche d&amp;rsquo;information doit être capable de trouver les meilleurs résultats possibles. Dans ce but, notre étude s&amp;rsquo;intéresse aux connaissances qui peuvent être extraites du contenu textuel des documents en associant la finesse d&amp;rsquo;analyse d&amp;rsquo;une approche linguistique à la capacité d&amp;rsquo;une approche statistique traitant des corpus de grandes tailles. L&amp;rsquo;approche statistique se base sur la fouille de données textuelles et principalement sur la technique d&amp;rsquo;analyse sémantique latente tandis que l&amp;rsquo;approche linguistique se base sur les syntagmes nominaux que nous considérons comme des entités textuelles plus susceptibles de représenter l&amp;rsquo;information contenue dans le texte que les termes simples. Par une expérimentation, sur une collection de documents arabes spécialisés dans le domaine de l&amp;rsquo;environnement nous montrons l&amp;rsquo;impact de l&amp;rsquo;utilisation des syntagmes nominaux sur la précision d&amp;rsquo;un système de recherche d&amp;rsquo;information.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Validation syntaxique de relations sémantiques pour la RI.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.455/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.455/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Avec l&amp;rsquo;objectif d&amp;rsquo;améliorer la précision des systèmes de recherche d&amp;rsquo;information, c&amp;rsquo;est-à-dire les premiers résultats retrouvés par le système, des travaux se sont basés sur des indexations structurées des documents, à base d&amp;rsquo;arbres ou de graphes. La plupart de ces travaux utilisent comme index des structures uniques et certaines. Les décisions qui ont amené à la sélection de certaines informations lors de la création de la structure à partir du texte ne sont plus disponibles et ne sont pas utilisées. Ce type d&amp;rsquo;information nous parait pourtant essentiel pour obtenir des résultats précis. Nous proposons ici une méthode permettant de donner un poids d&amp;rsquo;extraction à des relations sémantiques à partir des éléments syntaxiques qui les composent dans le texte. Pour valider ce poids, nous intègrerons cette pondération dans un modèle de recherche d&amp;rsquo;information basé sur des graphes de concepts et nous évaluerons ce modèle sur la collection CLEF-Image 2005.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de représentations de documents et leur exploitation en recherche d’information</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_14/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_14/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Afin de calculer la similarité document-requête, la majorité des modèles en recherche d&amp;rsquo;information (RI) représentent les documents et les requêtes sous forme de u sacs de mots » (bag of words) pondérés ou un sac de concepts, issus d&amp;rsquo;une ontologie linguistique ou construits automatiquement par des techniques de type LSI ou LDA, pour combler l&amp;rsquo;écart entre le voca- bulaire utilisé par la requête et celui présenté dans les documents. D&amp;rsquo;autres approches dites word2vec proposent de modéliser les termes sous forme de vecteurs. Les approches word2vec permettent de capturer des relations au-delà de la co-occurrence, nous permettant ainsi de mo- déliser des relations sémantiques entre les termes. Dans cet article, nous présenterons l&amp;rsquo;état de l&amp;rsquo;art sur l&amp;rsquo;usage de ce type d&amp;rsquo;approches ainsi que notre contribution à l&amp;rsquo;exploitation de ce type d&amp;rsquo;approches dans les modèles de la RI.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Association d&#39;un détecteur de visages et d&#39;un détecteur d&#39;entités nommées pour l&#39;annotation automatique d&#39;images.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.461/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.461/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons une méthode d&amp;rsquo;annotation d&amp;rsquo;images de visages dans un grand corpus réel de documents texte-images. Cette méthode s&amp;rsquo;appuie sur l&amp;rsquo;utilisation conjointe d&amp;rsquo;un détecteur de visages et d&amp;rsquo;un détecteur d&amp;rsquo;entités nommées : les images contenant des visages sont annotées par les entités nommées les plus fréquentes dans le texte accompa- gnant les images. Bien que basique, cette méthode donne de bons résultats. Elle constitue un premier pas vers des méthodes d&amp;rsquo;indexation textuelle des images plus élaborées et basées sur des caractéristiques haut-niveau des documents.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Experiments on two Query Expansion Approaches for a Proximity-based Information Retrieval Model.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.407/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.407/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;expansion de requêtes est une technique bien connue pour dépasser l&amp;rsquo;exigence de recherche par mot exact en recherche d&amp;rsquo;information. Cependant, l&amp;rsquo;expansion automatique vient avec le risque de dérive de la requête. Dans ce travail nous avons eu ce problème en essayant d&amp;rsquo;étendre des requêtes booléennes pour un modèle de recherche basé sur la proximité. Ce modèle obtient une bonne précision dans les campagnes d&amp;rsquo;évaluation mais il rend très peu de résultats. Dans ce travail, nous avons utilisé deux approches : une approche globale qui utilise les synonymes de WordNet, et une approche locale basée sur le retour de pertinence et l&amp;rsquo;utilisation de LSA pour créer un thésaurus local. Les résultats que nous avons obtenus montrent un effet important de dérive de la requête. Dans ce papier nous présentons ces expériences avec une analyse des résultats et les perspectives que nous envisageons.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction et interprétation d&#39;information géographique dans des données non structurées.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.347/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.347/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente le projet &amp;ldquo;Pyrénées Itinéraires Virtuels&amp;rdquo;. Ce projet consiste à va- loriser un fonds documentaire patrimonial localisé dans le territoire pyrénéen. Dans ce cadre, nous proposons des modèles unifiés pour la définition formelle d&amp;rsquo;entités spatiales. Ces modèles permettent de mettre en place un système de recherche d&amp;rsquo;information basé sur le contenu sé- mantique de documents multi-formats. L&amp;rsquo;objectif de ce projet est d&amp;rsquo;étendre les fonctionnalités de systèmes de gestion de base documentaire classiques en permettant une gestion plus fine des restrictions spatiales dans une recherche. Pour cela nous développons un processus d&amp;rsquo;extraction d&amp;rsquo;information (EI) spécifique basé sur les modèles unifiés. De plus, une réflexion est menée sur l&amp;rsquo;interprétation numérique des entités spatiales. Un outil de recherche d&amp;rsquo;information (RI) utilise alors le traitement sémantique effectué pour retrouver des fragments de documents spatialement pertinents. Un prototype implémentant ce processus est développé afin de valider nos travaux.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation de sous-collections pour l&#39;amélioration de la haute précision.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.373/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.373/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente une méthode de recherche d&amp;rsquo;information basée sur une indexation en deux étapes. L&amp;rsquo;objectif est de trouver si affiner l&amp;rsquo;indexation et la recherche sur une sous-collection homogène améliore la qualité de l&amp;rsquo;information recherchée. Nous évaluons l&amp;rsquo;intérêt d&amp;rsquo;une telle approche en termes de précision en utilisant les modèles de recherches okapi BM25 et TF-IDF et les collections TREC-7 et TREC-8 ad hoc. Les résultats montrent que cette méthode améliore significativement les hautes précisions au moins sur 44% des requêtes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Integration of Shape Context and Neural Networks for Symbol Recognition.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-19/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-19/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les descripteurs de contexte de formes ont été utilisés comme caractéristiques dans les classifieurs kuplus proches voisins avec des résultats remarquables. Néanmoins, l&amp;rsquo;utilisation de cette approche sur de grosses bases de symboles ou dans des contextes applicatifs à la volée reste difficile à cause de sa complexité calculatoire. Pour dépasser ces limitations, nous pro- posons l&amp;rsquo;utilisation des descripteurs de contexte de formes avec des réseaux de neurones au lieu de l&amp;rsquo;approche kuppv. Nous évaluons la méthode proposée dans un problème de reconnais- sances de symboles mathématiques enuligne. Pour un total de 75 classes de symboles, un taux de reconnaissance est de 89 .8% est obtenu, ce qui est comparable aux résultats de l&amp;rsquo;approche initiale mais avec une complexité nettement diminuée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Mesure de la similarité entre termes et labels de concepts ontologiques.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_43/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_43/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article une méthode permettant de mesurer la similarité entre des termes et des concepts ontologiques. Notre métrique permet de prendre en compte les mots proches communs aux deux chaînes de caractères à comparer mais également d&amp;rsquo;autres carac- téristiques telles que la position des mots dans ces chaînes, ou encore, le nombre d&amp;rsquo;opérations de suppression, d&amp;rsquo;insertion ou de remplacement de mots nécessaire à la construction d&amp;rsquo;une des deux chaînes à partir de l&amp;rsquo;autre. La méthode proposée a ensuite été utilisée pour déterminer les concepts ontologiques équivalents aux termes qui qualifient des toponymes. Dans un contexte de recherche d&amp;rsquo;information géographique, ceci a pour but de typer des toponymes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Querying by examples.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.407/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.407/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Regroupement par popularité pour la RI semi-supervisée centrée sur les entités.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.60/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.60/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Filtrer des documents web à propos d&amp;rsquo;entité (personne, entreprise &amp;hellip;) pour que seuls les documents d&amp;rsquo;intérêt soient gardés est un réel challenge. L&amp;rsquo;intérêt peut être qualifié de différente manière comme la nouveauté ou le fait qu&amp;rsquo;une information soit récente. Nous avons pu voir au cours des dernières années que des systèmes s&amp;rsquo;entraînent à détecter l&amp;rsquo;intérêt d&amp;rsquo;un document au regard d&amp;rsquo;une entité. Pour des raisons de passage à l&amp;rsquo;échelle, il n&amp;rsquo;est pas pensable d&amp;rsquo;avoir des données annotées manuellement pour chaque entité recherchée. Les approches obtiennent de bonnes performances, mais nous montrons que celles-ci peuvent être améliorées. Les entités peuvent différer sur certains aspects qui peuvent être mieux exploités grâce au regroupement (clustering). Cet article a pour but de montrer la valeur ajoutée que le regroupement peut avoir sur ce type de problème en utilisant une méthode de regroupement basique. Nous testons notre approche sur la tâche Knowledge Base Acceleration (KBA) de TREC 2013 et 2014 et nous obtenons des résultats significativement meilleurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Répondre à des requêtes cliniques PICO.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.18/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.18/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous nous intéressons à l’évaluation de requêtes cliniques exprimées&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper, we address the issue of answering PICO (Patient/Problem, Intervention,&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle de bibliothèque numérique collaborative - ARMARIUS.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.417/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.417/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les manuscrits anciens numérisés représentent un contenu spécifique pour les bibliothèques numériques. Les utilisateurs travaillant sur ce type de documents ont besoin de systèmes d&amp;rsquo;assistance et d&amp;rsquo;espaces de travail collectif pour interpréter, annoter et transcrire ces manuscrits. Dans cet article, nous présenterons un modèle de bibliothèque numérique spécialement conçu pour des manuscrits anciens numérisés : Armarius. Celui-ci fournit des interfaces d&amp;rsquo;annotation manuelle et semi-automatique. Il propose également un système d&amp;rsquo;assistance pour aider l&amp;rsquo;utilisateur à annoter et à exploiter les manuscrits. De plus, il contient un espace de travail collaboratif qui permet à un groupe d&amp;rsquo;utilisateurs de travailler sur un ensemble de documents.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une approche sémantique basée sur l&#39;apprentissage pour la recherche d&#39;image par contenu.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.471/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.471/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cette dernière décennie témoigne un accroissement exponentiel des données multimé- dia (texte, image, son et vidéo). La recherche d&amp;rsquo;information au sein de cette masse de données, en particulier les images, devient un processus incertain. Aussi, le problème se pose au niveau de l&amp;rsquo;indexation puisque les techniques actuelles ne permettent pas de décrire efficacement le contenu des images. Dans ce papier, nous nous concentrons sur le problème de découverte de connaissance à partir du contenu des images et nous proposons une nouvelle approche pour l&amp;rsquo;indexation sémantique des images. Notre approche se base sur l&amp;rsquo;apprentissage pour associer des éléments symboliques (concepts) à des éléments de bas niveau.&lt;/p&gt;</description>
    </item>
    <item>
      <title>A New Test of Cluster Hypothesis Using a Scalable Similarity-Based Agglomerative Hierarchical Clustering Framework</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_15/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.rjcri_15/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;hypothèse de cluster est l&amp;rsquo;hypothèse fondamentale de l&amp;rsquo;utilisation du clustering dans la recherche d&amp;rsquo;information. Elle indique que les documents semblables ont tendance à être pertinents pour la même requête. Des travaux passés testent intensivement cette hypothèse avec les méthodes de la classification ascendante hiérarchique (CAH). Mais leurs conclusions ne sont pas cohérentes en termes d&amp;rsquo;efficacité de la recherche. La limite principale dans ces travaux est le problème de passage à l&amp;rsquo;échelle lié a là CAH. Dans cet article, nous étendons nos travail précédent à un nouveau test de l&amp;rsquo;hypothèse de cluster en appliquant un système extensible de CAH basé sur la similarité. Principalement, la matrice de similarité cosinus est sparsifiée par des seuils pour réduire l&amp;rsquo;occupation mémoire et le temps de calcul. Nos résultats montrent que même quand la matrice est largement sparsifiée, l&amp;rsquo;efficacité de la recherche est maintenue pour toutes les méthodes, dont le complete et l&amp;rsquo;average ne dominent pas toujours les autres.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Construction et enrichissement d&#39;une ontologie à partir d&#39;un corpus de textes.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.353/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.353/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons un processus de construction et d&amp;rsquo;enrichissement d&amp;rsquo;ontologies à partir de textes. Les ontologies sont des structures dans lesquelles les concepts d&amp;rsquo;un domaine et les relations entre ces concepts sont formellement définis. De plus en plus de travaux font appel à des ontologies mais leur construction et leur enrichissement constituent encore un frein. Notre méthode de construction repose sur la recherche de termes dans les textes. Elle suppose que les associations fréquentes de deux termes au sein de certaines structures syntaxiques peuvent être révélatrices d&amp;rsquo;une relation sémantique et ainsi constituer des éléments pouvant être intégrés dans l&amp;rsquo;ontologie. L&amp;rsquo;identification des termes et des structures syntaxiques se fait grâce à un analyseur syntaxique partiel et robuste. Ces éléments constituent la base des données sur laquelle opère le processus de fouille u extraction de motifs fréquents u mis en oeuvre pour extraire des régularités.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Évaluation des approches multi-apprenants pour l&#39;indexation des concepts dans les documents vidéo.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.409/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.409/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Plongement incrémental dans un contexte de dissimilarité.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-20/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-20/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le domaine de la reconnaissance statistique de formes est basé sur la représentation&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Statistical pattern recognition framework is based on a numerical description of ob- jects and can thus be easily combined with efficient machine learning methods. On the other hand structural pattern recognition methods use a limited set of machine learning methods but encode a rich description of objects through structural models such as strings or graphs. This CIFED 2014, pp. 261u275, Nancy, 18-21 mars 2014&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche contextuelle d&#39;information dans un environnement mobile.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.479/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.479/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche contextuelle d&amp;rsquo;information (RCI) a pour objectif de mieux répondre aux besoins de l&amp;rsquo;utilisateur en lui délivrant l&amp;rsquo;inf ormation adaptée à son contexte spécifique de recherche. Cet article présente une approche de RCI dans le cas d&amp;rsquo;un environnement mobile, où le contexte spatio-temporel de l&amp;rsquo;utilisateur et son contexte cognitif, sont à la fois considérés pour lui délivrer de l&amp;rsquo;information pertinente. Nous proposons de construire des profils situationnels basés sur l&amp;rsquo;historique de recherche annoté par le contexte spatio- temporel pour personnaliser les résultats de recherche. De plus, le contexte spatio-temporel sera exploité pour mieux répondre à des requêtes sensibles au temps ou à la localisation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche contextuelle d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.467/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.467/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche contectuelle d&amp;rsquo;information a pour objectif de mieux répondre aux besoins de l&amp;rsquo;utilisateur et de lui délivrer de l&amp;rsquo;information pertinente selon son contexte spécifique de recherche. Ce papier présente un contexte de recherche à deux dimensions: le contexte de l&amp;rsquo;utilisateur et le contexte de la requête. On vise à intégrer ces deux dimensions du contexte dans un processus de recherche d&amp;rsquo;information afin d&amp;rsquo;asseoir un système de recherche d&amp;rsquo;information contextuelle.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Reconnaissance et classification de lettrines à base des descripteurs de bas niveau et de représentation structurelle.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s’intéresse à un des éléments importants dans l’analyse de graphiques sur&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This article tackles some important issues relating to the analysis of a particular case&lt;/p&gt;</description>
    </item>
    <item>
      <title>Speaker diarization de fichiers vidéos hétérogènes issus du web.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.379/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.379/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ces dix dernières années, internet a significativement changé. Le principal change- ment est certainement le contenu proposé, que ce soit dans sa quantité, sa diversité ou encore le média utilisé pour le présenter. Concernant le média audio/video, l&amp;rsquo;évolution la plus im- pressionnante est le succès continuellement grandissant des sites de partage de vidéos. Mais ce succès entraîne des diffcultés à indexer efficacement le contenu de ces documents. La segmenta- tion et le regroupement en locuteurs (speaker diarization) est une tâche importante s&amp;rsquo;inscrivant dans ce processus. Ce papier décrit la base de données audio/video, construite spécialement pour la speaker diarization, basée sur différents genres vidéo. Au travers d&amp;rsquo;expériences préli- minaires, ce papier met en évidence les difficultés rencontrées pour cette tâche dans ce contexte, difficultés principalement dûes à l&amp;rsquo;hétérogénité de la base de données.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Système générique et omni-langage de navigation dans des bases de documents anciens basé sur de la recherche de mots par composition intéractive de requêtes.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.413/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.413/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche de mots ou de groupe de mots pour la navigation dans des collections de documents anciens numérisés est un sujet de recherche actif dans la communauté internatio- nale. En raison en particulier de la qualité médiocre de ce type de documents et de l&amp;rsquo;utilisation d&amp;rsquo;un langage ancien ou rare, appliquer un simple OCR sur ces documents ne suffit pas, d&amp;rsquo;autant que certains alphabets ne disposent d&amp;rsquo;aucun système de reconnaissance automatique. Afin de contourner ces difficultés, nous proposons un système générique, omni-langage et interactif de recherche de mots dans des collections de documents anciens. Cette approche permet de tra- vailler sur n&amp;rsquo;importe quelle collection de documents anciens, utilisant n&amp;rsquo;importe quel alphabet, pictogrammes ou idéogrammes. Dans ce contexte, l&amp;rsquo;utilisateur peut composer sa requête et il n&amp;rsquo;a pas besoin de maîtriser le langage ni de détecter préalablement une occurrence du mot-clé.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Traduction automatique statistique à partir de corpus comparables : application aux couples de langues arabe-français.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_46/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_46/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous nous intéressons à l&amp;rsquo;exploitation de corpus comparables pour la Traduction Automatique Statistique (TAS). Dans ce contexte, nous proposons deux approches. En premier lieu, une approche hybride basée sur des techniques statistiques et linguistiques est proposée afin d&amp;rsquo;extraire un lexique de terminologie bilingue à partir de Wikipédia. En second lieu, une approche hybride basée sur la longueur des phrases et un dictionnaire est proposée pour l&amp;rsquo;alignement du corpus des Nations Unies (UN), au niveau des phrases. Nous avons intégrer les ressources crées dans un système de Traduction Automatique Statistique pour la paire de langues arabe-français. Nous avons obtenu des améliorations significatives du score BLEU, en utilisant ces deux approches en plus d&amp;rsquo;une technique de prétraitement des corpus en langue source (arabe).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle de recherche de fichiers personnels par contexte dans les systèmes d&#39;étiquetage.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.425/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.425/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Depuis peu, les étiquettes sont utilisées largement pour identifier des contenus aussi bien sur le bureau informatique des utilisateurs que sur les sites coopératifs du Web dit 2.0. Notre recherche se focalise sur l&amp;rsquo;organisation assistée des étiquettes personnelles afin d&amp;rsquo;améliorer la pertinence des recherches de fichiers personnels associés à des étiquettes. Notre proposition utilise la notion de contexte comme point central. Un contexte est constitué à partir d&amp;rsquo;un ensemble d&amp;rsquo;étiquettes affectées par un utilisateur à un fichier. Nous proposons une infrastructure qui permet à un utilisateur de naviguer à travers les contextes pour retrouver ses fichiers.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un système de recommandation sensible au contexte pour la visite de musée.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Notre travail concerne les systèmes d&amp;rsquo;aide à la visite de musée et l&amp;rsquo;accès au patrimoine culturel. Notre but est de concevoir un système de recommandation, implémenté sur dispositifs mobiles adaptable au profil de l&amp;rsquo;utilisateur et sensible à son contexte, afin d&amp;rsquo;améliorer l&amp;rsquo;ex- périence de l&amp;rsquo;utilisateur et de l&amp;rsquo;aider à construire ses parcours en musée en fonction de ses préférences et ses contraintes.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Our work is in the field of the support systems to museum visits and access to cul- tural heritage. Our goal is to design a recommendation system implemented on mobile devices adaptable to the user&amp;rsquo;s profile and sensitive to its context, to improve the user experience and help build his visits to the museum based on his preferences and constraints.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Alignement texte-image sans apprentissage pour les manuscrits médiévaux.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-17/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-17/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous décrivons une nouvelle approche pour l’alignement texte-image&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper, we describe a new approach for text-image alignment of middle-age&lt;/p&gt;</description>
    </item>
    <item>
      <title>Analyse formelle de concepts pour le routage des requêtes dans les systèmes pair-à-pair.</title>
      <link>http://www.asso-aria.org/coria/2010/papers/coria.2010.411/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2010/papers/coria.2010.411/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Annotation d&#39;images sur de grands corpus réels de données.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.473/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.473/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous vérifions les limitations des techniques d&amp;rsquo;annotation d&amp;rsquo;images sur un corpus réel et de grande taille. Pour cela, nous utilisons un corpus de documents texte- images composé de plus de 25000 articles de presse, sur lequel nous évaluons la similarité entre une recherche basée sur le texte et une recherche basée sur l&amp;rsquo;image. Les systèmes de recherche que nous utilisons sont des outils communs de la Recherche d&amp;rsquo;Information (RI). Les résultats montrent que les systèmes de RI utilisés donnent des résultats différents : l&amp;rsquo;association simple des descripteurs utilisés ici ne semble donc pas appropriée pour l&amp;rsquo;annotation de données réelles. Cela met en avant la nécessité de développer un modèle permettant de prendre en compte, de manière cohérente, des descripteurs textuels et visuels pour réaliser l&amp;rsquo;indexation sémantique d&amp;rsquo;images.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Fusion de ressources hétérogènes pour la recherche d&#39;information multilingue.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.433/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.433/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Afin d&amp;rsquo;améliorer la recherche multilingue dans le moteur de recherche Sinequa Engine, nous avons intégré les connaissances multilingues du service Sensagent au module de requêtes du moteur de recherche Sinequa Engine. L&amp;rsquo;interface développée propose une extension de la requête aux choix de l&amp;rsquo;utilisateur par traduction des différents mots dans les langues sélectionnées. Pour limiter le grand nombre de traductions que peut engendrer une requête complexe, nous avons déployé un filtrage sémantique par calcul vectoriel. L&amp;rsquo;ensemble de la chaîne de traitement repose fortement sur les ressources linguistiques de Sinequa. L&amp;rsquo;utilisation d&amp;rsquo;une ressource extérieure, si elle résout le problème de la seule traduction, pose des problèmes d&amp;rsquo;exploitation et d&amp;rsquo;adéquation des ressources entre elles, qui ne pourraient être résolus que par une vraie fusion des ressources.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Identification de documents par classification monoclasse.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-21/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-21/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Utilisée dans un contexte industriel, la classification d&amp;rsquo;images de documents néces- site le respect de certaines contraintes; par exemple, être confronté à une grande variabilité des documents et/ou du nombre de classes. Dans cet article, nous répondons à ce problème en présentant une nouvelle approche basée sur la spécialisation du vecteur de caractéristiques et d&amp;rsquo;un classificateur pour chaque classe, contrairement à la majorité des méthodes qui traitent l&amp;rsquo;ensemble des classes. Cette approche permet alors d&amp;rsquo;introduire de nouvelles classes sans contraindre le système à un nouvel apprentissage. Pour cela, nous calculons un vecteur de ca- ractéristiques générique qui sera ensuite spécialisé en classant les caractéristiques selon un score de stabilité. Finalement, un classificateur monoclasse de type K plus proche voisins est entrainé en utilisant ce vecteur. Les expérimentations menées révèlent de bons taux de classifi- cation prouvant une adaptabilité de notre système sur des problèmes complexes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Impact des Réseaux Sociaux sur le Processus de Recherche d&#39;Information.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.385/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.385/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;explosion du Web 2.0 (blogs, wikis, sites de partage, réseaux sociaux, etc.) ouvre&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The explosion of Web 2.0 (blogs, wikis, sharing Web sites, social networks, etc.) opens new perspectives sharing and dealing with information, allowing the collaborative content construction and the open social networks&amp;rsquo; development. Our work deals with information access issues in a context where the user is both producer and consumer of content. We present a state of the art about the impact of the social information on the Information Retrieval (IR) process, positioning the works in relation to certain aspects of integration of social information within the IR model: approaches based on social relationships or informational content provided by the user.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Pondération des concepts en recherche d&#39;information sémantique.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_44/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.coria2013_44/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;objectif principal de la pondération en recherche d&amp;rsquo;information (RI) est d&amp;rsquo;assigner aux termes d&amp;rsquo;index des poids sensés traduire leur importance dans les documents où ils apparaissent. En RI sémantique, les termes d&amp;rsquo;index représentent des concepts. L&amp;rsquo;importance d&amp;rsquo;un concept est généralement mesurée soit à travers sa fréquence d&amp;rsquo;occurrence, soit à travers sa centralité, définie comme son degré de relation avec les autres concepts du document. Dans ce papier, nous proposons et évaluons une approche de pondération des concepts basée sur une nouvelle définition de la centralité. La centralité d&amp;rsquo;un concept est une mesure combinée de sa fréquence relative et de sa proximité sémantique avec les autres concepts du document. Nous montrons en particulier que notre approche offre de meilleurs résultats que les approches de pondération classiques sur des concepts.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information dans les systémes P2P hétérogènes.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.419/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.419/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous considérons la recherche d&amp;rsquo;information sémantique dans les systèmes pair-à- pair. Ces derniers semblent être une solution intéressante pour le partage de données car ils garantissent le passage à l&amp;rsquo;échelle, et gère la dynamicité. Dans ce contexte, il est difficilement imaginable que tous les participants s&amp;rsquo;accordent sur l&amp;rsquo;utilisation d&amp;rsquo;une même représentation sémantique (schéma, ontologie, graphe conceptuel). Dans ce cas, le système est sémantique- ment hétérogène. Cette situation limite l&amp;rsquo;interopérabilité entre participants. Dans cet article nous montrons quels sont les problématiques liées à l&amp;rsquo;hétérogénéité sémantique et nous présen- tons les solutions que nous proposons pour garantir un certain degré d&amp;rsquo;interopérabilité malgré l&amp;rsquo;hétérogénéité. L&amp;rsquo;originalité de ce travail se trouve dans le fait de tenter d&amp;rsquo;améliorer l&amp;rsquo;interopérabilité sémantique en s&amp;rsquo;attaquant directement à la source du problème : l&amp;rsquo;hétérogénéité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;information textuelle et phonétique pour le contrôle de l&#39;étiquetage automatique d&#39;émissions dans un flux télévisuel.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.487/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.487/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;En 2007, Naturel (Naturel, 2007) a proposé un système qui associe automatiquement une étiquette, c&amp;rsquo;est-à-dire un titre, à des émissions issues du découpage d&amp;rsquo;un flux TV. Cepen- dant, ce système ne permet pas de vérifier la correction des associations étiquette-émission. Nous proposons dans cet article de contrôler cet étiquetage en nous basant sur les transcrip- tions textuelle et phonétique de la bande sonore contenue dans le flux. Nous montrons que des méthodes de recherche d&amp;rsquo;information permettent d&amp;rsquo;associer à chaque émission une descrip- tion, issue d&amp;rsquo;un guide de programmes TV, description qui est ensuite comparée avec l&amp;rsquo;étiquette originale de l&amp;rsquo;émission. La technique proposée permet de contrôler un peu plus de 45% des émissions étudiées et de diminuer de nombre d&amp;rsquo;erreurs de l&amp;rsquo;étiquetage original de 3,5%.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un processus de médiation flexible dans un système d&#39;informations distribué.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.359/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.359/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous nous intéressons aux systèmes d&amp;rsquo;informations distribués, ouverts et dynamiques regroupant un nombre important de sources d&amp;rsquo;informations hétérogènes, autonomes et distri- buées. Notre problème consiste à fournir aux requêtes des utilisateurs des informations qui se- ront les plus pertinentes possibles tout en permettant aux fournisseurs d&amp;rsquo;informations d&amp;rsquo;obtenir des requêtes correspondant au mieux à leurs attentes. Cet aspect de la médiation est en général peu traité dans les médiations classiques. Ainsi, nous associons simultanément ces deux visions dans le processus de médiation flexible que nous présentons ici. Un médiateur interroge les fournisseurs capables de répondre à la re- quête sur leurs préférences exprimées par des offres monétaires. Ce système n&amp;rsquo;est pas purement économique car les qualités des fournisseurs interviennent aussi dans le calcul de l&amp;rsquo;allocation. On considère qu&amp;rsquo;une requête doit toujours être traitée si le système dispose de fournisseurs qua- lifiés pour la réaliser: une politique de réquisition est ainsi mise en place dans le mécanisme.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une méthode non supervisée pour la vérification d&#39;auteur à base d&#39;un modèle gaussien multivarié.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons une première étude sur l&amp;rsquo;utilisation d&amp;rsquo;une méthode de détection des cas aberrants à base de distance pour la tâche de vérification de l&amp;rsquo;auteur. Nous avons considéré une méthode non supervisée basée sur un modèle gaussien multivarié. Pour évaluer l&amp;rsquo;efficacité de la méthode proposée, nous avons mené une expérimentation sur un corpus de textes littéraires français classiques. Nos résultats préliminaires montrent que la méthode proposée peut réaliser une haute performance de vérification qui peut atteindre un score de F1 de 83%, supérieure à celle de la méthode de référence.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Adaptation des caractéristiques pseudo-Haar pour le word spotting dans les documents manuscrits.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;On présente dans ce papier une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé comporte deux niveaux. D’abord, un module de filtrage global permettant de définir des zones candidates répondant à la requête dans le document testé. Ensuite, l’échelle de l’observation est modifiée à un niveau plus fin afin d’affiner les résultats et de sélectionner uniquement ceux qui sont vraiment pertinents. Le présent article se focalise sur la première étape de la méthode. Les contributions de cet article sont l’utilisation et l’adaptation des caractéristiques pseudo-Haar dans le word spotting. De plus, une technique permettant de modéliser les requêtes sélectionnées par l’utilisateur à partir d’un clavier est proposée. Notre méthode ne nécessite pas la segmentation préalable du document en ligne et mots. L’approche est évaluée sur la base de données publique George Washington.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Aggregated search: From information nuggets to aggregated documents.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.495/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.495/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le but de la recherche agregée est de rassembler des informations provenant de plu- sieurs sources en une seule interface. Elle doit ainsi gérer des problématiques liées aux dif- férents types de contenu (texte, vidéo, image, etc) ainsi qu&amp;rsquo;à la granularité des résultats. La formation d&amp;rsquo;un contenu agrégé à partir de différents types de contenus retrouvés contraste avec l&amp;rsquo;approche commune en RI consistant à renvoyer à l&amp;rsquo;utilisateur une liste ordonnée de résultats. Si nous sommes aujourd&amp;rsquo;hui capables de retrouver de l&amp;rsquo;information de différents types et de différente granularité, très peu de travaux existent concernant leur agrégation. La recherche agrégée étant un domaine de recherche récent, elle manque encore de formalisation. Ce pa- pier se propose de traiter la recherche agrégée à un niveau d&amp;rsquo;abstraction élevé. Il présente tout d&amp;rsquo;abord l&amp;rsquo;état de l&amp;rsquo;art, puis décompose le problème en listant et formalisant les différentes pro- blématiques. Ce travail doit servir de base de réflexion et de référence pour de futurs travaux sur le domaine.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Contribution à la recherche d&#39;information : une fonction de correspondance.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.365/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.365/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Un Système de Recherche d&amp;rsquo;Information (SRI) dispose d&amp;rsquo;un modèle de recherche ca- pable de déterminer le degré de similarité qui existe entre un document et une requête. Généra- lement, le mécanisme consiste à apparier les documents et la requête en utilisant une fonction de correspondance. Dans ce papier, nous proposons la définition d&amp;rsquo;une fonction de correspon- dance qui repose sur les termes contenus uniquement dans l&amp;rsquo;intersection de la requête et d&amp;rsquo;un document. Afin de montrer sa performance, nous utilisons les critères suivants : le taux de rappel, le taux de précision et la complexité temporelle.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Étude des mesures de similarité sémantique basées sur les arcs.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_22/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_22/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les mesures de similarité sémantique sont des fonctions très utilisées dans plusieurs&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Semantic similarity measures are functions widely used in several informatics do- mains among which we can mention natural language processing (NLP), Bioinformatic, Infor- mation Retrievial&amp;hellip; They allow to determinate similarity between terms or concepts which have no syntaxic similarity. The goal of this paper is to study a particular semantic similarity group: edges based semantic similarity measures. We will do a state of art of this measures. This task will come to simulations of this measures on a common knowledge base in order to compare and to evaluate their performances.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Expansion sélective de requêtes par apprentissage.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-19/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-19/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Si l&amp;rsquo;expansion de requête automatique améliore en moyenne la qualité de recherche, elle peut la dégrader pour certaines requêtes. Ainsi, certains travaux s&amp;rsquo;intéressent à développer des approches sélectives qui choisissent la fonction de recherche ou d&amp;rsquo;expansion en fonction des requêtes. La plupart des approches sélectives utilisent un processus d&amp;rsquo;apprentissage sur des caractéristiques de requêtes passées et sur les performances obtenues. Cet article présente une nouvelle méthode d&amp;rsquo;expansion sélective qui se base sur des prédicteurs de difficulté des requêtes, prédicteurs linguistiques et statistiques. Le modèle de décision est appris par un SVM. Nous montrons l&amp;rsquo;efficacité de la méthode sur des collections TREC standards. Les modèles appris ont classé les requêtes de test avec plus de 90% d&amp;rsquo;exactitude. Par ailleurs, la MAP est améliorée de plus de 11%, comparée à des méthodes non sélectives.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Génération d&#39;images semi-synthétiques de documents anciens.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.425/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.425/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente un logiciel de génération d&amp;rsquo;images semi-synthétiques de documents anciens et de la vérité terrain associée. Ce travail s&amp;rsquo;inscrit dans le cadre de la génération de données pour l&amp;rsquo;évaluation de performances d&amp;rsquo;algorithmes d&amp;rsquo;analyse d&amp;rsquo;images de documents. Ce logiciel permet à un utilisateur de spécifier le contenu et la mise en page des images à générer (choix des fontes, illustrations, interlignes). Plusieurs modèles de dégradations ont été intégrés dans ce logiciel. Il est ainsi possible de générer des images contenant les défauts les plus couramment observés dans les ouvrages anciens (transparence, dégradation des carac- tères et pliures d&amp;rsquo;une page). En générant une grande variété de documents, il est ainsi possible d&amp;rsquo;évaluer la robustesse d&amp;rsquo;un algorithme vis-à-vis de ces dégradations.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Propositions pour la recherche contextuelle d&#39;images dans des documents XML.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.479/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.479/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;inscrit dans le cadre de la recherche d&amp;rsquo;images dans des documents XML. Ce type de recherche peut utiliser des informations sémantiques en plus des informations vi- suelles de l&amp;rsquo;image. Nous nous proposons ici d&amp;rsquo;explorer des pistes pour la recherche de ces informations sémantiques au sein des documents XML, en supposant qu&amp;rsquo;une image peut être présentée par les autres éléments non images du document XML. Nous proposons d&amp;rsquo;une part une méthode pour choisir quels sont les éléments d&amp;rsquo;un document XML pouvant participer au mieux à la représentation de l&amp;rsquo;image, et d&amp;rsquo;autre part, une mesure qui évalue pour chaque élé- ment non image sa participation dans la représentation de l&amp;rsquo;image.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;informations dans la blogosphère : Défis et premières évaluations.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.441/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.441/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Recourant au modèle vectoriel tf idf, ainsi qu&amp;rsquo;à trois approches probabilistes et un modèle de langue, cet article évalue leur performance sur un corpus TREC extrait de la blogosphère et comprenant 100 requêtes. Basé sur deux mesures de performance, nous démontrons que l&amp;rsquo;absence d&amp;rsquo;enracineur s&amp;rsquo;avère plus efficace que d&amp;rsquo;autres approches (enracineur léger ou celui de Porter).&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper describes the main retrieval problems when facing with blogs. Using the classical tf idf vector-space model together with three probabilistic and one statistical language model, we evaluate them using a TREC test-collections composed of 100 topics. Using two performance measures, we show that ignoring a stemming approach results in a better performance than other indexing strategies (light or Porter&amp;rsquo;s stemmer).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Semantic Information Retrieval over P2P Network.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.391/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.391/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Porteurs de nombreux avantages en termes d&amp;rsquo;évolutivité, de décentralisation et d&amp;rsquo;auto- organisation, les réseaux P2P se présentent comme une alternative intéressante lorsqu&amp;rsquo;il s&amp;rsquo;agit de publier et d&amp;rsquo;accéder à de l&amp;rsquo;information. Plusieurs travaux de recherche ont traité du prob- lème du routage des requêtes au sein de systèmes d&amp;rsquo;information soutenus par des réseaux P2P. Cependant, peu d&amp;rsquo;entre eux semblent intéressés pour savoir si les mécanismes de routage sé- mantique de requêtes permettent effectivement de fournir aux utilisateurs des informations sé- mantiquement pertinentes en fonction de leurs besoins. Ainsi, dans ce travail nous proposons d&amp;rsquo;étudier l&amp;rsquo;application de la sémantique à la Recherche d&amp;rsquo;Information traditionnelle ainsi qu&amp;rsquo;aux systèmes d&amp;rsquo;information basés sur des réseaux P2P. Nous démontrons l&amp;rsquo;écart qui subsiste entre la recherche d&amp;rsquo;information sémantique et le routage sémantique des requêtes. Finalement, nous présenterons les défis offerts par la recherche d&amp;rsquo;information sémantique lorsqu&amp;rsquo;elle est appliquée aux réseaux P2P.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Semantic Query Structuring to Enhance Precision of an Information Retrieval System: Application to the Medical Domain.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_1/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La plupart des systèmes de recherche d&amp;rsquo;information représentent la requête, et les do- cuments, comme un sac de termes d&amp;rsquo;indexation sans aucune relation entre eux. Cette représen- tation pose problème pour les spécialistes d&amp;rsquo;un domaine spécifique comme le domaine médical. Nous proposons une alternative au sac de termes d&amp;rsquo;indexation, en fonction de la structuration requête sémantique, afin de répondre à ce besoin de précision dans un domaine spécifique. Cette structuration est obtenue en regroupant les termes d&amp;rsquo;indexation des requêtes à l&amp;rsquo;aide des caté- gories prédéfinies appelées dimensions. Ces dimensions représentent les différents aspects qui pourraient apparaître dans une requête ou un document. Les résultats expérimentaux montrent une amélioration de précision liée à la granularité des dimensions et de sa distribution.&lt;/p&gt;</description>
    </item>
    <item>
      <title>6IR : Un index paramétrable pour les requêtes ramifiées.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.503/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.503/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article contient une présentation de notre travail en cours de dévelop- pement dans le domaine de la recherche d&amp;rsquo;informations dans des bases de documents semi-structurées. Nous cherchons à construire un système d&amp;rsquo;interrogation u dénommé 6IR pour Structure based IndeX Information Retrieval u qui fournisse une liste de documents similaires au contenu et à la structure d&amp;rsquo;une requête ramifiée. L&amp;rsquo;extraction des documents est basée sur l&amp;rsquo;identification de points communs entre leur structure et celle de la requête. Nous détaillons le processus d&amp;rsquo;indexation qui consiste à extraire des documents de la base tous les points d&amp;rsquo;accrochage exploitables dans le processus d&amp;rsquo;in- terrogation. Nous montrons comment parvenir à maîtriser l&amp;rsquo;explosion combinatoire de la taille de l&amp;rsquo;index en paramétrant la taille des points d&amp;rsquo;ancrage et les propriétés qui en découlent pour les documents candidats obtenus lors du processus d&amp;rsquo;interrogation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>A Generic Approach Based on Linked Data to Enhance Web Information Retrieval and Increase User Satisfaction.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;De nombreux travaux s&amp;rsquo;intéressent à l&amp;rsquo;utilisation des Linked Data pour améliorer la recherche d&amp;rsquo;information (ex. moteurs de recherche sémantiques, etc.). Dans ce travail, nous proposons de les utiliser pour améliorer la satisfaction de l&amp;rsquo;utilisateur durant ses interactions avec un système de RI. Nous voulons offrir à l&amp;rsquo;utilisateur des snippets adaptés à l&amp;rsquo;expression de son besoin d&amp;rsquo;information. Pour ce faire, nous nous concentrons sur l&amp;rsquo;appariement de graphes RDF, après les avoir transformé en graphes bipartis.  KEY WORDS: Linked Data, search results, Web search, information retrieval, semantic web, RDF model, RDF graphs matching, snippets, bipartite graph.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation relationnelle pour la recherche de documents structurés interreliés.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.485/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.485/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;En recherche d&amp;rsquo;information, dans le cas de documents structurés sans inter-relations, se pose le problème de naviguer dans la structure des documents résultats. Si nous ajoutons la prise en compte de relations entre doxels qui ne sont pas des relations de composition, le pro- blème de la navigation dans l&amp;rsquo;espace résultat est encore accru. Dans cet article, nous décrivons une indexation relationnelle du corpus basée sur des valeurs d&amp;rsquo;exhaustivités et de spécificités relatives entre doxels inter-reliés ; ajoutée à l&amp;rsquo;indexation structurelle, elle permet d&amp;rsquo;enrichir l&amp;rsquo;index des doxels et permettra de favoriser la navigation dans l&amp;rsquo;espace résultat.&lt;/p&gt;</description>
    </item>
    <item>
      <title>La fiabilité des informations sur le web: le cas Wikipédia.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.449/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.449/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les outils de recherche d&amp;rsquo;information sur le web doivent tenir compte des phénomènes nouveaux liés à l&amp;rsquo;apparition des blogs, wikis, et autres publications collaboratives. Parmi ces sites, l&amp;rsquo;encyclopédie Wikipédia constitue une source importante d&amp;rsquo;information. La qualité de ses informations a pourtant été récemment mise en cause. Mieux connaître les comportements des contributeurs peut permettre de guider les utilisateurs dans des contenus de qualité parfois disparate. Pour explorer cette voie, nous présentons une analyse du rôle de différents types de contributeurs dans le contrôle de la publication d&amp;rsquo;articles conflictuels.&lt;/p&gt;</description>
    </item>
    <item>
      <title>La reformulation hybride des requêtes exploratoires à l&#39;aide de concepts explicites et implicites.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-20/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-20/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les requêtes exploratoires du Web sont souvent courtes et ambigües. De plus, l&amp;rsquo;utilisation des entités nommées dans ce type de requêtes est fréquente. Dans cet article, nous explorons l&amp;rsquo;expansion des requêtes exploratoires par l&amp;rsquo;ajout de termes appartenant aux concepts de la requête. Nous distinguons deux types de concepts : explicites, correspondants aux enti- tés nommées ayants des références aux concepts de l&amp;rsquo;ontologie YAGO, et implicites que nous trouvons à l&amp;rsquo;aide de l&amp;rsquo;approche LSI (Indexation par la sémantique latente) sur les documents de retour de pertinence. Nous proposons une modélisation hybride qui permet d&amp;rsquo;intégrer les termes d&amp;rsquo;expansion extraits de ces deux types de concepts dans la requête. Nos expériences sur une collection issue du Web (WT10G) montrent que notre approche améliore significative- ment un modèle de base sans expansion, et elle a une meilleur performance qu&amp;rsquo;une approche classique de retour de pertinence.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Organizing Personnal Photo Collections Using Both Contextual Metadata and Content Analysis.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.397/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.397/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Avec l&amp;rsquo;utilisation croissante des téléphones mobiles, le nombre de collections de photos personnelles a augmenté de façon remarquable. Ces photos sont conservées le plus souvent sans être organisées, car ce processus, lorsqu&amp;rsquo;il est réalisé de manière manuelle, est une activité chronophage. L&amp;rsquo;indexation de ces photos est un besoin crucial pour rendre la recherche d&amp;rsquo;image par le contenu (CBIR) efficace. Afin d&amp;rsquo;annoter ces photos, on peut distinguer deux types de métadonnées : les métadonnées contextuelles, relatives à l&amp;rsquo;environnement lors de la prise, et les métadonnées relatives au contenu des photos. La création de métadonnées contextuelles pertinentes peut être réalisée, en situation, à l&amp;rsquo;aide de capteurs mobiles, ou ultérieurement, en activant des services Web afin d’enrichir les métadonnées brutes captées. De cette manière, il est par exemple possible d&amp;rsquo;annoter une photo avec la date, l’heure, et le lieu (ce sont des informations captées), mais aussi avec les conditions météorologiques du moment de la prise (informations obtenues dans ce cas par l’activation d’un service web météorologique). Cependant, même si ces métadonnées sont assez riches et offrent des possibilités de requêtes originales et intéressantes (été 2010, après-midi à Londres, jardin de Luxembourg en hiver, photos en présence de Anna par temps chaud, etc.), elles sont avant tout contextuelles (elles renseignent sur ce qu’il se passe autour de la photo) et ne décrivent souvent pas entièrement ce qui est dans la photo. S’agissant du contenu des photos, il existe un ensemble de méthodes souvent complexes pour mener une analyse approfondie de l&amp;rsquo;image (reconnaissance des bâtiments, des visages, des objets, distinction de l’intérieur/extérieur, etc.). Pour identifier des objets sur une image, il faut transformer l’information de bas niveau (histogrammes de couleurs, textures, formes, etc.) en une information de haut niveau (sémantique). Analyser des images de bas niveau est maintenant devenu un processus bien maîtrisé, mais qui n’offre pas une description suffisamment riche de l&amp;rsquo;image (c’est ce qu’on appelle le fossé sémantique ou semantic gap en anglais). Notre travail consiste à concevoir et développer une méthode d&amp;rsquo;annotation automatique des photos qui combine des métadonnées contextuelles et des informations extraites par une analyse du contenu. Notre objectif n’est pas seulement de construire un ensemble d’annotations à partir de la simple union de l’ensemble des métadonnées contextuelles, et de l’ensemble des informations de contenu, mais bien de construire de manière incrémentale et interactive ces deux ensembles. Ainsi, on cherchera à la fois à orienter l’extraction d’informations de contenu à partir des informations contextuelles, et à étendre, au besoin, l’ensemble des informations contextuelles afin d’aider le processus d’analyse du contenu lors d’une indétermination.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Quelle méthode ergonomique élaborer pour évaluer les moteurs de recherche exploratoire?</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les moteurs de recherche exploratoire sont des logiciels aidant les utilisateurs à explorer un domaine d&amp;rsquo;intérêt pour y faire des découvertes. Si l&amp;rsquo;on convient que l&amp;rsquo;évaluation de ces systèmes vise à vérifier si ces derniers aident effectivement les utilisateurs à réaliser leur tâche d&amp;rsquo;exploration et à obtenir des résultats inconnus, on constate que les méthodes existantes d&amp;rsquo;évaluation de ces systèmes ne permettent pas réellement cette vérification. Cet article présente une approche pour élaborer une méthode d&amp;rsquo;évaluation centrée utilisateurs prenant en compte les comportements et les processus cognitifs liés à une tâche de recherche exploratoire. Nous rapportons également nos premiers travaux comprenant en particulier des protocoles de tests utilisateurs et une modélisation de processus cognitifs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Synthèse de flux de messages en temps réel.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.33/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.33/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La supervision d&amp;rsquo;événements à travers les réseaux sociaux ont connu un engouement certain ces dernières années. Cependant, le nombre considérable de messages publiés rend dif- ficile, voire impossible, pour une personne de suivre &amp;lsquo;ce qui se passe autour de l&amp;rsquo;événement&amp;rsquo;. Le filtrage et la génération en temps réel d&amp;rsquo;une synthèse de messages importants portant sur l&amp;rsquo;événement permet de répondre à ce besoin. La génération de cette synthèse pose plusieurs problèmes qui rend cette tâche difficile. En effet, la synthèse doit être concise, non redondante et couvrant le maximum de sous événements, et ce, en sus de la pertinence des informations qu&amp;rsquo;elle contient. Dans cet article, nous proposons une nouvelle approche de sélection des mes- sages pour la génération, en temps réel, de résumés de flux de messages courts. La décision de sélectionner un message est prise instantanément, un nouveau message est ajouté au ré- sumé si ses scores afférents à l&amp;rsquo;informativité et à la non redondance sont supérieurs à un seuil dynamique. L&amp;rsquo;approche proposée a été évaluée sur la collection TREC 2014 TS et elle a été comparée avec trois approches de l&amp;rsquo;état de l&amp;rsquo;art. Le résumé généré est de meilleure qualité que celui généré par les approches de &amp;lsquo;base&amp;rsquo; avec un nombre réduit de phrases.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Une mesure de similarité sémantique utilisant des résultats de psychologie.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.371/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.371/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;utilisation d&amp;rsquo;ontologies, c&amp;rsquo;est-à-dire de bases de connaissances, en recherche d&amp;rsquo;infor- mation est devenue une voie très explorée. Cela permet de dépasser de nombreux problèmes liés aux comparaisons terme à terme entre documents ou entre documents et requêtes, en pas- sant à un niveau d&amp;rsquo;abstraction supérieur qui n&amp;rsquo;est pas soumis aux limitations intrinsèques à l&amp;rsquo;utilisation de mots-clés. De nombreuses techniques utilisent désormais les ontologies (expan- sion de requêtes, désambiguïsation sémantique, etc.) dans le but d&amp;rsquo;obtenir de meilleurs résultats en recherche d&amp;rsquo;information. Un problème récurrent de ces applications est la mesure de proxi- mité entre concepts dans une ontologie. Elle a été étudiée par de nombreux auteurs, et deux grandes approches se sont détachées : les approches basées sur les arcs, c&amp;rsquo;est-à-dire sur la structure de l&amp;rsquo;ontologie, et les approches utilisant le contenu informatif des concepts, donc en passant par des corpus renseignant l&amp;rsquo;importance des concepts dans un document. Nous avons eu besoin de comparer les mesures classiques de distance entre concepts dans une ontologie. Des résultats de psychologie nous ont amenés à en choisir une qui respecte plus la manière dont un humain juge la proximité entre entités.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers une catégorisation visuelle facilitant le partage de connaissances en mode Web 2.0.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.431/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.431/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Une classification efficace des connaissances partagées facilite la recherche des informations dans une communauté en utilisant des tags bien structurés. Cependant, la construction d&amp;rsquo;une telle catégorisation collabirative est de plus en plus confrontée aux défis des langues, des thématiques multiples, et des cas où les connaissances partagées sont très variées. Dans cet article, nous introduisons un système iconique structuré qui permettra d&amp;rsquo;alémliorer la catégorisation textuelle dans un contexte multi-contributeurs (en mode &amp;ldquo;Web 2.0&amp;rdquo;). Ce système est visuellement cohérent grâce à un &amp;ldquo;repère graphique&amp;rdquo; organisé explicitement. Nous illustrons cette approche par une application envisagée pour le portail Defismed, où participent de nombreux contributeurs de projets scientifiques en Méditerranée, visant un large public.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classement collaboratif de manuscrits.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.511/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.511/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Pour chaque projet d&amp;rsquo;édition numérique de manuscrits, après que le corpus ait été constitué, les chercheurs commencent par le classer. Cette opération demande de grands ef- forts d&amp;rsquo;interprétation, elle n&amp;rsquo;est pas neutre mais contribue à la construction du point de vue du chercheur sur son objet d&amp;rsquo;étude. Ainsi, plusieurs classements peuvent être proposés pour un même sous-ensemble de l&amp;rsquo;archive. Or il n&amp;rsquo;existe pas de plateforme informatique spécifi que pour assister les chercheurs dans cette opération délicate. Nous en proposons une sous la forme d&amp;rsquo;un service Web et d&amp;rsquo;une IHM qui prennent en compte les spécifi cités de la tâche de classe- ment et peuvent profi ter à tout projet qui étudie un corpus de documents numérisés dans un des domaines des Humanités.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Evaluation des performances d&#39;un système de recherche d&#39;information utilisant un algorithme de segmentation thématique de pages Web.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.457/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.457/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons une méthode de segmentation thématique de pages Web qui utilise à la fois des critères visuels et de format (balises &lt;HR&gt;, &lt;H1&gt;, couleur, &amp;hellip;)]]&amp;gt; afin d&amp;rsquo;extraire des segments thématiques. Nous utilisons la segmentation pour améliorer les performances d&amp;rsquo;un système de recherche d&amp;rsquo;information. Nous proposons de modéliser une fonction de correspondance qui tienne compte à la fois du contenu d&amp;rsquo;une page Web et du voisinage de cette page définis par les segments thématiques appelés blocs thématiques qui la référencent. Ce voisinage est calculé dynamiquement en pondérant les liens hypertextes reliant les blocs thématiques aux pages Web en fonction des termes de la requête contenus dans ces blocs thématiques. Notre approche montre de bons résultats sur la collecion TREC.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Exploiting Wikipedia Structure for Short Query Expansion in Cultural Heritage.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-21/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-21/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article aborde le problème des requêtes courtes et précises, qui n&amp;rsquo;ont pas suffisamment d&amp;rsquo;informations pour être non ambigües. Le pseudo-relevance feedback (PRF) est une technique efficace pour améliorer la performance de ces requêtes courtes par l&amp;rsquo;ajout de termes `a la requ^ete. Cependant, cette méthode ne récupère que les termes des documents les plus pertinents de la collection. Si les réponses initiales ne sont pas correctes, comme c&amp;rsquo;est le cas pour des requêtes courtes, cette expansion ne fonctionnera pas. Par cons´equent, nous présentons à la place du PRF, une méthode d&amp;rsquo;expansion sémantique des requêtes basée sur Wikipedia. Nous étendons requêtes courtes par des termes sémantiquement liés. Nous adaptons les modèles de langue pour évaluer les requêtes étendues. Les expérimentations sur une corpus CLEF du patrimoine culturel montrent une am´elioration significative de la performance. Nous montrons que le nombre de termes d&amp;rsquo;expansion a un impact important sur l&amp;rsquo;amélioration de la précision.&lt;/p&gt;</description>
    </item>
    <item>
      <title>L&#39;arbre recouvrant dans l&#39;interrogation de documents XML.</title>
      <link>http://www.asso-aria.org/coria/2007/papers/coria.2007.491/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2007/papers/coria.2007.491/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article nous présentons un modèle d&amp;rsquo;interrogation flexible de données&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper, we propose a fuzzy model to querying the XML documents, by taking into account not only the document contents, but also their structure. The concept of minimal size spanning tree is employed to determine the fragments of documents which coincide as much as possible with a query tree and the fuzzy logic framework is used to represent a user&amp;rsquo;s criteria through weighted formulas according to the level of user&amp;rsquo;s knowledge in documents structures&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche d&#39;Information efficace utilisant la sémantique: le focus.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.377/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.377/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;indexation sémantique de documents à partir d&amp;rsquo;ontologies est un domaine qui prend de l&amp;rsquo;essor, malgré les difficultés d&amp;rsquo;une indexation automatique ou même semi-automatique, sans parler d&amp;rsquo;indexation manuelle. Il est possible désormais d&amp;rsquo;avoir des caractérisations séman- tiques de documents textuels ou non textuels basées sur des ontologies. Partant de ce fait, nous avons mis en place un objet, le focus, qui représente un document ou une requête en pondé- rant les concepts d&amp;rsquo;une ontologie de manière à indiquer l&amp;rsquo;importance de chaque concept dans le document. Néanmoins, pour être utilisable, cette solution doit définir précisément ce qu&amp;rsquo;est une normalisation pour un focus.C&amp;rsquo;est ce que nous avons fait, en introduisant les notions de normalisation par le maximum et de normalisation par la somme. Ensuite nous avons étudié les propriétés que nous désirons pour une mesure de comparaison entre focus, ce qui nous a permis de définir la pertinence relative d&amp;rsquo;un focus par rapport à un autre, mesure qui n&amp;rsquo;est pas une distance.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Représentation temporelle des mots : application au clustering de micro-blogs.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.37/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.37/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les modèles distribués de mots sont un outil précieux pour la classification, le clustering, et plus généralement la représentation des documents. Pour des collections dynamiques, il est nécessaire de prendre en compte l&amp;rsquo;évolution temporelle de ces représentations. Dans cet article, nous présentons un modèle qui représente les mots sous la forme de trajectoires dans un espace de représentation, trajectoires qui sont déterminées par les groupes auxquels les mots appartiennent. Des expériences préliminaires en clustering sur des micro-blogs montrent l&amp;rsquo;intérêt de ce type de modèle.&lt;/p&gt;</description>
    </item>
    <item>
      <title>RI sociale : intégration de propriétés sociales dans un modèle de recherche.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose une approche de recherche d&amp;rsquo;information, basée sur le contenu généré par l&amp;rsquo;utilisateur (CGU). Nos travaux se focalisent sur l&amp;rsquo;exploitation des CGUs dans la recherche des ressources web (pages, vidéos, etc). En particulier, nous nous intéressons à identifier, extraire et quantifier, à partir de plusieurs réseaux sociaux, certaines propriétés de ces CGUs, telles que la popularité et la confiance. Ces propriétés vont être intégrées dans un modèle de ranking. Plus précisément, nous proposons un modèle qui prend en considération ces propriétés sociales, en les combinant avec la pertinence thématique afin d&amp;rsquo;améliorer le tri des résultats renvoyés par un moteur de recherche. Nous avons évalué notre modèle sur une collection de test extraite du site Web &amp;lsquo;imdb.com&amp;rsquo;. Les résultats obtenus montrent l&amp;rsquo;efficacité de notre modèle par rapport à la recherche d&amp;rsquo;information classique.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Sous-graphes de cooccurrences pour la détection de thématiques dans un corpus de taille moyenne.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.437/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.437/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier aborde la question de la classification non supervisée de documents, dans un contexte de veille sur le Web (corpus de taille moyenne). Notre but est d&amp;rsquo;assister le veilleur dans deux tâches : 1. dégager des thématiques à partir du corpus ; 2. ranger chaque texte dans une ou plusieurs de ces thématiques. Nous proposons une approche linguistique, reposant sur les plus proches voisins partagés dans un graphe de cooccurrences. Nos thématiques peuvent se chevaucher (partager des mots) et ne sont pas uniquement des ensembles de mots : le forma- lisme de la théorie des graphes nous permet d&amp;rsquo;exprimer concrètement des relations sémantiques fines entre les mots de chaque thématique. Les premiers résultats sont très encourageants.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Towards automatic cross-lingual transfer of semantic annotation.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.403/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.403/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Afin de développer un système d&amp;rsquo;étiquetage sémantique automatique, les méthodes les plus fréquentes utilisent l&amp;rsquo;apprentissage supervisé à partir d&amp;rsquo;un corpus annoté. Et si on a des délais courts et des possibilités humaines et financières limitées, qui nous empêchent de construire un tel corpus d&amp;rsquo;apprentissage pour la langue de notre choix? Si un tel corpus existe déjà pour une autre langue, cet article propose une méthode pour importer automatiquement le corpus existant dans la langue où nous le nécessitons. La méthode de transfert présentée dans cet article est basée sur la traduction du corpus existant (ou l&amp;rsquo;utilisation d&amp;rsquo;une version parallèle annotée du texte), l&amp;rsquo;alignement au niveau du mot des deux versions de texte, et l&amp;rsquo;application d&amp;rsquo;un set de fonctions de mappage pour importer l&amp;rsquo;annotation d&amp;rsquo;une langue à l&amp;rsquo;autre. Une interface de validation de l&amp;rsquo;import est également offerte pour la validation manuelle de la ressource obtenue. A titre d&amp;rsquo;exemple, le cas de l&amp;rsquo;import des rôles sémantiques de la ressource anglaise FrameNet vers le roumain est discuté.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Using Association Rules between Terms and Nominal Syntagms for Tweet Contextualization.</title>
      <link>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2015/papers/coria.2015.rjc_8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le but de la tâche de contextualisation des tweets organisée par INEX est de fournir, automatiquement, un résumé qui explique un tweet donné. Cet article présente une nouvelle approche de contextualisation des tweets basée sur les règles d&amp;rsquo;association entre syntagmes, et entre termes. Cette approche permet d&amp;rsquo;enrichir le vocabulaire de tweets par un ensemble de mots thématiquement proches. L&amp;rsquo;approche proposée est validée par une étude expérimentale sur la collection INEX 2013.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de classification des requêtes basée sur la confiance et la couverture.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-22/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-22/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les requêtes médicales sont souvent étiquetées par le type du modèle de recherche estimé donnant les meilleures performances selon des experts du domaine. Dans un travail pré- cédent, nous avons proposé d&amp;rsquo;automatiser cette tâche d&amp;rsquo;étiquetage (de classification) manuelle. Dans ce papier, nous proposons une nouvelle approche de classification qui apprend automati- quement à associer à chaque requête l&amp;rsquo;étiquette du modèle de recherche le plus adéquat. Plus précisément, nous générons un ensemble de règles d&amp;rsquo;association combinant certaines carac- téristiques des requêtes et les étiquettes des modèles de recherche. Ensuite, les requêtes dont les règles d&amp;rsquo;association remplissent les conditions seront étiquetées par les règles. Les autres, peuvent être automatiquement étiquetées en se référant à certaines caractéristiques spécifiques.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification des questions d&#39;opinion dans un système de questions-réponses pour les débats politiques.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_4/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_4/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;identification du type de la question est une étape importante dans le développement des Systèmes de Questions-Réponses (SQR). Ramenée le plus souvent à un problème de classification, cette étape vise à déterminer le type de la réponse attendue à la question en attribuant à la question une ou plusieurs classes selon la taxonomie adoptée. Dans la littérature, la plupart des SQR se sont orientés vers des sources d&amp;rsquo;information monologales. Les conversations, bien qu&amp;rsquo;elles constituent une partie importante des sources d&amp;rsquo;information, manquent d&amp;rsquo;outils robustes de recherche d&amp;rsquo;information tels que les SQR. Dans cet article, nous proposons une nouvelle taxonomie et une approche pour la classification des questions d&amp;rsquo;opinion dans le cadre d&amp;rsquo;un SQR arabe pour les débats politiques. Les résultats obtenus sont pertinents et atteignent une précision moyenne de l&amp;rsquo;ordre de 89,51 %.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection et reconnaissance de texte dans les documents vidéos. Et leurs apports à la reconnaissance de personnes.</title>
      <link>http://www.asso-aria.org/coria/2011/papers/coria.2011.409/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2011/papers/coria.2011.409/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article présente les différentes étapes de reconnaissance des caractères dans un système de reconnaissance multimodale de personnes dans des documents audiovisuels (défi ANR REPERE). La détection du texte est réalisée par une technique basée sur les caracté- ristiques du texte (texture, couleur, contraste, géométrie, suivi temporel, mesure du gradient cumulé). La reconnaissance du texte est ensuite effectuée avec le logiciel libre de Google Tes- seract. La méthode a été évaluée sur un corpus de journal télévisé contenant 59 vidéos du journaux télévisés de France 2.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extraction des connaissances à partir du Web pour la recherche des images géoréférencées.</title>
      <link>http://www.asso-aria.org/coria/2009/papers/coria.2009.519/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2009/papers/coria.2009.519/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les bases de données géoréférencées connaissent un rôle croissant dans une grande variété de domaines d&amp;rsquo;application. La création manuelle de ces bases de données est cependant une opération coûteuse. Cela a suscuté un intérêt pour l&amp;rsquo;automatisation de leur construction, par exemple, par l&amp;rsquo;exploitation des informations géographiques présentes sur le Web. Dans ce travail, nous présentons une nouvelle approche automatique pour la construction d&amp;rsquo;une base de données géoréférencées multilingues et à large échelle en se basant principalement sur l&amp;rsquo;encyclopédie collaborative Wikipedia pour identifier les noms géographiques, catégoriser ces noms, trouver leurs coordonnées géographiques et les classer selon une estimation de leur pertinence. La base de connaissances obtenue a été intégrée dans ThemExplorer, une application de recherche d&amp;rsquo;images géoréférencées.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Reconnaissance de l&#39;écriture arabe multifonte à très basse résolution.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.443/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.443/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans ce travail une approche de reconnaissance de textes arabes imprimés hors-ligne à vocabulaire ouvert et à très basse résolution (72 dpi). La méthode est basée sur les Modèles de Markov Cachés en utilisant la boite à outils HTK. La nouveauté de QRWUH WUDYDLO HVW GDQV O¶DQDO\VH GH FH W\SH GH V\VWqPHV VXU Wrois fontes de calligraphie complexe et présentant de fortes ligatures : DiwaniLetter, DecoTypeNaskh et DecoTypeThuluth. Nous proposons une extraction de caractéristiques basée sur O¶Xsage de primitives statistiques et structurelles permettant une description robuste des différentes variabilités morphologiques des fontes considérées. Le système proposé est évalué sur la base APTI (Arabic Printed Text Image).&lt;/p&gt;</description>
    </item>
    <item>
      <title>REDENE - Recherche documentaire assistée par ontologies de domaine adaptatives.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.467/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.467/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La subjectivité des connaissances devient une dimension incontournable qui se doit d&amp;rsquo;être intégrée et prise en compte dans le processus d&amp;rsquo;Ingénierie des Ontologies (IO). Le projet REDENE est fondé (i) sur une formalisation des résultats obtenus en psychologie cognitive sur le fonctionnement de la mémoire humaine- en tenant compte des hypothèses établies dans le domaine des neurosciences- et (ii) sur l&amp;rsquo;intégration et l&amp;rsquo;exploitation d&amp;rsquo;un telle formalisation au sein des processus de recherche d&amp;rsquo;information basés sur l&amp;rsquo;usage d&amp;rsquo;ontologies.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Tweet Contextualization Approach Based on Wikipedia and Dbpedia.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.28/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.28/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La taille des tweets est limitée à un nombre maximum de caractères. Cette contrainte liée à la taille du message entraîne l&amp;rsquo;utilisation d&amp;rsquo;un vocabulaire particulier rendant le tweet difficile à comprendre. La tâche de contextualisation des tweets vise à fournir, automatique- ment, un résumé qui explique un tweet donné, ce qui permet au lecteur de bien le comprendre. Nous proposons pour cela différentes méthodes basées sur deux énormes sources de connais- sances à savoir, Wikipédia et Dbpedia. L&amp;rsquo;efficacité de notre méthode est prouvée par une étude expérimentale menée sur la collection d&amp;rsquo;INEX 2014.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Unnatural language detection.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.383/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.383/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le contexte des moteurs de recherche sur le web, l&amp;rsquo;escalade entre les techniques de classement et les techniques de spamdexing a conduit à l&amp;rsquo;apparition de faux contenus dans les pages web. Si les séquences aléatoires de mots-clés sont facilement détectables, les pages web produites par des générateurs automatiques dédiés sont beaucoup plus difficiles à détecter. Motivé par cette application, on se concentrera sur le problème plus général de la détection du catactère peu-naturel d&amp;rsquo;un texte. On étudiera à la fois les aspects syntaxiques et sémantiques du problème, et pour chacun d&amp;rsquo;eux on présentera des approches probabilistes et symboliques.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Extension automatique d&#39;annotation et classification de documents en utilisant un modèle graphique probabiliste.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Avec la prolifération des images de documents, l’annotation de documents est devenue&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;With the fast growth of document images, document annotation has become a research&lt;/p&gt;</description>
    </item>
    <item>
      <title>Génération de réponses pour un système de questions-réponses.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.449/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.449/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les systèmes de questions-réponses (SQR) actuels répondent à une question posée par l&amp;rsquo;utilisateur en langue naturelle par une information précise ainsi qu&amp;rsquo;un passage de document justifiant cette information. Le principal défaut de ces réponses est qu&amp;rsquo;elles ne créent pas d&amp;rsquo;interaction avec l&amp;rsquo;utilisateur, ce qui peut être problématique, en particulier dans le cas où le SQR est intégré dans un système de dialogue oral. Cet article présente un système générant des réponses en langue naturelle et pouvant être intégré à tout SQR.&lt;/p&gt;</description>
    </item>
    <item>
      <title>KWSim: Concepts Similarity Measure.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.475/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.475/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La comparaison des images médicales annotées manuellement peut être réalisée grâce à une comparaison lexicale entre des mots-clés ou en utilisant des thésaurus médicaux existants pour calculer une similarité sémantique entre ces mots. Dans cet article, nous présentons tout d&amp;rsquo;abord la mesure KW Sim, une technique entièrement automatisée pour le calcul de la similarité sémantique en mappant des concepts (mots-clés) aux différents thésaurus médicaux et en examinant le type de relation u is-a ». Une similarité entre les vecteurs de mots-clés est également présentée, basée sur la mesure KW Sim. Notre approche est implémentée en utilisant MeSH, ICD-10 et SNOMED CT thésaurus et comparée avec deux autres approches existantes. Nous illustrons notre méthode avec un assistant d&amp;rsquo;annotation en ligne et en temps réel.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réédition de documents numériques guidée par un modèle utilisateur.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.389/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.389/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Notre travail se situe dans un contexte où une requête documentaire dans une base de documents XML d&amp;rsquo;un domaine spécifique fournit une masse de documents inexploitable par un humain. Un post-traitement que nous appelons réédition est alors indispensable: il consiste à utiliser des unités d&amp;rsquo;information qui sont les éléments XML provenant des documents résultats de la requête pour composer de nouveaux documents. Une balise XML n&amp;rsquo;ayant pas de signification intrinsèque mais une interprétation donnée par son auteur, nous associons à chaque élément XML des connaissances spécifiques pour la réédition. Un ensemble conséquent de primitives de réédition ainsi qu&amp;rsquo;un langage de combinaison de tâches ont été définis, permettant l&amp;rsquo;utilisation des unités et des connaissancse supplémentaires pour composer des documents. Enfin, un modèle utilisateur permet, grâce à des règles liées au domaine, de choisir et paramétrer les combinaisons de tâches de réédition à utiliser au moment de présenter les résultats du système de recherche d&amp;rsquo;information.&lt;/p&gt;</description>
    </item>
    <item>
      <title>RI dans les microblogs : que manque-t-il aux approches classiques ?</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_5/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_5/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous nous intéressons dans cet article à la recherche d&amp;rsquo;information dans les microblogs. Les modèles de RI classiques, conçus pour des textes plus longs que les 140 caractères d&amp;rsquo;un microblog, ne sont pas forcément adaptés pour ces derniers. Une analyse de leurs résultats nous a permis d&amp;rsquo;identifier la différence de vocabulaire entre les microblogs et la requête comme étant la raison principale de leur manque de performance. Pour améliorer la qualité de la recherche, nous proposons d&amp;rsquo;étendre les microblogs grâce au texte des URL qu&amp;rsquo;ils contiennent, et également d&amp;rsquo;étendre les requêtes avec WordNet ou en utilisant des articles de presse. Les résultats montrent l&amp;rsquo;intérêt de l&amp;rsquo;extension des tweets, celui de l&amp;rsquo;extension des requêtes restant à prouver.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Stratégies de supervision pour l&#39;apprentissage en-ligne d&#39;un classifieur évolutif de commandes gestuelles.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-22/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-22/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les interfaces homme-machine tactiles permettent de nouveaux modes d&amp;rsquo;interaction comme l&amp;rsquo;utilisation de commandes gestuelles. Afin de mémoriser facilement plus d&amp;rsquo;une dou- zaine de commandes, il est important de pouvoir les personnaliser. Le classifieur utilisé pour reconnaitre les symboles dessinés doit donc être personnalisable, pouvoir s&amp;rsquo;initialiser à partir de très peu de données, et évolutif, pouvoir s&amp;rsquo;améliorer pendant son utilisation. Ces travaux étudient l&amp;rsquo;importance et les différentes stratégies d&amp;rsquo;étiquetage du flux de données d&amp;rsquo;utilisation pour l&amp;rsquo;apprentissage en-ligne du classifieur. Nous comparons sept stratégies de supervision, dépendants des interactions utilisateur (sollicitation par le système) et des capacités d&amp;rsquo;auto- évaluation du classifieur (notion de rejet). Nous montrons dans cet article que la stratégie don- nant les meilleurs résultats est d&amp;rsquo;apprendre à partir des données validées implicitement par l&amp;rsquo;utilisateur, et de celles soumises à validation explicite car rejetées par le classifieur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Aide à la gestion des processus de numérisation en vue de l&#39;OCRisation des ouvrages.</title>
      <link>http://www.asso-aria.org/coria/2012/papers/coria.2012.455/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2012/papers/coria.2012.455/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous étudions deux pistes afin d&amp;rsquo;améliorer le processus de numérisa- tion des documents de la Bibliothèque nationale de France en vue de leur OCRisation. Dans la première partie, nous étudions les corrélations qui existent entre les données bibliographiques du document et les décisions de sélection des documents. Dans la deuxième partie, nous pré- sentons une méthode basée sur la précision et le rappel qui va nous servir à estimer le taux de reconnaissance caractères pour vérifier les résultats de l&amp;rsquo;OCRisation sans recours à une vérité terrain. Nous présentons également un état de l&amp;rsquo;art des méthodes de segmentation dans le but de vérifier la qualité de celle issue de l&amp;rsquo;OCRisation.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification et extraction des documents complexes à partir des images issues d&#39;un périphérique mobile : application aux documents d&#39;identité.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-13/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-13/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article une méthode de classification des images de documents&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;We propose in this paper a document image classification method. In contrary to&lt;/p&gt;</description>
    </item>
    <item>
      <title>Productions d&#39;annotations par plan pour l&#39;indexation des vidéos.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_6/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_6/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La qualité des annotations dans les vidéos d&amp;rsquo;entraînement joue un rôle très important dans la qualité des systèmes de détection automatique d&amp;rsquo;événements dans les vidéos. Dans cet article, nous proposons une méthode pour la génération d&amp;rsquo;annotations au niveau des plans à partir d&amp;rsquo;annotations au niveau des vidéos complètes. Cette méthode utilise des techniques de filtrage en fonction du contenu visuel des vidéos et elle est basée sur l&amp;rsquo;idée que les plans conte- nant un événement donné ont tendance à être semblables entre eux contrairement aux plans ne contenant pas cet évènement, qui auront plus tendance à être différents du reste des plans. La méthode a été implémentée et évaluée dans le cadre de la tâche de détection d&amp;rsquo;événements mul- timédias (MED) à TRECVID 2011. Les expérimentations montrent que l&amp;rsquo;approche ne permet pas toujours une amélioration mais produit un gain pour certains événements.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Reformulation de Requêtes par Structure en RI dans les documents structurés.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.395/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.395/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La reformulation de requêtes permet d&amp;rsquo;enrichir une requête initiale en fonction de jugements de pertinence afin d&amp;rsquo;exprimer d&amp;rsquo;avantage les besoins de l&amp;rsquo;utilisateur. De nouvelles problématiques sont soulevées lorsque la reformulation s&amp;rsquo;effectue sur des corpus de documents semi-structurés de type XML. Les différentes approches qui ont été développées sont en général basées sur le contenu seul des éléments. Notre contribution consiste à mettre en oeuvre une nouvelle approche permettant d&amp;rsquo;étendre la requête initiale avec une structure générique et des mots-clés. Cette approche peut être appliquée à la fois sur des requêtes structurées ou non structurées. Nos expérimentations ont suivi le protocole d&amp;rsquo;évaluation INEX et montrent l&amp;rsquo;intérêt de notre proposition pour certains types de requêtes.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un moteur d&#39;appariement et transformation de sous-arbres pour la conception interactive de scénarios d&#39;analyse d&#39;images de documents.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-23/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-23/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit un nouveau moteur d&amp;rsquo;extraction d&amp;rsquo;éléments de contenu et d&amp;rsquo;analyse de structures de pages numérisées. Cette nouvelle méthode se base sur un mécanisme original d&amp;rsquo;appariement séquentiel et de transformation de sous-arbres. Les sous- arbres permettent la description des structures à localiser dans l&amp;rsquo;état courant de l&amp;rsquo;interprétation du document représenté également par une structure arborescente. Un algorithme de recherche d&amp;rsquo;appariements sous contraintes de sous-arbres pouvant être exploité de manière incrémental permet la mise en place interactive de scénarios d&amp;rsquo;analyse cherchant à répondre aux besoins spécifiques de chaque usager. Ainsi, l&amp;rsquo;originalité de notre approche réside dans l&amp;rsquo;opportunité que nous offrons aux utilisateurs de pouvoir construire de manière interactive des scénarios d&amp;rsquo;analyse incrémentale d&amp;rsquo;images à moindre coût. Le but est de laisser l&amp;rsquo;utilisateur concevoir comme bon lui semble sa chaine de traitement en faisant évoluer une représentation des images sous forme d&amp;rsquo;arbre d&amp;rsquo;éléments de contenu de manière progressive.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un système d&#39;aide à la recherche d&#39;information en ligne basé sur les ontologies (SA-RI-Onto).</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.483/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.483/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La croissance très importante des informations disponibles sur Internet nécessite des outils de recherche de plus en plus performants permettant de discerner efficacement les informations intéressantes parmi des centaines voire des milliers de documents. Seulement, la qualité des résultats fournis par les moteurs de recherche traditionnels n&amp;rsquo;est pas toujours pertinente surtout quand il s&amp;rsquo;agit de composer plus d&amp;rsquo;une requête. Ceci est dû aux ambiguïtés linguistiques et aux concepts abstraits qui ne sont pas bien traités. L&amp;rsquo;utilisation de la sémantique et plus précisément des ontologies présente des atouts importants. L&amp;rsquo;objectif de cet article est de montrer l&amp;rsquo;apport des ontologies dans la recherche d&amp;rsquo;information en ligne. Ainsi, un système d&amp;rsquo;aide à la recherche d&amp;rsquo;information en ligne basé sur les ontologies est proposé. Ce système est composé de deux ontologies :une ontologie de domaine et une ontologie de services ainsi que WordNet, pour représenter les concepts ainsi que les services de domaine. La contribution de ces ontologies pour améliorer la recherche d&amp;rsquo;information en ligne est montrée par la proposition et l&amp;rsquo;expérimentation d&amp;rsquo;un système de recherche d&amp;rsquo;information en ligne basé sur les ontologies.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Accès personnalisé multicritères à de multiples sources d&#39;informations.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.401/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.401/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit une approche de la recherche d&amp;rsquo;information permettant l&amp;rsquo;accès personnalisé à plusieurs sources d&amp;rsquo;informations. L&amp;rsquo;accès à des sources d&amp;rsquo;informations distribuées est souvent effectué en trois étapes, la première consiste à sélectionner les sources pertinentes pour la requête, puis soumettre la requête à ces sources sélectionnées et finalement fusionner les résultats retournés par ces sources. L&amp;rsquo;objectif de cet article est d&amp;rsquo;intégrer l&amp;rsquo;utilisateur via son profil dans les processus de sélection et de fusion des résultats des sources.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Approche par réutilisation d&#39;annotations sémantiques pour la recherche d&#39;information sur le web.</title>
      <link>http://www.asso-aria.org/coria/2008/papers/coria.2008.491/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2008/papers/coria.2008.491/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons une nouvelle approche d&amp;rsquo;aide à la recherche d&amp;rsquo;information sur le web. Elle a pour objectif de présenter à l&amp;rsquo;utilisateur courant des documents réponses pertinents pour sa requête et adaptés à son profil. Elle consiste à utiliser le mécanisme du Raisonnement à Partir de Cas (RàPC) pour mémoriser les sessions de recherche effectuées par les utilisateurs (profil utilisateur, requête, annotation d&amp;rsquo;un document pertinent, date) et à les réutiliser lorsqu&amp;rsquo;une session de recherche similaire se présente. La réutilisation des annotations au cours d&amp;rsquo;une session courante, permet en outre de reformuler automatiquement la requête courante en vue d&amp;rsquo;améliorer la qualité des réponses pour la session courante. Nos propositions ont été validées et testées par le développement du système SYRANNOT implémenté en java, utilisant l&amp;rsquo;infrastructure JENA (hp) et se servant de Google. Les premières évaluations expérimentales montrent une nette amélioration des résultats proposés par notre système relativement à google.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Filtrage de descripteurs locaux pour l&#39;amélioration de la détection de documents.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-18/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-18/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article propose une méthode simple et efficace qui vise à réduire la quantité de descripteurs locaux à indexer dans un scénario de mise en correspondance d’images de do- cuments. Au cours d’une étape d’entraînement préalable, la mise en correspondance entre un document modèle et un ensemble d’images contenant une instance de ce modèle est calculée en ne retenant que les descripteurs locaux du modèle qui produisent des appariements corrects de façon régulière. Cette approche a été évaluée sur la base de données ICDAR2015 SmartDOC qui contient environ 25 000 images de documents capturées avec un dispositif mobile. L’intérêt de cette étape de filtrage a été testée pour les descripteurs ORB et SIFT. Les résultats montrent un gain tant au niveau de la qualité des appariements finaux que du temps et de l’espace néces- saires aux calculs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>LearnPos : un nouvel outil pour l&#39;apprentissage interactif de positionnement.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-24/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-24/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;L&amp;rsquo;analyse de documents structurés nécessite la localisation de données à l&amp;rsquo;intérieur du document lors du processus de reconnaissance. Dans cet article, nous présentons LearnPos, un nouvel outil générique, indépendant de tout système de reconnaissance de document. LearnPos modélise et évalue le positionnement à partir d&amp;rsquo;un échantillon d&amp;rsquo;apprentissage de documents. L&amp;rsquo;utilisateur est ainsi assisté dans la définition de la structure physique du document. LearnPos peut fournir des positionnements absolus et relatifs, en interagissant avec l&amp;rsquo;utilisateur. Notre méthode permet de traiter des relations spatiales composées de plusieurs zones distinctes et est capable de fournir un ordre de parcours des différentes zones ainsi qu&amp;rsquo;un sens de lecture pour chacune des zones afin de minimiser les erreurs. Nous montrons que les opérateurs de position obtenus peuvent être utilisés pour la reconnaissance de documents structurés, tout en réduisant l&amp;rsquo;exploration manuelle du corpus de documents.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Reclassement sémantique pour l&#39;indexation de documents multimédia.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article décrit une nouvelle approche pour indexer des documents multimédia (vidéo avec son) par des concepts visuels. En plus des informations relatives au concept cible, l&amp;rsquo;idée développée propose d&amp;rsquo;intégrer la détection d&amp;rsquo;un ensemble d&amp;rsquo;autres concepts. L&amp;rsquo;avantage escompté par une telle combinaison est d&amp;rsquo;améliorer la performance d&amp;rsquo;un système d&amp;rsquo;indexa- tion profitant des relations entre les concepts. Des expérimentations sur le corpus TRECVID 2012 sont présentées et commentées. Notre méthode a permis d&amp;rsquo;améliorer significativement les performances d&amp;rsquo;un bon système, jusqu&amp;rsquo;à +6% sur la précision moyenne.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Intégration de connaissances syntaxiques dans les modèles de langue pour la RI.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.407/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.407/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;En Recherche d&amp;rsquo;Information (RI) les méthodes purement statistiques basées sur des distributions de mots-clef ont actuellement atteint une limite. Cette limite n&amp;rsquo;est franchissable que par l&amp;rsquo;apport massif de connaissances extérieures au sein du système de RI. Nos travaux portent sur l&amp;rsquo;utilisation en RI des liens de niveaux syntaxiques entre les termes. Nous considérons ainsi les dépendances syntaxiques contenues dans l&amp;rsquo;arbre de dépendance produit par des analyseurs syntaxiques de surface. Pour intégrer ces informations en RI, le contexte des modèles de langue nous semble favorable. En effet, l&amp;rsquo;aspect théorique des modèles de langue est très intéressant, il est adaptable et permet l&amp;rsquo;intégration de nouvelles connaissances. Nous présentons ici, l&amp;rsquo;intégration des liens syntaxiques au sein d&amp;rsquo;un modèle de langue. Ce modèle est évalué sur une partie de la collection de CLEF. Les résultats montrent que l&amp;rsquo;intégration des dépendances syntaxiques abaisse les performances du système de RI. Face à ces résultats, nous souhaitons pour la suite de ces travaux nous orienter vers l&amp;rsquo;apport d&amp;rsquo;information de niveau plus sémantique.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Un modèle probabiliste pour la détection de l&#39;incertitude dans le langage naturel.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.14/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.14/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La détection de l&amp;rsquo;incertitude dans le langage naturel est centrale pour le développe- ment de nombreux modèles exploitant l&amp;rsquo;analyse de textes e.g. questions-réponses, raisonnement approché, enrichissement de bases de connaissances. Après une synthèse des différentes clas- sifications de l&amp;rsquo;incertitude et des méthodes de détection correspondantes, cet article introduit une approche supervisée et générique de détection de l&amp;rsquo;incertitude. Celle-ci se base sur l&amp;rsquo;ana- lyse statistique de différentes caractéristiques lexicales et syntaxiques afin de construire une représentation vectorielle d&amp;rsquo;une phrase analysable par des méthodes de classification éprou- vées. L&amp;rsquo;évaluation que nous proposons tient compte des différentes dimensions de l&amp;rsquo;incertitude et de la nature des textes. Les résultats obtenus sur différents jeux de validation soulignent la performance globale de la méthode proposée et ouvrent de nombreuses perspectives.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vectorisation du modèle d&#39;appariement pour la recherche d&#39;images par le contenu.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_8/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_8/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le développement rapide des techniques de numérisation et de stockage a engendré une croissance accrue du volume des documents électroniques (textes, images, sons et vidéos). Pour faire face à cette grande masse d&amp;rsquo;informations, en particulier les images, il est nécessaire de développer des outils qui permettent d&amp;rsquo;optimiser l&amp;rsquo;accès à de telles sources de données. Le problème qui se pose est la représentation du contenu d&amp;rsquo;images, puisque les techniques actuelles ne permettent pas de décrire réellement le contenu. Dans ce papier, nous proposons une approche de recherche d&amp;rsquo;images par le contenu visuel, qui se base sur l&amp;rsquo;idée de transformer n&amp;rsquo;importe quel modèle d&amp;rsquo;appariement d&amp;rsquo;images (modèle de calcul de distance entre les vecteurs associés) à un modèle vectoriel fournissant un score. A travers quelques expériences, nous montrons que cette approche entraine une amélioration importante de la qualité des résultats.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers l&#39;alignement des signaux écrit et sonore. Application à la reconnaissance des expressions mathématiques.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-25/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-25/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous rapportons de nouveaux résultats sur la reconnaissance des expressions mathématiques (EMs). Nous abordons cette problématique en considérant l&amp;rsquo;aspect bimodal de l&amp;rsquo;information : c&amp;rsquo;est à dire exploiter à la fois le signal de parole et celui de l&amp;rsquo;écriture manuscrite représentant la même EM. Ceci permet de disposer de plus de fiabilité lors d&amp;rsquo;un trai- tement automatique, d&amp;rsquo;autant plus que ces deux modalités s&amp;rsquo;avèrent être très complémentaires. Nous proposons d&amp;rsquo;aligner les deux modalités grâce à un classifieur de type réseau de neurones et en adoptant un apprentissage original des associations écrit-audio. Nous avons évalué le système proposé sur la base bimodale HAMEX d&amp;rsquo;EMs. Nous avons également confronté les résultats obtenus à ceux obtenus par notre précédent système et un système de référence basé uniquement sur l&amp;rsquo;écriture seule.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification non supervisée floue des termes basée sur la proximité pour les systèmes de recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Le regroupement des termes basé sur la mesure de proximité est une stratégie menant efficacement à trouver les documents pertinents. Contrairement à ce qu&amp;rsquo;ont montré les études récentes qui ont utilisé la proximité des termes pour le classement des documents, le processus de recherche d&amp;rsquo;information est entièrement revu dans ce travail en ce qui concerne les étapes d&amp;rsquo;indexation et d&amp;rsquo;interrogation. Par conséquent, un Fichier Inverse Etendu est construit en ex- ploitant le concept de proximité des termes et en utilisant les technologies de classification non supervisée. Trois approches d&amp;rsquo;interrogation sont alors proposées, la première utilise l&amp;rsquo;expan- sion de la requête, la seconde est basée sur le Fichier Inverse Etendu et la dernière hybride les méthodes de recherche. De nombreuses expérimentations sur OHSUMED ont été effectuées et les résultats obtenus sont très prometteurs.&lt;/p&gt;</description>
    </item>
    <item>
      <title>La recherche d&#39;information: Une opportunité de collaboration pour les équipesdistribuées.</title>
      <link>http://www.asso-aria.org/coria/2006/papers/coria.2006.413/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2006/papers/coria.2006.413/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans le contexte économique actuel la division cognitive du travail et la distribution des connaissances et des compétences rendent nécessaires la mise en relation des individus. Dans cet environnement organisationnel turbulent se pose la question de l&amp;rsquo;accès et du repérage de l&amp;rsquo;information. Le modèle de recherche d&amp;rsquo;information que nous proposons ne se réduit pas à la diffusion d&amp;rsquo;un contenu mais s&amp;rsquo;accompagne d&amp;rsquo;une mise en relation entre demandeur et offreur. Nous envisageons cette approche collaborative de la recherche d&amp;rsquo;information comme l&amp;rsquo;opportunité de développer le capital social des individus de l&amp;rsquo;organisation. La négociation épistémique qui s&amp;rsquo;ensuit peut conduire à une réification de l&amp;rsquo;information échangée ou du collectif d&amp;rsquo;échange. La récurrence de ces échanges favorise la cristallisation d&amp;rsquo;un réseau d&amp;rsquo;entraide et peut être l&amp;rsquo;émergence d&amp;rsquo;une communauté d&amp;rsquo;information.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Séparateurs à Vaste Marge pondérés en norme L2 pour la sélection de variables en apprentissage d&#39;ordonnancement.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-23/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-23/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les algorithmes d&amp;rsquo;apprentissage d&amp;rsquo;ordonnancement utilisent un très grand nombre de caractéristiques pour apprendre les fonctions d&amp;rsquo;ordonnancement, entraînant une augmentation des temps d&amp;rsquo;exécution et du nombre de caractéristiques redondantes ou bruitées. La sélection de variables est une méthode prometteuse pour résoudre ces enjeux. Dans cet article, nous pro- posons de nouvelles méthodes de sélection de variables en apprentissage d&amp;rsquo;ordonnancement basées sur des approches de pondération des SVM en norme 2. Nous proposons une adap- tation d&amp;rsquo;une méthode 2-AROM pour la résolution des SVM en norme 0et un algorithme générique de pondération de la norme 2 qui résout les problèmes en norme l0 et et l1. Nos expérimentations&lt;/p&gt;</description>
    </item>
    <item>
      <title>Structured Indexing Model for Cross-Language Information Retrieval.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.22/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.22/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans les systèmes récents de bibliothèques numériques ou dans le contexte du Web, les&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In recent digital library systems or World Wide Web environment, parallel corpora&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage d&#39;ordonnancement et influence de l&#39;ambiguïté pour la prédiction d&#39;activité sur les réseaux sociaux.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-24/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-24/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Nous proposons dans cet article d&amp;rsquo;apprendre à classer les mots-clés selon leur activité à venir, et comparons deux approches : point-wise et pair-wise. Pour chacune d&amp;rsquo;elle nous étu- dions l&amp;rsquo;influence de l&amp;rsquo;ambiguïté et de la popularité des mots-clés sur ses capacités prédictives. A notre connaissance, c&amp;rsquo;est la première fois que ces facteurs sont étudiés dans ce contexte. Pour valider nos résultats nous fournissons un jeu d&amp;rsquo;apprentissage comprenant l&amp;rsquo;activité de1 497 mots-clés observée sur Twitter pendant une année. Nous proposons également un nouveau&lt;/p&gt;</description>
    </item>
    <item>
      <title>Fouille d&#39;opinion : ces mots qui changent de polarité selon le domaine.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_10/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_10/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La manière dont les gens expriment leur avis change selon ce dont ils parlent. Ainsi, un classifieur d&amp;rsquo;opinion entraîné sur des critiques de films, ne pourra pas être appliqué à des critiques de restaurants sans un minimum d&amp;rsquo;adaptation. Par exemple, certains mots présents dans les deux domaines peuvent changer de polarité. Dans cet article, nous montrons dans un premier temps que ces mots changeant de polarité affectent le comportement des classifieurs automatiques d&amp;rsquo;opinion : supprimer ces mots des corpus ou bien les considérer comme deux mots différents améliore les résultats des classifieurs. Dans un second temps, nous présentons une méthode exploratoire permettant de détecter automatiquement ces mots qui changent de polarité, sans avoir recours aux annotations du domaine cible. Cette méthode s&amp;rsquo;appuie sur la comparaison des profils de co-occurrence des mots dans les deux domaines par rapport à un ensemble de mots pivots, sélectionnés automatiquement pour n&amp;rsquo;avoir qu&amp;rsquo;une seule polarité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Génération automatique d&#39;une ontologie dans le domaine des ressources humaines.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.7/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.7/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Notre époque est de plus en plus influencée par la prééminence des données intelligentes et du web sémantique. Les processus de recrutement n&amp;rsquo;en sont pas toujours facilités en particulier en matière de recherche de profils et de talents. La plupart des systèmes d&amp;rsquo;apparie- ment entre une offre d&amp;rsquo;emploi et un profil s&amp;rsquo;appuient sur une ou plusieurs ressources linguis- tiques, mais se heurtent à la difficulté de développer et à entretenir des ressources spécifiques à chaque domaine. Nous proposons une approche de construction semi-automatique d&amp;rsquo;une on- tologie s&amp;rsquo;appuyant sur des millions de profils issus de plusieurs réseaux sociaux et sur des dizaines de milliers d&amp;rsquo;offres d&amp;rsquo;emploi collectées sur internet. Une évaluation manuelle a été réalisée par un expert du domaine et a montré des résultats de très bonne qualité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Correspondances compatibles avec les fichiers inverses pour la recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-25/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.coria-25/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article fait un retour sur l&amp;rsquo;un des éléments majeurs d&amp;rsquo;un système de recherche d&amp;rsquo;information : la correspondance basée sur des fichiers inverses car le passage d&amp;rsquo;une formule théorique à une implantation compatible avec des fichiers inverse est rarement explicitée dans les publications. Nous proposons ici de définir plus formellement l&amp;rsquo;expression d&amp;rsquo;une formule de correspondance compatible avec des fichiers inverses. Nous proposons deux niveaux de com- patibilité. Nous étudions les modèles les plus classiques en vérifiant leur compatibilité avec les fichiers inverses. Nous explorons la traduction d&amp;rsquo;une correspondance de Jensen-Shannon, initialement non-compatible avec les fichiers inverses, vers deux formules compatibles avec les fichiers inverses à chaque niveau. Une expérimentation simple, sur un corpus d&amp;rsquo;images, montre que la classique Divergence de Kullback-Leibler obtient des résultats moins bons que la Diver- gence de Jensen-Shannon compatible avec des fichiers inverses.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Datation d&#39;images pour la recherche temporelle d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2013/papers/coria.2013.rjcri_11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cet article s&amp;rsquo;inscrit dans le contexte de la recherche temporelle d&amp;rsquo;information qui est une thématique en plein essor depuis ces cinq dernières années. La temporalité peut être vue comme un axe de diversification permettant de raffiner les résultats des requêtes formulées par les utilisateurs. Dans cet article, nous présentons une étude sur la datation automatique de pho- tographies pour la recherche temporelle d&amp;rsquo;images de la Toile. Ce processus de datation impose de nombreuses considérations à la fois théoriques et techniques caractérisant cette tâche parti- culière. Nous essayons ici de résumer quelles sont les difficultés et les problématiques associées à ce sujet, avant de chercher à désamorcer les problèmes soulevés en proposant des solutions et des pistes de travail futures.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réseaux de neurones pour la représentation des contextes continus des mots.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.30/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.30/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les méthodes d&amp;rsquo;apprentissage profond s&amp;rsquo;appuient de plus en plus sur des représen- tations vectorielles continues des mots. Ces méthodes, déjà appliquées avec succès dans de nombreuses tâches de traitement automatique du langage naturel écrit et oral, sont capables de représenter des mots ainsi que les relations les liant. De manière générale, ces méthodes utilisent des représentations par &amp;ldquo;sac-de-mots&amp;rdquo; et traitent donc tous les mots d&amp;rsquo;un contexte de façon égale. Cet article propose une méthode originale qui s&amp;rsquo;appuie sur les modèles de contextes continus en intégrant la position relative des mots dans un contexte. Les résultats montrent que l&amp;rsquo;information portée par les contextes continus permet un gain jusqu&amp;rsquo;à 7 % sur le test qualitatif &amp;ldquo;de relation sémantique&amp;rdquo; et permet d&amp;rsquo;obtenir des résultats pertinents pour une application concrète (identification de thèmes de dialogues dans le cadre du projet DECODA), alors que des performances faibles sont obtenues sans l&amp;rsquo;information contextuelle.&lt;/p&gt;</description>
    </item>
    <item>
      <title>A multi-layer separation based system for camera-based complex map image retrieval.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-26/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-26/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;In this paper, we present a method of camera-based document image retrieval for heterogeneous-content document using a multi-layer separating approach. We use Locally Likely Arrangement Hashing (LLAH) extracting text features on the layer which contains text. In addition, we employ a technique of reducing the memory required for storing the hash table. Experiment result show that our approach is efficient in term of accuracy result and real-time retrieval for heterogeneous-content document camera-based retrieval.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Métriques statistiques pour l&#39;évaluation de performance en présence de vérité terrain imprécise.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-22/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-22/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Ce papier aborde l’évaluation de performances en présence de vérité terrain imprécise.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper addresses performance evaluation in the presence of imprecise groundtruth.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage d&#39;inférences par édition d&#39;arbres pour répondre à des questions.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.38/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.38/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La sélection de réponse en recherche d&amp;rsquo;information précise met nécessairement en oeuvre un appariement de passages avec la question. Nous proposons un algorithme qui consiste à engendrer et apprendre les inférences utiles pour rapprocher les passages de texte à des couples (questions, réponse candidate). Ceux-ci sont sélectionnés au moyen d&amp;rsquo;une ex- pansion lexicale utilisant WordNet et des vecteurs de mots. Ils sont représentés par leur arbre de dépendances syntaxique, enrichi au moyen de plusieurs ressources lexico-sémantiques dont WordNet et ConceptNet. Un algorithme de recherche en faisceau calcule des séquences d&amp;rsquo;édi- tion transformant les passages en choix de réponse. Des traits calculés à partir de ces séquences d&amp;rsquo;édition sont utilisés pour construire deux classifieurs chargés respectivement de valider ou in- valider chaque choix de réponse. Cette méthode a été évaluée sur la tâche &amp;lsquo;Entrance Exams&amp;rsquo; à CLEF 2015 qui propose de répondre à des QCMs sur des textes et a obtenu le deuxième meilleur score de précision des systèmes participants.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Détection de tableaux dans des documents complexes.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-27/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-27/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous présentons les résultats obtenus par un détecteur de tableau dans le cadre des campagnes MAURDOR, pour lesquelles le corpus présente la particularité de contenir des document fortement hétérogènes dans leur mise en page, leurs scripts et les langues utilisées.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This paper presents the results obtained by a table detector during the MAURDOR campaign, the corpus of which contain heterogeneous documents in French, English and Arabic with various types of table structures.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Localisation contextuelle des personnages de bandes dessinées.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-28/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-28/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les auteurs proposent une méthode de localisation des personnages dans des cases de bandes dessinées en s&amp;rsquo;appuyant sur les caractéristiques des bulles de dialogue. L&amp;rsquo;évaluation montre un taux de localisation des personnages allant jusqu&amp;rsquo;à 65%.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The authors present a new method to localize comic&amp;rsquo;s characters inside comic books&amp;rsquo; panels relying on speech balloons properties. The evaluation shows a character localization accuracy up to 65%.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vers une approche utilisant l&#39;apprentissage de métrique pour du clustering semi-supervisé interactif d&#39;images.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.cifed-9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La problématique du clustering non supervisé et semi-supervisé est très étudiée dans&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The problem of unsupervised and semi-supervised clustering is extensively studied&lt;/p&gt;</description>
    </item>
    <item>
      <title>Apprentissage de modèles de langue neuronaux pour la recherche d&#39;information.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.16/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.16/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La recherche d&amp;rsquo;information (RI) ad-hoc se heurte à différentes difficultés, notam- ment liées à des discordances de vocabulaire entre requête et documents, ainsi qu&amp;rsquo;à la prise en compte de dépendances séquentielles entre les termes de la requête. Les récents modèles de langue neuronaux sont capables de capturer différents types de dépendances, grâce à une représentation distribuée des mots, mais nécessitent de gros volumes de données pour être en- trainés efficacement. Jusqu&amp;rsquo;alors, ces modèles n&amp;rsquo;ont pas été utilisés directement pour des tâches de RI classiques, pour lesquelles l&amp;rsquo;estimation d&amp;rsquo;un modèle de langue pour chaque document est requise. Nous proposons une approche basée sur des transformations spécifiques (à chaque do- cument) d&amp;rsquo;une représentation générique (apprise sur l&amp;rsquo;ensemble du corpus), pour définir des modèles de langue neuronaux pour la RI ad-hoc.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Identification of Arabic/French Handwritten/Printed Words using GMM-Based System.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-29/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.cifed-29/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La discrimination entre les langues est l&amp;rsquo;une des premières étapes dans le problème de reconnaissance automatique des documents de textes. Dans de nombreux documents, tels que les chèques bancaires et les formulaires, les textes imprimés et manuscrits sont mélangés. Dans cet article, nous proposons un système d&amp;rsquo;identification automatique des mots arabes et français dans les deux formes: manuscrite et imprimée. Ce système est basé sur les modèles de mélanges gaussiens (GMMs). Pour l&amp;rsquo;extraction des caractéristiques, nous utilisons une fenêtre glissante de longueur fixe. Des expérimentations utilisant quelques parties des bases gratuitement disponibles AHTID/MW, APTI et RIMES montrent une performance remarquable de l&amp;rsquo;approche proposée.&lt;/p&gt;</description>
    </item>
    <item>
      <title>MyBestQuery : un jeu sérieux pour apprendre des utilisateurs.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.demos.coria-1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.demos.coria-1/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;MyBestQuery est un jeu sérieux qui collecte des éléments sur les requêtes soumises à&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;MyBestQuery is a serious game designed to collect items from queries submitted to&lt;/p&gt;</description>
    </item>
    <item>
      <title>Réseaux Bayésiens et quelques applications en traitement d&#39;images.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.rjc-cifed-1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.rjc-cifed-1/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les réseaux Bayésiens sont actuellement une des techniques les plus intéressantes&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;Bayesian networks are currently one of the most interesting techniques of artificial&lt;/p&gt;</description>
    </item>
    <item>
      <title>Classification de profils d&#39;utilisateurs en fonction de leurs orientations politiques.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.rjc-1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.rjc-1/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les plateformes d&amp;rsquo;informations recueillent des commentaires émis par les utilisateurs. Ces commentaires constituent un formidable moyen d&amp;rsquo;accès aux opinions de ces utilisateurs sur tous les sujets de la vie courante. Il est possible d&amp;rsquo;utiliser ces commentaires afin d&amp;rsquo;identifier des tendances dans bon nombre de scénarios. Par exemple, les partis politiques peuvent être intéressés à contrôler leur image. Dans ce papier, nous présentons une technique non super- visée pour classifier des utilisateurs à partir de leurs orientations politiques. Notre approche repose sur deux concepts principaux : (1) la sélection des aspects et des avis que les utilisateurs ont exprimé (2) la création d&amp;rsquo;une base de connaissance à partir de Wikipédia pour classifier automatiquement des utilisateurs selon leurs orientations politiques. Nous avons testé notre ap- proche sur deux ensembles de données extraites de CNN et Aljazeera. Les résultats montrent que notre approche fournit des résultats de très bonne qualité.&lt;/p&gt;</description>
    </item>
    <item>
      <title>IDCHECK.IO : application mobile de contrôle de documents d&#39;identité.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.demos.cifed-1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.demos.cifed-1/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Il existe un très grand nombre de techniques de sécurisation des documents d’identité et&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;There is a very large number of identity document security techniques and it is common&lt;/p&gt;</description>
    </item>
    <item>
      <title>GNOM-FCA : Une extension de la méthode de Falzon de détection de communautés.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.rjc-2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.rjc-2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Dans cet article, nous proposons une nouvelle approche basée sur l&amp;rsquo;Analyse Formelle des Concepts (AFC) pour la détection de communautés dans un réseau social. Nous proposons une fonction basée sur une modularité adaptée, appelée GroupNode modularity, qui améliore une méthode de détection partielle proposée par Falzon en considérant tous les acteurs du réseau social. Nous appelons notre approche GNOM-FCA (GroupNOde Modularity combined with Formal Concept Analysis approach). En outre, nous avons adapté une fonction issue du domaine de la recherche d&amp;rsquo;information, à savoir la F-mesure, dans le cas de classes multiples pour évaluer et comparer la qualité des communautés détectées. Enfin, nous avons validé notre approche par des expérimentations sur des réseaux sociaux issus du monde réel connus dans le domaine.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Recherche par le contenu d&#39;images de monnaies de collection.</title>
      <link>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.demos.cifed-2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2016/papers/sdnri.2016.demos.cifed-2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cette démonstration consiste en une variante du travail de (Perronnin et al., 2010)&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;This demonstration is a variant of the work of (Perronnin et al., 2010), both simplified&lt;/p&gt;</description>
    </item>
    <item>
      <title>AXON : Un Système de RI Personnalisée dans des Textes Arabes basée sur le profil utilisateur et l&#39;expansion de requêtes.</title>
      <link>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.rjc-3/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2014/papers/sdnri.2014.rjc-3/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les travaux présentés dans cet article visent à développer un système de recherche d&amp;rsquo;information qui présente la particularité d&amp;rsquo;être adapté pour la langue arabe et de fournir des résultats personnalisés en fonction des préférences/centres d&amp;rsquo;intérêt de l&amp;rsquo;utilisateur. Pour cela, nous avons proposé une méthode d&amp;rsquo;expansion de requêtes basée à la fois sur des connaissances sémantiques issues d&amp;rsquo;ontologies existantes pour la langue arabe et sur des&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;The work presented in this paper aim to develop a system for information retrieval which has the particularity of being adapted to the Arabic language and provides personalized results based on the user&amp;rsquo;s preferences / interests. For this, we proposed a query expansion method based on both semantic knowledge from existing ontologies for the Arabic language and information from user&amp;rsquo;s profiles. The suggested query expansion method has been implemented and tested on 150 queries for 50 users or 7500 queries of evaluation. The results of this evaluation are promising.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 10 avril 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-04-10/</link>
      <pubDate>Wed, 08 Apr 2026 10:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-04-10/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 3 avril 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-04-03/</link>
      <pubDate>Wed, 01 Apr 2026 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-04-03/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 27 mars 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-03-27/</link>
      <pubDate>Wed, 25 Mar 2026 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-03-27/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 20 mars 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-03-20/</link>
      <pubDate>Wed, 18 Mar 2026 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-03-20/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 13 mars 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-03-13/</link>
      <pubDate>Tue, 10 Mar 2026 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-03-13/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 6 mars 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-03-06/</link>
      <pubDate>Tue, 03 Mar 2026 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-03-06/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 13 février 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-02-13/</link>
      <pubDate>Tue, 10 Feb 2026 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-02-13/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 06 février 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-02-06/</link>
      <pubDate>Mon, 02 Feb 2026 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-02-06/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 09 janvier 2026</title>
      <link>http://www.asso-aria.org/gdl/2026/2026-01-09/</link>
      <pubDate>Tue, 06 Jan 2026 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2026/2026-01-09/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 19 décembre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-12-19/</link>
      <pubDate>Thu, 18 Dec 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-12-19/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 12 décembre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-12-12/</link>
      <pubDate>Wed, 10 Dec 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-12-12/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 5 décembre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-12-05/</link>
      <pubDate>Wed, 03 Dec 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-12-05/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 14 novembre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-11-21/</link>
      <pubDate>Tue, 18 Nov 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-11-21/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 14 novembre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-11-14/</link>
      <pubDate>Wed, 12 Nov 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-11-14/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 07 novembre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-11-07/</link>
      <pubDate>Wed, 05 Nov 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-11-07/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 17 octobre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-10-17/</link>
      <pubDate>Wed, 15 Oct 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-10-17/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 10 octobre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-10-10/</link>
      <pubDate>Thu, 09 Oct 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-10-10/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 3 octobre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-10-03/</link>
      <pubDate>Thu, 02 Oct 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-10-03/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 26 septembre 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-09-26/</link>
      <pubDate>Wed, 24 Sep 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-09-26/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 27 juin 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-06-27/</link>
      <pubDate>Tue, 24 Jun 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-06-27/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 20 juin 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-06-20/</link>
      <pubDate>Thu, 19 Jun 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-06-20/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 6 juin 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-06-06/</link>
      <pubDate>Tue, 03 Jun 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-06-06/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 23 mai 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-05-23/</link>
      <pubDate>Tue, 20 May 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-05-23/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 16 mai 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-05-16/</link>
      <pubDate>Thu, 15 May 2025 12:00:00 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-05-16/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 4 avril 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-04-04/</link>
      <pubDate>Tue, 01 Apr 2025 10:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-04-04/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 28 mars 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-03-28/</link>
      <pubDate>Tue, 18 Mar 2025 10:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-03-28/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 21 mars 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-03-21/</link>
      <pubDate>Tue, 18 Mar 2025 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-03-21/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 14 mars 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-03-14/</link>
      <pubDate>Mon, 10 Mar 2025 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-03-14/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 7 février 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-02-07/</link>
      <pubDate>Thu, 06 Feb 2025 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-02-07/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 31 janvier 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-01-31/</link>
      <pubDate>Thu, 30 Jan 2025 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-01-31/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 24 janvier 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-01-24/</link>
      <pubDate>Thu, 23 Jan 2025 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-01-24/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 17 janvier 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-01-17/</link>
      <pubDate>Sun, 12 Jan 2025 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-01-17/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 10 janvier 2025</title>
      <link>http://www.asso-aria.org/gdl/2025/2025-01-10/</link>
      <pubDate>Tue, 07 Jan 2025 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2025/2025-01-10/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 13 décembre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-12-20/</link>
      <pubDate>Tue, 17 Dec 2024 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-12-20/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 13 décembre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-12-13/</link>
      <pubDate>Tue, 10 Dec 2024 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-12-13/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 6 décembre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-12-06/</link>
      <pubDate>Wed, 04 Dec 2024 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-12-06/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 29 novembre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-11-29/</link>
      <pubDate>Wed, 27 Nov 2024 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-11-29/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 22 novembre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-11-22/</link>
      <pubDate>Tue, 19 Nov 2024 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-11-22/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 15 novembre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-11-15/</link>
      <pubDate>Wed, 13 Nov 2024 12:10:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-11-15/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 08 novembre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-11-08/</link>
      <pubDate>Wed, 06 Nov 2024 12:15:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-11-08/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 18 octobre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-10-18/</link>
      <pubDate>Tue, 15 Oct 2024 19:15:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-10-18/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 04 octobre 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-10-04/</link>
      <pubDate>Tue, 01 Oct 2024 19:15:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-10-04/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 21 juin 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-06-21/</link>
      <pubDate>Wed, 27 Sep 2023 15:28:31 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-06-21/</guid>
      <description></description>
    </item>
    <item>
      <title></title>
      <link>http://www.asso-aria.org/gdl/2024/2024-06-07/</link>
      <pubDate>Wed, 27 Sep 2023 15:28:25 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-06-07/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 24 mai 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-05-24/</link>
      <pubDate>Wed, 27 Sep 2023 15:28:18 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-05-24/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 12 avril 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-04-12/</link>
      <pubDate>Wed, 27 Sep 2023 15:28:11 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-04-12/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 29 mars 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-03-29/</link>
      <pubDate>Wed, 27 Sep 2023 15:28:03 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-03-29/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 15 mars 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-03-15/</link>
      <pubDate>Wed, 27 Sep 2023 15:27:57 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-03-15/</guid>
      <description></description>
    </item>
    <item>
      <title>CORIA-RJCRI 2024</title>
      <link>http://www.asso-aria.org/coria/2024/cfp/</link>
      <pubDate>Fri, 23 Feb 2024 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2024/cfp/</guid>
      <description>&lt;h1 id=&#34;appel-à-communication-coria-rjcri&#34;&gt;Appel à communication CORIA-RJCRI&lt;/h1&gt;&#xA;&lt;p&gt;Le laboratoire informatique, image et interaction (L3i) de La Rochelle organise les 3 et 4 avril 2024 la Conférence en Recherche d’Information et Applications (CORIA).&lt;/p&gt;&#xA;&lt;p&gt;CORIA (COnférence en Recherche d’Information et Applications) est la principale manifestation soutenue par l’Association Francophone de Recherche d’Information et Applications ARIA (&lt;a href=&#34;http://www.asso-aria.org&#34;&gt;http://www.asso-aria.org&lt;/a&gt;).&lt;/p&gt;&#xA;&lt;h2 id=&#34;dates-importantes&#34;&gt;Dates importantes&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;Soumission des articles résumés, courts et longs&lt;/strong&gt; : &lt;del&gt;jeudi 1er février 2024&lt;/del&gt; jeudi 8 février 2024&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Notification aux auteur&lt;/strong&gt; : mardi 5 mars 2024&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Conférence&lt;/strong&gt; : les 3 et 4 avril 2024 à La Rochelle&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;appel&#34;&gt;Appel&lt;/h2&gt;&#xA;&lt;p&gt;CORIA vise à rassembler les équipes et les personnes menant des travaux scientifiques dans le domaine de la recherche d’information et de ses applications : recherche d’information sur le web, sur les réseaux sociaux ou sur des collections spécifiques, systèmes de recommandation, fouille de documents, d’images, d’enregistrements audio, de vidéos, assistants personnels et chatbots… Devenue activité quotidienne du grand public, la recherche d’information est essentielle à de nombreux usages du numérique. L’activité scientifique et technologique associée ne cesse de croître en interaction avec d’autres domaines de l’informatique et d’autres disciplines, mathématiques, linguistique, sciences cognitives, mais aussi en lien direct avec l’industrie et les acteurs de l’internet, des médias, de la culture, de la santé ou de l’éducation. Les modèles récents intègrent l’apprentissage automatique, la fouille de données, le traitement automatique des langues, le traitement de la parole et du signal, l’analyse d’images ou encore l’informatique affective.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 16 février 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-02-16/</link>
      <pubDate>Wed, 27 Sep 2023 15:27:39 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-02-16/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 2 février 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-02-02/</link>
      <pubDate>Wed, 27 Sep 2023 15:27:34 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-02-02/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 19 janvier 2024</title>
      <link>http://www.asso-aria.org/gdl/2024/2024-01-19/</link>
      <pubDate>Wed, 27 Sep 2023 15:27:29 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2024/2024-01-19/</guid>
      <description></description>
    </item>
    <item>
      <title>Premier appel à communication - CORIA 2024</title>
      <link>http://www.asso-aria.org/blog/2023/20231213/</link>
      <pubDate>Wed, 13 Dec 2023 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2023/20231213/</guid>
      <description>&lt;p&gt;CORIA (COnférence en Recherche d’Information et Applications) est la&#xA;principale manifestation soutenue par l’&lt;a href=&#34;http://www.asso-aria.org&#34;&gt;Association Francophone de&#xA;Recherche d’Information et Applications ARIA&lt;/a&gt;.&lt;/p&gt;&#xA;&lt;h3 id=&#34;dates-importantes&#34;&gt;Dates importantes&lt;/h3&gt;&#xA;&lt;p&gt;Soumission des articles résumés, courts et longs : jeudi 1er février 2024&lt;/p&gt;&#xA;&lt;p&gt;Notification aux auteurs : mardi 5 mars 2024&lt;/p&gt;&#xA;&lt;p&gt;Conférence : les 3 et 4 avril 2024 à La Rochelle&lt;/p&gt;&#xA;&lt;p&gt;CORIA vise à rassembler les équipes et les personnes menant des travaux&#xA;scientifiques dans le domaine de la recherche d’information et de ses&#xA;applications : recherche d’information sur le web, sur les réseaux sociaux&#xA;ou sur des collections spécifiques, systèmes de recommandation, fouille de&#xA;documents, d’images, d’enregistrements audio, de vidéos, assistants&#xA;personnels et chatbots… Devenue activité quotidienne du grand public, la&#xA;recherche d’information est essentielle à de nombreux usages du numérique.&#xA;L’activité scientifique et technologique associée ne cesse de croître en&#xA;interaction avec d’autres domaines de l’informatique et d’autres&#xA;disciplines, mathématiques, linguistique, sciences cognitives, mais aussi&#xA;en lien direct avec l’industrie et les acteurs de l’internet, des médias,&#xA;de la culture, de la santé ou de l’éducation. Les modèles récents intègrent&#xA;l’apprentissage automatique, la fouille de données, le traitement&#xA;automatique des langues, le traitement de la parole et du signal, l’analyse&#xA;d’images ou encore l’informatique affective.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 8 décembre 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-12-08/</link>
      <pubDate>Wed, 27 Sep 2023 15:27:21 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-12-08/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 24 novembre 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-11-24/</link>
      <pubDate>Wed, 27 Sep 2023 15:27:15 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-11-24/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 10 novembre 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-11-10/</link>
      <pubDate>Wed, 27 Sep 2023 15:26:57 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-11-10/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 27 octobre 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-10-27/</link>
      <pubDate>Wed, 27 Sep 2023 15:26:53 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-10-27/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 13 octobre 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-10-13/</link>
      <pubDate>Wed, 27 Sep 2023 15:26:47 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-10-13/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 29 septembre 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-09-29/</link>
      <pubDate>Wed, 27 Sep 2023 15:22:10 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-09-29/</guid>
      <description></description>
    </item>
    <item>
      <title></title>
      <link>http://www.asso-aria.org/gdl/2023/2023-07-07/</link>
      <pubDate>Wed, 26 Apr 2023 12:04:27 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-07-07/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 23 juin 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-06-23/</link>
      <pubDate>Wed, 26 Apr 2023 12:04:22 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-06-23/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 26 mai 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-05-26/</link>
      <pubDate>Wed, 26 Apr 2023 12:04:13 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-05-26/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 12 mai 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-05-12/</link>
      <pubDate>Wed, 26 Apr 2023 12:03:33 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-05-12/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 28 avril 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-04-28/</link>
      <pubDate>Wed, 26 Apr 2023 12:02:59 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-04-28/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 31 mars 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-04-14/</link>
      <pubDate>Wed, 11 Jan 2023 13:39:59 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-04-14/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 17 mars 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-03-17/</link>
      <pubDate>Wed, 11 Jan 2023 13:35:26 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-03-17/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 3 mars 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-03-03/</link>
      <pubDate>Wed, 11 Jan 2023 13:35:18 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-03-03/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 17 février 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-02-17/</link>
      <pubDate>Wed, 11 Jan 2023 13:35:07 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-02-17/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 3 février 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-02-03/</link>
      <pubDate>Wed, 11 Jan 2023 13:35:02 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-02-03/</guid>
      <description></description>
    </item>
    <item>
      <title>CORIA TALN RJCRI RECITAL 2023</title>
      <link>http://www.asso-aria.org/coria/2023/cfp/</link>
      <pubDate>Tue, 24 Jan 2023 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2023/cfp/</guid>
      <description>&lt;h1 id=&#34;coria&#34;&gt;CORIA&lt;/h1&gt;&#xA;&lt;p&gt;Dans le cadre des conférences conjointes CORIA-TALN 2023, nous sollicitons des propositions d&amp;rsquo;articles longs et courts. CORIA vise à rassembler les équipes et les personnes menant des travaux scientifiques dans le domaine de la recherche d’information et de ses applications : recherche d’information sur le web, sur les réseaux sociaux ou sur des collections spécifiques, systèmes de recommandation, fouille de documents, d’images, d’enregistrements audio, de vidéos, assistants personnels et chatbots… Devenue activité quotidienne du grand public, la recherche d’information est essentielle à de nombreux usages du numérique. L’activité scientifique et technologique associée ne cesse de croître en interaction avec d’autres domaines de l’informatique et d’autres disciplines, mathématiques, linguistique, sciences cognitives, mais aussi en lien direct avec l’industrie et les acteurs de l’internet, des médias, de la culture, de la santé ou de l’éducation. Les modèles récents intègrent l’apprentissage automatique, la fouille de données, le traitement automatique des langues, le traitement de la parole et du signal, l’analyse d’images ou encore l’informatique affective.&lt;/p&gt;</description>
    </item>
    <item>
      <title>CORIA TALN RJCRI RECITAL 2023</title>
      <link>http://www.asso-aria.org/coria/2025/cfp/</link>
      <pubDate>Tue, 24 Jan 2023 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2025/cfp/</guid>
      <description>&lt;p&gt;A venir.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 6 janvier 2023</title>
      <link>http://www.asso-aria.org/gdl/2023/2023-01-06/</link>
      <pubDate>Wed, 04 Jan 2023 09:13:06 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2023/2023-01-06/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 9 décembre 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-12-09/</link>
      <pubDate>Mon, 24 Oct 2022 09:24:48 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-12-09/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 25 novembre 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-11-25/</link>
      <pubDate>Mon, 24 Oct 2022 09:24:28 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-11-25/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 28 octobre 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-10-28/</link>
      <pubDate>Mon, 24 Oct 2022 09:24:21 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-10-28/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 14 octobre 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-10-12/</link>
      <pubDate>Fri, 07 Oct 2022 08:03:06 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-10-12/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 30 septembre 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-09-30/</link>
      <pubDate>Mon, 26 Sep 2022 10:20:40 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-09-30/</guid>
      <description></description>
    </item>
    <item>
      <title>Journée accès à l’information (GDR TAL)</title>
      <link>http://www.asso-aria.org/blog/2022/20220921/</link>
      <pubDate>Wed, 21 Sep 2022 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2022/20220921/</guid>
      <description>&lt;p&gt;Dans le cadre du GdR CNRS Traitement automatique des langues (GdR TAL), l’IRISA organise une journée scientifique sur le thème de « l’accès à l’information » le 19 octobre 2022 à Rennes. La journée sera organisée autour de plusieurs présentations orales invitées et de présentations posters et de démos.&lt;/p&gt;&#xA;&lt;p&gt;Appel à contribution (date limite 30 septembre 202)&lt;/p&gt;&#xA;&lt;h2 id=&#34;thèmes&#34;&gt;Thèmes&lt;/h2&gt;&#xA;&lt;p&gt;La numérisation de la société a censément facilité l’accès aux informations, que ce soit pour le grand public (savoir encyclopédique, actualités…) ou dans des domaines de spécialité (p. ex. littérature scientifique). Cependant, face à l’avalanche de documents, de sites web, de sources, etc., de nombreuses questions pratiques émergent, qui sont autant de défis scientifiques pour les domaines de la recherche d’information, du traitement de la langue et de la parole :&lt;/p&gt;</description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 10 juin 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-06-10/</link>
      <pubDate>Fri, 03 Jun 2022 10:55:16 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-06-10/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 13 mai 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-05-13/</link>
      <pubDate>Wed, 30 Mar 2022 10:55:09 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-05-13/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 29 avril 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-04-29/</link>
      <pubDate>Wed, 30 Mar 2022 10:55:04 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-04-29/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 15 avril 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-04-15/</link>
      <pubDate>Wed, 30 Mar 2022 10:55:00 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-04-15/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 1er avril 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-04-01/</link>
      <pubDate>Wed, 30 Mar 2022 10:54:53 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-04-01/</guid>
      <description>&lt;h2 id=&#34;supports&#34;&gt;Supports&lt;/h2&gt;&#xA;&lt;p&gt;&lt;a href=&#34;../2022-04-01-xudarme.pdf&#34;&gt;Présentation de Romain Xu-Darme&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 18 mars 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-03-18/</link>
      <pubDate>Thu, 17 Feb 2022 11:28:17 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-03-18/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 4 mars 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-03-04/</link>
      <pubDate>Thu, 17 Feb 2022 11:28:13 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-03-04/</guid>
      <description></description>
    </item>
    <item>
      <title>Groupe de lecture du vendredi 18 février 2022</title>
      <link>http://www.asso-aria.org/gdl/2022/2022-02-18/</link>
      <pubDate>Thu, 17 Feb 2022 11:25:11 +0100</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-02-18/</guid>
      <description></description>
    </item>
    <item>
      <title>CIRCLE 2022 | 2nd edition of the Joint Conference of the Information Retrieval Communities in Europe</title>
      <link>http://www.asso-aria.org/coria/2022/cfp/</link>
      <pubDate>Mon, 24 Jan 2022 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2022/cfp/</guid>
      <description>&lt;p&gt;SCOPE&lt;/p&gt;&#xA;&lt;p&gt;The second edition of CIRCLE will take place on July 4-7, 2022 at Samatan, Gers, south of France (50 minutes from Toulouse). More information at &lt;a href=&#34;https://www.irit.fr/CIRCLE/&#34;&gt;https://www.irit.fr/CIRCLE/&lt;/a&gt;.&lt;/p&gt;&#xA;&lt;p&gt;CIRCLE arose from a twofold wish to gather three national Information Retrieval (IR) conferences and to offer young researchers the opportunity to meet and discuss with senior researchers. CIRCLE is supported by the ARIA French conference (CORIA, COnférence en Recherche d’Information et Applications), the Spanish Conference on Information Retrieval (CERI, Congreso Español de Recuperación de Información), the Italian Information Retrieval Workshop, and the Swiss IR community. The main objective of CIRCLE is to propose a unique place for stimulating and disseminating research in IR, where senior/industrial and early stage researchers (including MSc and PhD students) can network and discuss their research results in a friendly environment.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Conférence CIRCLE 2022</title>
      <link>http://www.asso-aria.org/blog/2022/20210124/</link>
      <pubDate>Mon, 24 Jan 2022 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2022/20210124/</guid>
      <description>&lt;p&gt;CIRCLE 2022 est un événement  organisé par l&amp;rsquo;équipe de Toulouse.&lt;/p&gt;&#xA;&lt;p&gt;CIRCLE is supported by the ARIA French conference (CORIA, COnférence en Recherche d’Information et Applications), the Spanish Conference on Information Retrieval (CERI, Congreso Español de Recuperación de Información), the Italian Information Retrieval Workshop, and the Swiss IR community.&lt;/p&gt;&#xA;&lt;p&gt;Trouvez plus d&amp;rsquo;information, ainsi que l&amp;rsquo;appel à communication, sur la page de &lt;a href=&#34;http://www.asso-aria.org/coria/2022/&#34;&gt;CIRCLE 2022&lt;/a&gt;.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Deep IR and tools</title>
      <link>http://www.asso-aria.org/gdl/2022/20220122/</link>
      <pubDate>Sat, 01 Jan 2022 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/20220122/</guid>
      <description></description>
    </item>
    <item>
      <title>Language Models and Sentence embeddings</title>
      <link>http://www.asso-aria.org/gdl/2022/20220107/</link>
      <pubDate>Sat, 01 Jan 2022 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/20220107/</guid>
      <description></description>
    </item>
    <item>
      <title></title>
      <link>http://www.asso-aria.org/gdl/2022/2022-01-06/</link>
      <pubDate>Mon, 24 Oct 2022 09:24:53 +0200</pubDate>
      <guid>http://www.asso-aria.org/gdl/2022/2022-01-06/</guid>
      <description></description>
    </item>
    <item>
      <title>Document classification and Sentiment Analysis</title>
      <link>http://www.asso-aria.org/gdl/2021/20210326/</link>
      <pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210326/</guid>
      <description></description>
    </item>
    <item>
      <title>Transformers pour la RI - analyse et diversification</title>
      <link>http://www.asso-aria.org/gdl/2021/20211015/</link>
      <pubDate>Wed, 16 Jun 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20211015/</guid>
      <description></description>
    </item>
    <item>
      <title>JAII 2021 : Journée &#34;Accès interactif à l’information&#34; (AFIA-THL / ARIA / GDR TAL)</title>
      <link>http://www.asso-aria.org/journees-thematiques/202112-ri-interactive/</link>
      <pubDate>Wed, 01 Sep 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/journees-thematiques/202112-ri-interactive/</guid>
      <description>&lt;p&gt;Le GDR-TAL (Groupement de recherche en Traitement Automatique de la Langue) et deux associations : l&amp;rsquo;AFIA (Association française pour l&amp;rsquo;intelligence artificielle), au travers de son collège Technologies du Langage Humain (TLH) et l&amp;rsquo;ARIA (Association de Recherche d’Information et Applications) organisent une journée commune sur le thème de l’&amp;ldquo;Accès interactif à l’information&amp;rdquo; le 9 décembre 2021 à Paris (Jussieu).&lt;/p&gt;&#xA;&lt;p&gt;L&amp;rsquo;objectif de cette journée est de réunir chercheurs-euses en Intelligence Artificielle, en Traitement Automatique des Langues et en Recherche d’Information travaillant sur les aspects interactifs de l’accès à l’information. Cette journée sera alors l’occasion de confronter les expériences de la recherche interactive dans différents domaines d’applications, tant du côté avancé de la recherche que du côté des applications industrielles.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Clustering et Recherche Personalisée</title>
      <link>http://www.asso-aria.org/gdl/2021/20210618/</link>
      <pubDate>Wed, 16 Jun 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210618/</guid>
      <description></description>
    </item>
    <item>
      <title>Comité d&#39;orientation</title>
      <link>http://www.asso-aria.org/aria/comite-orientation/</link>
      <pubDate>Mon, 07 Jun 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/aria/comite-orientation/</guid>
      <description>&lt;p&gt;Le comité d&amp;rsquo;orientation d&amp;rsquo;ARIA est composé des personnes suivantes :&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Patrice Bellot, LSIS, Aix-Marseille Université, Marseille&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Catherine Berrut, LIG, Université Grenoble-Alpes, Grenoble&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Romaric Besançon, CEA, LIST, Université Paris-Saclay, Palaiseau&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Mohand Boughanem, IRIT, Université Paul Sabatier, Toulouse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Sylvie Calabretto, LIRIS, INSA, Lyon&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Max Chevalier, IRIT, Université Paul Sabatier, Toulouse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Jean-Pierre Chevallet, LIG, Unversité Grenoble-Alpes, Grenoble&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Adrian Chifu, Aix-Marseille Université&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Vincent Claveau, IRISA, Rennes&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Sébastien Fournier, LSIS, Aix-Marseille Université, Marseille&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Patrick Gallinari, ISIR, Sorbonne Université, Paris&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Eric Gaussier, LIG, Unversité Grenoble-Alpes, Grenoble&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Mathias Géry, Laboratoire H. Curien, Université Jean Monnet, Saint-Etienne&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Lorraine Goeuriot, LIG, Université Grenoble Alpes&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Eric San Juan, LIA, Université d&amp;#39;Avignon&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        José Moreno, IRIT, Université Paul Sabatier, Toulouse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Josiane Mothe, IRIT, Université Paul Sabatier, Toulouse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Philippe Mulhem, LIG, Unversité Grenoble-Alpes, Grenoble&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Benjamin Piwowarski, CNRS/ISIR, Sorbonne Université, Paris&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Mathieu Roche, TETIS, Université de Montpellier&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Karen Pinel Sauvagnat, IRIT, Université Paul Sabatier, Toulouse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Jacques Savoy, Université de Neuchâtel, Neuchâtel, Suisse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Florence Sèdes, IRIT, Université Paul Sabatier, Toulouse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Christophe Servan, LISN-CNRS / Qwant Research&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Malika Smail, LORIA, Université de Lorraine, Nancy&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Chantal Soule Dupuy, IRIT, Université Paul Sabatier, Toulouse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Laure Soulier, ISIR, Sorbonne Université, Paris&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Lynda Tamine Lechani, IRIT, Université Paul Sabatier, Toulouse&#xA;    &lt;/li&gt;&#xA;    &#xA;    &lt;li&gt;&#xA;        Haïfa Zargayouna, LIPN, Université Paris 13&#xA;    &lt;/li&gt;&#xA;    &#xA;&lt;/ul&gt;</description>
    </item>
    <item>
      <title>Détection d&#39;événements</title>
      <link>http://www.asso-aria.org/gdl/2021/20210604/</link>
      <pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210604/</guid>
      <description></description>
    </item>
    <item>
      <title>Recommendation et Learning To Rank</title>
      <link>http://www.asso-aria.org/gdl/2021/20210521/</link>
      <pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210521/</guid>
      <description></description>
    </item>
    <item>
      <title>Efficiency in Neural Re-Ranking</title>
      <link>http://www.asso-aria.org/gdl/2021/20210507/</link>
      <pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210507/</guid>
      <description>&lt;p&gt;In the past few years, contextualized language modeling techniques (such as BERT) have yielded substantial improvements in ad-hoc re-ranking. Though very effective, these models leave much to be desired in terms of computational efficiency. In this talk, I show a technique for reducing query-time computation cost by delaying cross-attention and pre-computing document representations (PreTTR). Armed with this knowledge, I show how neural re-ranking architectures can be designed to take advantage of this property to enhance efficiency and interpretability by predicting term salience scores (EPIC).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Liste des adhérents</title>
      <link>http://www.asso-aria.org/aria/adherents/</link>
      <pubDate>Sat, 01 May 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/aria/adherents/</guid>
      <description>&lt;p&gt;Seuls les organismes sont mentionnés ici, l&amp;rsquo;adhésion peut également se&#xA;faire de façon individuelle en tant que personne physique.&lt;/p&gt;&#xA;&lt;h2 id=&#34;2021&#34;&gt;2021&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;LIRIS, Lyon&lt;/li&gt;&#xA;&lt;li&gt;IRIT, Toulouse&lt;/li&gt;&#xA;&lt;li&gt;LIP6, Paris&lt;/li&gt;&#xA;&lt;li&gt;IRISA, Rennes&lt;/li&gt;&#xA;&lt;li&gt;LIS, Marseille&lt;/li&gt;&#xA;&lt;li&gt;Naver Labs Europe Entreprise&lt;/li&gt;&#xA;&lt;li&gt;La rochelle Université, La Rochelle&lt;/li&gt;&#xA;&lt;li&gt;Laboratoire Gaspard Monge, Marne la vallée&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2020&#34;&gt;2020&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Sorbonne université, paris&lt;/li&gt;&#xA;&lt;li&gt;IRIT, Toulouse&lt;/li&gt;&#xA;&lt;li&gt;LIG, Grenoble&lt;/li&gt;&#xA;&lt;li&gt;LIS, Marseille&lt;/li&gt;&#xA;&lt;li&gt;Laboratoire Hubert Curien, St Etienne&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2019&#34;&gt;2019&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;LIP6, Paris&lt;/li&gt;&#xA;&lt;li&gt;IRIT, Toulouse&lt;/li&gt;&#xA;&lt;li&gt;Mines de Saint-Etienne&lt;/li&gt;&#xA;&lt;li&gt;LIG, Grenoble&lt;/li&gt;&#xA;&lt;li&gt;CNRS Rhône-Alpes&lt;/li&gt;&#xA;&lt;li&gt;Université d&amp;rsquo;Aix-Marseille&lt;/li&gt;&#xA;&lt;li&gt;INSA, Lyon&lt;/li&gt;&#xA;&lt;li&gt;Ezus (lab. ERIC), Lyon&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2018&#34;&gt;2018&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;IRISA/Inria Rennes&lt;/li&gt;&#xA;&lt;li&gt;IRIT, Toulouse&lt;/li&gt;&#xA;&lt;li&gt;Laboratoire Hubert Curien, Saint-Etienne&lt;/li&gt;&#xA;&lt;li&gt;LIG, Grenoble&lt;/li&gt;&#xA;&lt;li&gt;LIP6, Paris&lt;/li&gt;&#xA;&lt;li&gt;LIPN, Paris&lt;/li&gt;&#xA;&lt;li&gt;LIRIS, Lyon&lt;/li&gt;&#xA;&lt;li&gt;Université Neuchâtel&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2017&#34;&gt;2017&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;IRISA/Inria Rennes&lt;/li&gt;&#xA;&lt;li&gt;IRIT, Toulouse&lt;/li&gt;&#xA;&lt;li&gt;LIG, Grenoble&lt;/li&gt;&#xA;&lt;li&gt;LIPN, Paris&lt;/li&gt;&#xA;&lt;li&gt;LIRIS, Lyon&lt;/li&gt;&#xA;&lt;li&gt;Mines de Saint-Etienne&lt;/li&gt;&#xA;&lt;li&gt;Univsersité Neuchâtel&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2016&#34;&gt;2016&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;IRISA, Rennes&lt;/li&gt;&#xA;&lt;li&gt;IRIT, Toulouse&lt;/li&gt;&#xA;&lt;li&gt;Mines de Saint-Etienne&lt;/li&gt;&#xA;&lt;li&gt;LIA, Avignon&lt;/li&gt;&#xA;&lt;li&gt;LIG, Grenoble&lt;/li&gt;&#xA;&lt;li&gt;LIRIS, Lyon&lt;/li&gt;&#xA;&lt;li&gt;LIP6, Paris&lt;/li&gt;&#xA;&lt;li&gt;LIPN, Paris&lt;/li&gt;&#xA;&lt;li&gt;LSIS, Marseille&lt;/li&gt;&#xA;&lt;li&gt;Univ. Neuchatel&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2015&#34;&gt;2015&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;école Centrale Paris&lt;/li&gt;&#xA;&lt;li&gt;IRISA &amp;ndash; INRIA Rennes&lt;/li&gt;&#xA;&lt;li&gt;Lab Hubert Curien, Saint-Etienne&lt;/li&gt;&#xA;&lt;li&gt;LIA, Avignon&lt;/li&gt;&#xA;&lt;li&gt;LIG, Grenoble&lt;/li&gt;&#xA;&lt;li&gt;LIMSI, Orsay&lt;/li&gt;&#xA;&lt;li&gt;LIRIS, Lyon&lt;/li&gt;&#xA;&lt;li&gt;LIPN, Paris&lt;/li&gt;&#xA;&lt;li&gt;LSIS, Marseille&lt;/li&gt;&#xA;&lt;li&gt;Univ. Neuchatel&lt;/li&gt;&#xA;&lt;/ul&gt;</description>
    </item>
    <item>
      <title>Ad-Hoc Video Search</title>
      <link>http://www.asso-aria.org/gdl/2021/20210423/</link>
      <pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210423/</guid>
      <description></description>
    </item>
    <item>
      <title>Représentation des graphes</title>
      <link>http://www.asso-aria.org/gdl/2021/20210409/</link>
      <pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210409/</guid>
      <description></description>
    </item>
    <item>
      <title>Social book search et Top-K Query Processing</title>
      <link>http://www.asso-aria.org/gdl/2021/20210312/</link>
      <pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210312/</guid>
      <description></description>
    </item>
    <item>
      <title>RI neuronale : analyse et contexte</title>
      <link>http://www.asso-aria.org/gdl/2021/20210212/</link>
      <pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210212/</guid>
      <description>&lt;p&gt;&lt;em&gt;Lila Boualili&lt;/em&gt; présentera &lt;a href=&#34;https://www.semanticscholar.org/paper/ABNIRML%3A-Analyzing-the-Behavior-of-Neural-IR-Models-MacAvaney-Feldman/5a263ddff2ff1069cd7d6cda99116f7c49e07968&#34;&gt;ABNIRML: Analyzing the Behavior of Neural IR Models&lt;/a&gt;&lt;/p&gt;&#xA;&lt;p&gt;&lt;em&gt;Nicolas Bizzozzéro&lt;/em&gt; présentera &lt;a href=&#34;https://dl.acm.org/doi/pdf/10.1145/3331184.3331246&#34;&gt;Context Attentive Document Ranking and Query Suggestion&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Distillation et RI neuronale</title>
      <link>http://www.asso-aria.org/gdl/2021/20210129/</link>
      <pubDate>Sun, 29 Nov 2020 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210129/</guid>
      <description>&lt;p&gt;&lt;em&gt;présenté par Stéphane Clinchant&lt;/em&gt; &lt;br&gt;&#xA;Distilling Dense Representations for Ranking using Tightly-Coupled Teachers &lt;br&gt;&#xA;&lt;a href=&#34;https://arxiv.org/pdf/2010.11386.pdf&#34;&gt;https://arxiv.org/pdf/2010.11386.pdf&lt;/a&gt;&#xA;​&lt;/p&gt;&#xA;&lt;p&gt;&lt;em&gt;présenté par Thibault Formal&lt;/em&gt; &lt;br&gt;&#xA;Improving Efficient Neural Ranking Models with Cross-Architecture Knowledge Distillation &lt;br&gt;&#xA;&lt;a href=&#34;https://arxiv.org/abs/2010.02666&#34;&gt;https://arxiv.org/abs/2010.02666&lt;/a&gt; , presente par Thibault&lt;/p&gt;</description>
    </item>
    <item>
      <title>Semi-Supervised Classification with Graph Convolutional Networks</title>
      <link>http://www.asso-aria.org/gdl/2021/20210115/</link>
      <pubDate>Sun, 01 Nov 2020 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2021/20210115/</guid>
      <description>&lt;p&gt;Le groupe de lecture du vendredi 15 janvier (13-14h) sera animé par&#xA;le laboratoire ERIC (Lyon).&lt;/p&gt;&#xA;&lt;p&gt;&lt;em&gt;présenté par Adrien Guille&lt;/em&gt; (&lt;a href=&#34;../20210115-notes.pdf&#34;&gt;notes&lt;/a&gt;)&lt;br&gt;&#xA;Semi-Supervised Classification with Graph Convolutional Networks&lt;br&gt;&#xA;&lt;a href=&#34;https://arxiv.org/abs/1609.02907v4&#34;&gt;https://arxiv.org/abs/1609.02907v4&lt;/a&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;bibliographie&#34;&gt;Bibliographie&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;a href=&#34;https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16098/16553&#34;&gt;Deeper Insights into Graph Convolutional Networks for Semi-Supervised Learning&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;https://dl.acm.org/doi/10.5555/3157382.3157527&#34;&gt;Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;https://openreview.net/forum?id=DQNsQf-UsoDBa&#34;&gt;Spectral Networks and Deep Locally Connected Networks on Graphs&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;https://www.sciencedirect.com/science/article/pii/S1063520310000552&#34;&gt;Wavelets on Graphs via Spectral Graph Theory&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;</description>
    </item>
    <item>
      <title>CORIA/RJCRI 2021 - Appel à contributions</title>
      <link>http://www.asso-aria.org/coria/2021/cfp/</link>
      <pubDate>Fri, 15 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2021/cfp/</guid>
      <description>&lt;p&gt;La 17ème édition de CORIA (COnférence en Recherche d’Information et Applications) sera organisée du 14 au 16 avril 2021, conjointement aux rencontres jeunes chercheurs en RI (RJCRI). Elle est la principale manifestation soutenue par l’Association Francophone de Recherche d’Information et Applications ARIA (&lt;a href=&#34;http://www.asso-aria.org&#34;&gt;http://www.asso-aria.org&lt;/a&gt;).&lt;/p&gt;&#xA;&lt;h2 id=&#34;liens-utiles&#34;&gt;Liens utiles&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;a href=&#34;./coria_template.zip&#34;&gt;Template latex&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;https://easychair.org/conferences/?conf=coria2021&#34;&gt;Site de soumission&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;calendrier&#34;&gt;Calendrier&lt;/h2&gt;&#xA;&lt;p&gt;Soumission des résumés : 18 février 2021 &lt;br&gt;&#xA;Soumission des articles : 24 février 2021 &lt;br&gt;&#xA;Notification : 23 mars 2021 &lt;br&gt;&#xA;Version définitive des articles : 2 avril 2021 &lt;br&gt;&#xA;Conférence : 14 au 16 avril 2021&lt;/p&gt;</description>
    </item>
    <item>
      <title>Conférence CORIA/RJCRI 2021</title>
      <link>http://www.asso-aria.org/blog/2021/20210101/</link>
      <pubDate>Fri, 01 Jan 2021 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2021/20210101/</guid>
      <description>&lt;p&gt;CORIA/RJCRI 2021 a été un événement virtuel organisé par l&amp;rsquo;équipe de Grenoble. Trouvez plus d&amp;rsquo;information, ainsi que l&amp;rsquo;appel à communication, sur la page de &lt;a href=&#34;http://www.asso-aria.org/coria/2021/&#34;&gt;CORIA 2021&lt;/a&gt;.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Neural Ranking</title>
      <link>http://www.asso-aria.org/gdl/2020/20201218/</link>
      <pubDate>Sun, 01 Nov 2020 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2020/20201218/</guid>
      <description>&lt;p&gt;&lt;em&gt;Yagmur Gizem Cinar presents&lt;/em&gt;&lt;br&gt;&#xA;Jiang, J. Y., Xiong, C., Lee, C. J., &amp;amp; Wang, W. (2020).&lt;br&gt;&#xA;&lt;a href=&#34;https://arxiv.org/abs/2010.12683&#34;&gt;Long Document Ranking with Query-Directed Sparse Transformer&lt;/a&gt; &lt;br&gt;&#xA;arXiv preprint arXiv:2010.12683&lt;/p&gt;&#xA;&lt;p&gt;&lt;em&gt;Diana Nicoletta Popa presents&lt;/em&gt; &lt;br&gt;&#xA;Luyu Gao, Zhuyun Dai and Jamie Callan.&lt;br&gt;&#xA;&lt;a href=&#34;https://www.aclweb.org/anthology/2020.emnlp-main.342.pdf&#34;&gt;Modularized Transfomer-based Ranking Framework&lt;/a&gt;&lt;br&gt;&#xA;EMNLP 2020&lt;/p&gt;</description>
    </item>
    <item>
      <title>RL for relevance feedback / SparTerm</title>
      <link>http://www.asso-aria.org/gdl/2020/20201204/</link>
      <pubDate>Sun, 01 Nov 2020 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2020/20201204/</guid>
      <description>&lt;p&gt;Pour la troisième réunion du groupe de lecture ARIA/GDR TAL, seront présentés :&lt;/p&gt;&#xA;&lt;p&gt;&lt;em&gt;présenté par Laure Soulier&lt;/em&gt;&lt;br&gt;&#xA;A Reinforcement Learning Framework for Relevance Feedback&lt;br&gt;&#xA;&lt;a href=&#34;https://dl.acm.org/doi/10.1145/3397271.3401099&#34;&gt;https://dl.acm.org/doi/10.1145/3397271.3401099&lt;/a&gt;&lt;/p&gt;&#xA;&lt;p&gt;&lt;em&gt;présenté par Benjamin Piwowarski&lt;/em&gt; &lt;br&gt;&#xA;Bai, Yang, Xiaoguang Li, Gang Wang, Chaoliang Zhang, Lifeng Shang, Jun Xu, Zhaowei Wang, Fangshan Wang, et Qun Liu. « SparTerm: Learning Term-based Sparse Representation for Fast Text Retrieval ». arXiv:2010.00768 &lt;br&gt;&#xA;&lt;a href=&#34;http://arxiv.org/abs/2010.00768&#34;&gt;http://arxiv.org/abs/2010.00768&lt;/a&gt;.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Graph Embeddings et Collaborative Filtering</title>
      <link>http://www.asso-aria.org/gdl/2020/20201120/</link>
      <pubDate>Sun, 01 Nov 2020 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2020/20201120/</guid>
      <description>&lt;p&gt;Durant la seconde réunion du groupe de lecture ARIA/GDR TAL, seront présentés :&lt;/p&gt;&#xA;&lt;p&gt;&lt;em&gt;présenté par Sébastien Fournier&lt;/em&gt;&lt;br&gt;&#xA;Graph Embedding Techniques, Applications, and Performance: A Survey &lt;br&gt;&#xA;&lt;a href=&#34;https://arxiv.org/pdf/1705.02801.pdf&#34;&gt;https://arxiv.org/pdf/1705.02801.pdf&lt;/a&gt;&lt;/p&gt;&#xA;&lt;p&gt;&lt;em&gt;présenté par Yann Duperis&lt;/em&gt; (&lt;a href=&#34;http://www.asso-aria.org/gdl/2020/20201120-yann.pdf&#34;&gt;&lt;i class=&#34;fa fa-file-pdf&#34; style=&#34;color: red&#34;&gt;&lt;/i&gt; présentation PDF&lt;/a&gt;)&lt;br&gt;&#xA;S. Yang, M. Korayem, K. AlJadda, T. Grainger, and S. Natarajan, “Combining content-based and collaborative filtering for job recommendation system: A cost-sensitive Statistical Relational Learning approach,” Knowledge-Based Systems (vol. 136)&lt;br&gt;&#xA;&lt;a href=&#34;https://openreview.net/pdf/f7446505b9e5d154eef861638607e09b6b60be5d.pdf&#34;&gt;https://openreview.net/pdf/f7446505b9e5d154eef861638607e09b6b60be5d.pdf&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Textual keyword extraction</title>
      <link>http://www.asso-aria.org/gdl/2020/20201106/</link>
      <pubDate>Sun, 01 Nov 2020 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/gdl/2020/20201106/</guid>
      <description>&lt;p&gt;Le premier groupe de lecture aura pour thème &amp;ldquo;Keyphrase Extraction&amp;rdquo;&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Nasar, Z., Jaffry, S. W., &amp;amp; Malik, M. K. (2019). Textual keyword extraction and summarization: State-of-the-art. Information Processing &amp;amp; Management&lt;br&gt;&#xA;&lt;a href=&#34;https://doi.org/10.1016/j.ipm.2019.102088&#34;&gt;https://doi.org/10.1016/j.ipm.2019.102088&lt;/a&gt;&lt;br&gt;&#xA;&lt;em&gt;Présenté par Faneva Ramiandrisoa, Doctorant, IRIT&lt;/em&gt;&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Campos, R., Mangaravite, V., Pasquali, A., Jatowt, A., Jorge, A., Nunes, C. and Jatowt, A. (2020). YAKE! Keyword Extraction from Single Documents using Multiple Local Features. In Information Sciences Journal. &lt;br&gt;&#xA;&lt;a href=&#34;https://doi.org/10.1016/j.ins.2019.09.013&#34;&gt;https://doi.org/10.1016/j.ins.2019.09.013&lt;/a&gt; &lt;br&gt;&#xA;&lt;em&gt;Présenté par Md Zia Ullah, Post doctorant, IRIT&lt;/em&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Groupe de lecture ARIA</title>
      <link>http://www.asso-aria.org/blog/2020/202011-gdl/</link>
      <pubDate>Fri, 06 Nov 2020 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/202011-gdl/</guid>
      <description>&lt;p&gt;L&amp;rsquo;ARIA (&lt;a href=&#34;https://www.asso-aria.org/&#34;&gt;https://www.asso-aria.org/&lt;/a&gt;) et le groupe de travail &amp;ldquo;Accès à l’information et fouille de textes&amp;rdquo; du GDR TAL (&lt;a href=&#34;https://gdr-tal.ls2n.fr&#34;&gt;https://gdr-tal.ls2n.fr&lt;/a&gt;) ont mis en place un groupe de lecture qui aura pour but, une fois tous les quinze jours (en alternance avec les autres groupes de lecture du GDR TAL, pendant 1h maximum), de présenter quelques articles actuels et de discuter autour de ceux-ci. Ce groupe de lecture se réunira par visio-conférence (Zoom) et sera l&amp;rsquo;occasion d&amp;rsquo;un moment convivial où nous pourrons parler de thématiques de recherche qui nous intéressent. Le but est à la fois d&amp;rsquo;animer la communauté francophone de RI/fouille de texte et de se tenir informé des travaux récents de la communauté internationale.&#xA;Afin d&amp;rsquo;assurer la diversité des sujets et une répartition du travail au niveau des différents groupes de recherches dans la communauté francophone, chaque groupe aura pour charge d&amp;rsquo;animer un des groupes de lecture. Le planning actuel des groupes de lecture est le suivant :&lt;/p&gt;</description>
    </item>
    <item>
      <title>Meilleurs papiers CORIA</title>
      <link>http://www.asso-aria.org/coria/meilleurs-papiers/</link>
      <pubDate>Mon, 10 Feb 2020 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/meilleurs-papiers/</guid>
      <description>&lt;p&gt;2019&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Lydie du Bousquet, Philippe Mulhem, Sara Lakah. &amp;ldquo;&lt;a href=&#34;http://www.asso-aria.org/coria/2019/CORIA_2019_paper_2.pdf&#34;&gt;Quelques pas vers&#xA;l&amp;rsquo;Honnêteté et l&amp;rsquo;Explicabilité de moteurs de recherche sur le&#xA;Web.&lt;/a&gt;&amp;rdquo;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;2018&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Charles-Emmanuel Dias, Clara Gainon de Forsan de Gabriac, Vincent&#xA;Guigue, Patrick Gallinari.&amp;quot;&lt;a href=&#34;http://www.asso-aria.org/coria/2018/paper11.pdf&#34;&gt;RNN et modèle d&amp;rsquo;attention pour&#xA;l&amp;rsquo;apprentissage de profils textuels&#xA;personnalisés.&lt;/a&gt;&amp;quot;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;2017&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Simon Bourigault, Sylvain Lamprier, Patrick Gallinari,&#xA;&amp;ldquo;&lt;a href=&#34;http://www.asso-aria.org/coria/2017/2.pdf&#34;&gt;Apprentissage de représentation pour la détection de source dans&#xA;les réseaux sociaux.&lt;/a&gt;&amp;rdquo;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;2016&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Vincent Claveau, &amp;quot;&lt;a href=&#34;http://www.asso-aria.org/coria/2016/CORIA/34.pdf&#34;&gt;Dimensionalité intrinsèque dans les espaces de&#xA;représentation des termes et des&#xA;documents.&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;2015&lt;/p&gt;</description>
    </item>
    <item>
      <title>Appel à participation, Journée commune AFIA-ARIA</title>
      <link>http://www.asso-aria.org/blog/2020/157-appel-a-participation-journee-commune-afia-aria/</link>
      <pubDate>Tue, 08 Oct 2019 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/157-appel-a-participation-journee-commune-afia-aria/</guid>
      <description>&lt;p&gt;Journée commune de l&amp;rsquo;AFIA (Association Française pour l&amp;rsquo;Intelligence&#xA;Artificielle) et de l&amp;rsquo;ARIA (Association francophone de Recherche&#xA;d&amp;rsquo;Information et Applications)&lt;/p&gt;&#xA;&lt;p&gt;2 décembre 2019, Sorbonne université, 75015 Paris&lt;br&gt;&#xA;&lt;a href=&#34;https://ia-ri.sciencesconf.org/&#34;&gt;https://ia-ri.sciencesconf.org/&lt;/a&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;thème&#34;&gt;THÈME\&lt;/h2&gt;&#xA;&lt;p&gt;Cette journée constitue la 3ème rencontre entre chercheurs en&#xA;Intelligence Artificielle (IA) et en Recherche d&amp;rsquo;Information (RI). La&#xA;première visait à mettre en évidence les problématiques communes et les&#xA;approches proposées venant de l&amp;rsquo;une ou l&amp;rsquo;autre communauté, la seconde&#xA;s&amp;rsquo;était focalisée sur l&amp;rsquo;extraction d&amp;rsquo;information pour le peuplement de&#xA;bases de connaissances et l&amp;rsquo;annotation sémantique de documents.&lt;br&gt;&#xA;Pour cette 3ème journée, nous prolongerons les discussions autour des&#xA;bases de connaissances, et plus particulièrement des réseaux sémantiques&#xA;(Knowledge Graphs). Ces graphes décrivent les entités du monde réel&#xA;ainsi que les relations qui les lient, sans thématique particulière.&#xA;Outre le fait qu&amp;rsquo;ils permettent de lier des bases de connaissances du&#xA;Web des données (LOD), ils sont aujourd&amp;rsquo;hui utilisés dans de nombreux&#xA;contextes, comme le question-réponse, l&amp;rsquo;annotation sémantique, l&amp;rsquo;analyse&#xA;de sentiments ou encore la recherche Web.&lt;br&gt;&#xA;Les problématiques autour d&amp;rsquo;eux sont nombreuses, et vont de leur&#xA;construction à leur exploitation pour la découverte de connaissance,&#xA;souvent en utilisant des techniques d&amp;rsquo;apprentissage profond et de&#xA;plongements de noeuds/relations, aux problèmes de passage à l&amp;rsquo;échelle ou&#xA;d&amp;rsquo;évolution temporelle des données.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Journée commune AFIA - ARIA, 2 décembre 2019 à Paris- Appel à soumissions</title>
      <link>http://www.asso-aria.org/journees-thematiques/156-journee-commune-afia-aria-2-decembre-2019-a-paris-appel-a-soumissions/</link>
      <pubDate>Mon, 07 Oct 2019 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/journees-thematiques/156-journee-commune-afia-aria-2-decembre-2019-a-paris-appel-a-soumissions/</guid>
      <description>&lt;p&gt;Journée commune de l&amp;rsquo;AFIA (Association Française pour l&amp;rsquo;Intelligence&#xA;Artificielle) et de l&amp;rsquo;ARIA (Association francophone de Recherche&#xA;d&amp;rsquo;Information et Applications)&lt;br&gt;&#xA;&lt;br&gt;&#xA;2 décembre 2019, Sorbonne université, 75015 Paris&lt;br&gt;&#xA;&lt;a href=&#34;https://ia-ri.sciencesconf.org/&#34;&gt;https://ia-ri.sciencesconf.org/&lt;/a&gt;&lt;br&gt;&#xA;&lt;br&gt;&#xA;THÈME&lt;br&gt;&#xA;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;ndash;&lt;br&gt;&#xA;&lt;br&gt;&#xA;Cette journée constitue la 3ème rencontre entre chercheurs en&#xA;Intelligence Artificielle (IA) et en Recherche d&amp;rsquo;Information (RI). La&#xA;première visait à mettre en évidence les problématiques communes et les&#xA;approches proposées venant de l&amp;rsquo;une ou l&amp;rsquo;autre communauté, la seconde&#xA;s&amp;rsquo;était focalisée sur l&amp;rsquo;extraction d&amp;rsquo;information pour le peuplement de&#xA;bases de connaissances et l&amp;rsquo;annotation sémantique de documents.&lt;br&gt;&#xA;Pour cette 3ème journée, nous prolongerons les discussions autour des&#xA;bases de connaissances, et plus particulièrement des réseaux sémantiques&#xA;(Knowledge Graphs). Ces graphes décrivent les entités du monde réel&#xA;ainsi que les relations qui les lient, sans thématique particulière.&#xA;Outre le fait qu&amp;rsquo;ils permettent de lier des bases de connaissances du&#xA;Web des données (LOD), ils sont aujourd&amp;rsquo;hui utilisés dans de nombreux&#xA;contextes, comme le question-réponse, l&amp;rsquo;annotation sémantique, l&amp;rsquo;analyse&#xA;de sentiments ou encore la recherche Web.&lt;br&gt;&#xA;Les problématiques autour d&amp;rsquo;eux sont nombreuses, et vont de leur&#xA;construction à leur exploitation pour la découverte de connaissance,&#xA;souvent en utilisant des techniques d&amp;rsquo;apprentissage profond et de&#xA;plongements de noeuds/relations, aux problèmes de passage à l&amp;rsquo;échelle ou&#xA;d&amp;rsquo;évolution temporelle des données.&lt;br&gt;&#xA;&lt;br&gt;&#xA;Pour cette journée nous sollicitons des interventions qui présentent un&#xA;état de l&amp;rsquo;art ou un tutoriel en relation avec ces thématiques, et qui&#xA;disposeront d&amp;rsquo;un créneau de 30 à 45 mn.&lt;br&gt;&#xA;Des présentations plus focalisées seront également considérées et&#xA;disposeront d&amp;rsquo;un créneau de 20 à 30 mn.&lt;br&gt;&#xA;&lt;br&gt;&#xA;&lt;br&gt;&#xA;Modalités de soumission&lt;br&gt;&#xA;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&lt;br&gt;&#xA;Les propositions d&amp;rsquo;intervention sont attendues sous la forme d&amp;rsquo;un résumé&#xA;d&amp;rsquo;une page environ au format texte ayant la structure ci-dessous à&#xA;soumettre sur &lt;a href=&#34;https://ia-ri.sciencesconf.org/&#34;&gt;https://ia-ri.sciencesconf.org/&lt;/a&gt;&lt;br&gt;&#xA;&lt;br&gt;&#xA;&lt;br&gt;&#xA;Titre de l&amp;rsquo;intervention :&lt;br&gt;&#xA;Nature de l&amp;rsquo;intervention : synthèse, tutoriel, présentation courte&lt;br&gt;&#xA;Auteur(s) :&lt;br&gt;&#xA;Mots-Clefs :&lt;br&gt;&#xA;Résumé ou plan de l&amp;rsquo;intervention : 1/2 à 1 page&lt;br&gt;&#xA;&lt;br&gt;&#xA;Date limite de soumission : 16/10/2019&lt;br&gt;&#xA;Date de notification : au fil de l&amp;rsquo;eau&lt;br&gt;&#xA;&lt;br&gt;&#xA;Coordinateurs de la journée&lt;br&gt;&#xA;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&lt;br&gt;&#xA;Haïfa Zargayouna (LIPN, UMR CNRS, Université Paris 13),&lt;/p&gt;</description>
    </item>
    <item>
      <title>EARIA 2019: Ecole d&#39;Automne en Recherche d&#39;Information et Applications.</title>
      <link>http://www.asso-aria.org/blog/2020/155-earia-2019-ecole-d-automne-en-recherche-d-information-et-applications/</link>
      <pubDate>Fri, 22 Feb 2019 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/155-earia-2019-ecole-d-automne-en-recherche-d-information-et-applications/</guid>
      <description>&lt;p&gt;&lt;strong&gt;Thème : Recherche d&amp;rsquo;information et Apprentissage automatique&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;25-26 Mars 2019, Lyon, France&lt;/p&gt;&#xA;&lt;p&gt;&lt;a href=&#34;https://coria-earia2019.projet.liris.cnrs.fr/EARIA/&#34;&gt;https://coria-earia2019.projet.liris.cnrs.fr/EARIA/&lt;/a&gt;&lt;/p&gt;&#xA;&lt;p&gt;&lt;a href=&#34;https://coria-earia2019.projet.liris.cnrs.fr/EARIA/===============&#34;&gt;===============&lt;/a&gt;&lt;br&gt;&#xA;L&amp;rsquo;école offre un cadre d&amp;rsquo;échange convivial tant autour des fondements&#xA;théoriques de l&amp;rsquo;apprentissage automatique et de leur utilisation en&#xA;recherche d&amp;rsquo;information et applications. Ces sujets sont abordés par des&#xA;chercheurs et des industriels faisant autorité dans le domaine. Les&#xA;participants auront également l&amp;rsquo;occasion de mettre en pratique les&#xA;connaissances théoriques aux travers de : 1) séance de travaux pratiques&#xA;sur l&amp;rsquo;utilisation d&amp;rsquo;environnement dédiés à l&amp;rsquo;apprentissage profond ; 2)&#xA;le Hackathon qui est un projet fédérateur de mise en situation dans un&#xA;domaine applicatif en lien avec la recherche d&amp;rsquo;information et&#xA;l&amp;rsquo;apprentissage automatique. La réalisation du projet permet de produire&#xA;un (des) prototype(s) qui sera (ront) présenté(s) lors d&amp;rsquo;une session de&#xA;la conférence CORIA qui aura lieu au suivant de EARIA du 27-29 Mars&#xA;2019.&lt;br&gt;&#xA;L&amp;rsquo;école s&amp;rsquo;adresse ainsi à un public de jeunes chercheurs, chercheurs et&#xA;industriels intéressés par la conception de modèles d&amp;rsquo;apprentissage&#xA;automatique pour la recherche d&amp;rsquo;information et applications, leur&#xA;implémentation et leur évaluation empirique&lt;/p&gt;</description>
    </item>
    <item>
      <title>Appel à communications/ call for papers CORIA 2019</title>
      <link>http://www.asso-aria.org/blog/2020/154-appel-a-communications-call-for-papers-coria-2019/</link>
      <pubDate>Thu, 08 Nov 2018 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/154-appel-a-communications-call-for-papers-coria-2019/</guid>
      <description>&lt;p&gt;::: {style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px; line-height: 1.2; margin-top: 0pt; margin-bottom: 0pt; text-align: justify;&amp;rdquo;}&#xA;[La 16è édition de CORIA (COnférence en Recherche d&amp;rsquo;Information et&#xA;Applications) sera organisée à Lyon du 27 au 29 mars 2019, conjointement&#xA;aux&#xA;]{style=&amp;ldquo;font-size: 12pt; font-family: Garamond; vertical-align: baseline; white-space: pre-wrap;&amp;rdquo;}[rencontres&#xA;jeunes chercheurs en RI (RJCRI) et à l&amp;rsquo;école EARIA. Elle est la&#xA;principale manifestation soutenue par l&amp;rsquo;Association Francophone de&#xA;Recherche d&amp;rsquo;Information et Applications ARIA&#xA;(&lt;a href=&#34;http://www.asso-aria.org/&#34;&gt;http://www.asso-aria.org&lt;/a&gt;).]{style=&amp;ldquo;font-size: 12pt; font-family: Garamond; vertical-align: baseline; white-space: pre-wrap;&amp;rdquo;}&#xA;:::&lt;/p&gt;</description>
    </item>
    <item>
      <title>CLEF 2018 - Masterclass</title>
      <link>http://www.asso-aria.org/blog/2020/153-clef-2018-masterclass/</link>
      <pubDate>Wed, 29 Aug 2018 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/153-clef-2018-masterclass/</guid>
      <description>&lt;p&gt;[&lt;em&gt;&lt;strong&gt;MasterClass:&lt;/strong&gt;&lt;/em&gt;]{style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px; text-decoration: underline;&amp;rdquo;}&lt;br&gt;&#xA;[Dans ce cadre une &amp;ldquo;ARIA&amp;rsquo;s Master Class&amp;rdquo; est organisée le vendredi 14&#xA;septembre. L&amp;rsquo;inscription est gratuite pour les adhérents de l&amp;rsquo;ARIA&#xA;(c&amp;rsquo;est-à-dire à jour de leur cotisation 2018).&#xA;]{style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px;&amp;rdquo;}&lt;br&gt;&#xA;[Si vous n&amp;rsquo;êtes pas encore adhérent(e) au titre de l&amp;rsquo;année 2018 RDV&#xA;rapidement ici :&#xA;]{style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px;&amp;rdquo;}&lt;a href=&#34;images/FichiersAssociation/Adhesion2018.pdf&#34;&gt;http://www.asso-aria.org/images/FichiersAssociation/Adhesion2018.pdf&lt;/a&gt;{.moz-txt-link-freetext}&lt;br&gt;&#xA;[Si vous souhaitez vous assurer ou vérifier que vous êtes bien adhérent&#xA;(soit à titre individuel, soit à titre moral) vous pouvez contacter&#xA;directement : Vincent Claveau&#xA;(]{style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px;&amp;rdquo;}&lt;a href=&#34;mailto:vincent.claveau@irisa.fr&#34;&gt;vincent.claveau@irisa.fr&lt;/a&gt;[)]{style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px;&amp;rdquo;}&lt;br&gt;&#xA;&lt;br&gt;&#xA;[Cette MasterClass est également ouverte gratuitement aux participants à&#xA;CLEF&#xA;2018.]{style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px;&amp;rdquo;}&lt;br&gt;&#xA;[&lt;strong&gt;&lt;br&gt;&#xA;Le nombre de places étant limitées (30 places), nous vous conseillons,&#xA;après avoir validé votre adhésion à l&amp;rsquo;ARIA ou votre inscription à CLEF,&#xA;de vous inscrire au plus vite (cf site web de CLEF&#xA;2018).&lt;/strong&gt;]{style=&amp;ldquo;font-family: Helvetica; font-size: 12px; color: #ff0000;&amp;rdquo;}&lt;br&gt;&#xA;&lt;br&gt;&#xA;[Le programme de cette MasterClass est le suivant (sous réserve de&#xA;modification) :&#xA;]{style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Appel à participations - Hackathon CORIA-TALN 2018 : Fake ou pas Fake ?</title>
      <link>http://www.asso-aria.org/blog/2020/151-appel-a-participations-hackathon-coria-taln-2018-fake-ou-pas-fake/</link>
      <pubDate>Fri, 06 Apr 2018 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/151-appel-a-participations-hackathon-coria-taln-2018-fake-ou-pas-fake/</guid>
      <description>&lt;p&gt;::: {style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px;&amp;rdquo;}&#xA;[&lt;strong&gt;Fake ou pas Fake&#xA;?&lt;/strong&gt;]{style=&amp;ldquo;color: #000000; font-family: Helvetica; font-size: 12px; background-color: rgba(255, 255, 255, 0);&amp;rdquo;}&#xA;:::&lt;/p&gt;&#xA;&lt;p&gt;[&lt;em&gt;Hackathon CORIA-TALN 2018&lt;/em&gt;&lt;br&gt;&#xA;(hackathon en recherche d&amp;rsquo;information et traitement automatique des&#xA;langues)&lt;br&gt;&#xA;&lt;br&gt;&#xA;&lt;strong&gt;TL;DR&lt;/strong&gt;&lt;br&gt;&#xA;&lt;br&gt;&#xA;Tâches : détection et visualisation de fausses informations sur les&#xA;réseaux&lt;br&gt;&#xA;Site web : &lt;a href=&#34;http://hackatal.github.io/2018&#34;&gt;http://hackatal.github.io/2018&lt;/a&gt;&lt;br&gt;&#xA;Dates : &lt;a href=&#34;x-apple-data-detectors://5&#34;&gt;14 et 15 mai 2018&lt;/a&gt;&lt;br&gt;&#xA;Lieu : IRISA, Rennes&lt;br&gt;&#xA;Inscription (gratuite mais obligatoire) :&#xA;&lt;a href=&#34;https://goo.gl/forms/soTeFTikjWol8bj13&#34;&gt;https://goo.gl/forms/soTeFTikjWol8bj13&lt;/a&gt; !&lt;br&gt;&#xA;&lt;br&gt;&#xA;&lt;strong&gt;Description&lt;/strong&gt;&lt;br&gt;&#xA;&lt;br&gt;&#xA;Dans le cadre de la conférence CORIA-TALN-RJC 2018 est organisé un&#xA;hackathon, 3ème édition côté CORIA (Hack Days) et TALN (HackaTAL).&#xA;L&amp;rsquo;évènement porte sur des problématiques en RI et en TAL. L&amp;rsquo;objectif est&#xA;de réunir les communautés scientifiques, et au delà, autour de défis à&#xA;relever, pour modéliser, prototyper, coder, expérimenter, développer,&#xA;tester, évaluer, échanger, etc. - par équipes, dans une ambiance&#xA;décontractée :) !&lt;br&gt;&#xA;&lt;br&gt;&#xA;Les tâches proposées portent cette année sur la détection et le&#xA;traitement d&amp;rsquo;informations manifestement fausses, un sujet de&#xA;préoccupation pour les médias et citoyens. Ces problématiques, nouvelles&#xA;pour la société de l&amp;rsquo;information, soulèvent de nombreuses questions et&#xA;nous essaierons de voir si des traitements RI et TAL peuvent y répondre,&#xA;pour mieux comprendre les phénomènes en jeu et y réagir, plus rapidement&#xA;et de manière plus adéquate, à l&amp;rsquo;aide d&amp;rsquo;algorithmes du domaine.&lt;br&gt;&#xA;&lt;br&gt;&#xA;L&amp;rsquo;événement est ouvert à tous (informaticiens, linguistes,&#xA;journalistes), ne nécessite aucune préparation particulière et ne&#xA;requiert pas de compétences spécifiques aux tâches que nous proposons&amp;hellip;&#xA;tout le monde est bienvenu !&lt;br&gt;&#xA;&lt;br&gt;&#xA;&lt;strong&gt;Tâches&lt;/strong&gt;&lt;br&gt;&#xA;&lt;br&gt;&#xA;[1. Détection : repérer et catégoriser les fausses&#xA;informations]{style=&amp;ldquo;text-decoration: underline;&amp;rdquo;}&lt;br&gt;&#xA;&lt;br&gt;&#xA;&lt;em&gt;Objectifs&lt;/em&gt;&lt;br&gt;&#xA;&lt;br&gt;&#xA;Parmi les informations disponibles en ligne certaines sont manifestement&#xA;fausses et il n&amp;rsquo;est pas évident de faire la part des choses, autant pour&#xA;les médias, entreprises ou laboratoires (notamment à cause des volumes&#xA;de données à traiter), que pour les citoyens : quels indices&#xA;caractérisent les fausses informations ? L&amp;rsquo;objectif de cette tâche est&#xA;de voir si des algorithmes TAL et RI sont capables de détecter et&#xA;catégoriser finement ces fausses informations.&lt;br&gt;&#xA;&lt;br&gt;&#xA;&lt;em&gt;Sous-tâches&lt;/em&gt;&lt;br&gt;&#xA;\&lt;/p&gt;</description>
    </item>
    <item>
      <title>Bourses Etudiants ARIA pour participation à CORIA 2018 (DL 2 mai 2018)</title>
      <link>http://www.asso-aria.org/blog/2020/150-bourses-etudiants-aria-pour-participation-a-coria-2018-dl-2-mai-2018/</link>
      <pubDate>Fri, 06 Apr 2018 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/150-bourses-etudiants-aria-pour-participation-a-coria-2018-dl-2-mai-2018/</guid>
      <description>&lt;p&gt;[L&amp;rsquo;association ARIA&#xA;(&lt;a href=&#34;http://www.asso-aria.org/&#34;&gt;http://www.asso-aria.org&lt;/a&gt;{.moz-txt-link-freetext})&#xA;propose des bourses a ses adhérents pour participer à la conférence&#xA;CORIA 2018 qui se déroule à Rennes &lt;a href=&#34;x-apple-data-detectors://1&#34;&gt;du 16 au 18&#xA;mai&lt;/a&gt; (ateliers le &lt;a href=&#34;x-apple-data-detectors://2&#34;&gt;14 et 15&#xA;mai&lt;/a&gt;) conjointement avec la conférence sur&#xA;le Traitement Automatique des Langues Naturelles (TALN) &amp;gt;&amp;gt;&#xA;cf.&lt;a href=&#34;http://coria-taln-2018.irisa.fr/&#34;&gt;http://coria-taln-2018.irisa.fr&lt;/a&gt;{.moz-txt-link-freetext}.]{style=&amp;ldquo;background-color: rgba(255, 255, 255, 0);&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[L&amp;rsquo;objectif prioritaire est de permettre à des étudiants, post-docs ou&#xA;jeunes docteurs qui ont un intérêt pour les travaux en Recherche&#xA;d&amp;rsquo;Information d&amp;rsquo;assister à la conférence CORIA/TALN. L&amp;rsquo;idée est&#xA;également est de prendre en considération les situations individuelles&#xA;particulières (notamment financières).&lt;br&gt;&#xA;]{style=&amp;ldquo;background-color: rgba(255, 255, 255, 0);&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Appel à communications CORIA 2018</title>
      <link>http://www.asso-aria.org/blog/2020/149-appel-a-communications-coria-2018/</link>
      <pubDate>Mon, 13 Nov 2017 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/149-appel-a-communications-coria-2018/</guid>
      <description>&lt;p&gt;Appel &amp;agrave; communications/ call for papers CORIA 2018&lt;br /&gt;++++++++++++++++++++++++++++++++++++++++++++++++++&lt;/p&gt;&#xA;&lt;!-- more --&gt;&#xA;&lt;p&gt;Dates importantes :&lt;br /&gt;-----------------------------&lt;br /&gt;26 janvier 2018: Intention de soumettre&lt;br /&gt;2 février 2018: Date limite de soumission&lt;br /&gt;16 mars 2018: Réponses aux auteurs&lt;br /&gt;14-16 mai 2018: Conférence&lt;/p&gt;&#xA;&lt;p&gt;Pour la premi&amp;egrave;re fois, l&#39;ARIA (Association francophone de Recherche d&#39;Information et Applications) et l&#39;ATALA (Association pour le Traitement Automatique des Langues) organisent conjointement leur principale conférence afin de réunir en un seul lieu les deux communautés de la recherche d&#39;information et du traitement automatique des langues.&lt;br /&gt;Organisée par l&#39;IRISA (UMR 6074) et le Centre Inria Bretagne-Atlantique, cette édition se déroulera du 14 au 18 mai 2018 &amp;agrave; Rennes et regroupera donc :&lt;br /&gt;- la 15e Conférence en Recherche d&#39;Information et Applications (CORIA) ;&lt;br /&gt;- la 25e conférence sur le Traitement Automatique des Langues Naturelles (TALN) ;&lt;br /&gt;- une rencontre jeunes chercheurs (RJC) commune aux deux communautés correspondant &amp;agrave; la 13e édition de la Rencontre des Jeunes Chercheurs en Recherche d&#39;Information (RJCRI) et &amp;agrave; la 20e édition des Rencontre étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL) ;&lt;br /&gt;- le salon de l&#39;innovation en technologies du langage et de l&#39;information.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Journée commune AFIA - ARIA, 12 décembre 2017</title>
      <link>http://www.asso-aria.org/blog/2020/148-journee-commune-afia-aria-12-decembre-2017/</link>
      <pubDate>Mon, 21 Aug 2017 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/148-journee-commune-afia-aria-12-decembre-2017/</guid>
      <description>&lt;p&gt;&lt;strong&gt;[Intelligence artificielle et Recherche d&amp;rsquo;Information]{.s1}&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;&lt;strong&gt;[&lt;a href=&#34;https://ia-ri.sciencesconf.org/&#34;&gt;https://ia-ri.sciencesconf.org/&lt;/a&gt;&lt;a href=&#34;https://ia-ri.sciencesconf.org/&#34;&gt;&lt;/a&gt;]{.s2}&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;Paris, 12 décembre 2017&lt;/p&gt;&#xA;&lt;p&gt;[ Journée commune AFIA - ARIA]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[ Association Française pour l&amp;rsquo;Intelligence Artificielle]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[ Association francophone de Recherche d&amp;rsquo;Information et&#xA;Applications]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[ Maison des Sciences de l&amp;rsquo;Homme Paris Nord (à confirmer)]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[THÈME]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[Cette journée constitue la 2ème rencontre entre chercheurs en&#xA;Intelligence Artificielle (IA) et en Recherche d&amp;rsquo;Information (RI). La&#xA;première visait à mettre en évidence les problématiques communes et les&#xA;approches proposées venant de l&amp;rsquo;une ou l&amp;rsquo;autre communauté.]{.s1}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Journée commune AFIA - ARIA, 12 décembre 2017</title>
      <link>http://www.asso-aria.org/journees-thematiques/152-journee-commune-afia-aria-12-decembre-2018/</link>
      <pubDate>Mon, 21 Aug 2017 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/journees-thematiques/152-journee-commune-afia-aria-12-decembre-2018/</guid>
      <description>&lt;p&gt;&lt;strong&gt;[Intelligence artificielle et Recherche d&amp;rsquo;Information]{.s1}&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;&lt;strong&gt;[&lt;a href=&#34;https://ia-ri.sciencesconf.org/&#34;&gt;https://ia-ri.sciencesconf.org/&lt;/a&gt;&lt;a href=&#34;https://ia-ri.sciencesconf.org/&#34;&gt;&lt;/a&gt;]{.s2}&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;Paris, 12 décembre 2017&lt;/p&gt;&#xA;&lt;p&gt;[ Journée commune AFIA - ARIA]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[ Association Française pour l&amp;rsquo;Intelligence Artificielle]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[ Association francophone de Recherche d&amp;rsquo;Information et&#xA;Applications]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[ Maison des Sciences de l&amp;rsquo;Homme Paris Nord]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[THÈME]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[Cette journée constitue la 2ème rencontre entre chercheurs en&#xA;Intelligence Artificielle (IA) et en Recherche d&amp;rsquo;Information (RI). La&#xA;première visait à mettre en évidence les problématiques communes et les&#xA;approches proposées venant de l&amp;rsquo;une ou l&amp;rsquo;autre communauté.]{.s1}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ateliers RISE</title>
      <link>http://www.asso-aria.org/journees-thematiques/147-atelier-rise/</link>
      <pubDate>Tue, 18 Jul 2017 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/journees-thematiques/147-atelier-rise/</guid>
      <description>&lt;p&gt;L&amp;rsquo;ARIA soutient depuis 2012 les ateliers &lt;a href=&#34;http://rise.imag.fr&#34;&gt;RISE&lt;/a&gt;&#xA;(Recherche d&amp;rsquo;Information SEmantique). Ces ateliers annuels ont pour but&#xA;de proposer des lieux de rencontre entre des chercheurs issus de&#xA;différentes communautés comme la Recherche d&amp;rsquo;Information, le Web&#xA;Sémantique, le TALN, le Multimedia, l&amp;rsquo;Ingénierie des Connaissances.&lt;/p&gt;&#xA;&lt;p&gt;Liens vers les actes des ateliers: &lt;a href=&#34;https://sites.google.com/site/frenchsemanticir/documents&#34;&gt;RISE&#xA;documents&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Concours de vidéos : #ScienceInfoStream organisé par la SIF</title>
      <link>http://www.asso-aria.org/blog/2020/146-concours-de-videos-scienceinfostream-organise-par-la-sif/</link>
      <pubDate>Tue, 18 Jul 2017 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/146-concours-de-videos-scienceinfostream-organise-par-la-sif/</guid>
      <description>&lt;p&gt;[La &lt;a href=&#34;http://www.societe-informatique-de-france.fr/&#34;&gt;[&lt;strong&gt;Société informatique de&#xA;France&lt;/strong&gt;]{.s2}&lt;/a&gt; vous&#xA;invite à participer à la première édition de son :]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;&lt;strong&gt;[Concours de vidéos : #ScienceInfoStream&lt;br&gt;&#xA;&amp;ldquo;L&amp;rsquo;informatique en stream&amp;rdquo;]{.s1 style=&amp;ldquo;font-size: 14pt;&amp;rdquo;}&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;[Vous êtes passionné(e)s de science informatique ? Vous aimez les défis&#xA;? Vous vous sentez l&amp;rsquo;âme d&amp;rsquo;un vidéaste ? N&amp;rsquo;attendez plus ! Prenez votre&#xA;smartphone, webcam, ou caméra : vous avez moins de 2]{.s1}[^8^]{.s3}[&#xA;secondes pour partager ces pépites de science qui vous fascinent.]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[Plus précisément, votre vidéo, tournée en français, aura une durée&#xA;comprise entre 2]{.s1}[^7^]{.s3}[ (128) et 2]{.s1}[^8^]{.s3}[ (256)&#xA;secondes. Elle sera au format de votre choix (les formats libres, comme&#xA;ogv, sont encouragés) et mise à disposition sur le web (via votre page&#xA;personnelle ou via un site de streaming ou&amp;hellip;). La soumission se fera&#xA;par email à l&amp;rsquo;adresse&#xA;&lt;a href=&#34;mailto:scienceinfostream@societe-informatique-de-france.fr&#34;&gt;[scienceinfostream@societe-informatique-de-france.fr]{.s4}&lt;/a&gt;,&#xA;avant le 1er décembre 2017. Le mail contiendra, outre le lien, le titre&#xA;de la vidéo et les noms et prénoms de son ou de ses auteur(s) avec une&#xA;présentation succincte (âge, rôles respectifs dans le projet&amp;hellip;).]{.s1}&lt;/p&gt;</description>
    </item>
    <item>
      <title>9ème Atelier Recherche d&#39;Information SEmantique. Caen, juillet 2017</title>
      <link>http://www.asso-aria.org/blog/2020/145-9eme-atelier-recherche-d-information-semantique-caen-juillet-2017/</link>
      <pubDate>Thu, 01 Jun 2017 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/145-9eme-atelier-recherche-d-information-semantique-caen-juillet-2017/</guid>
      <description>&lt;p&gt;{#section style=&amp;ldquo;font-family: &amp;lsquo;Trebuchet MS&amp;rsquo;, arial, sans-serif; color: #b0dae9; background: url(&amp;lsquo;h2-bg.gif&amp;rsquo;) left center no-repeat;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;L&amp;rsquo;atelier RISE en est à sa neuvième édition. Cette année il sera associé&#xA;à la Conférence [&lt;a href=&#34;https://pfia2017.greyc.fr/ic/presentation&#34;&gt;[IC 2017 de la Plateforme Francophone d&amp;rsquo;Intelligence&#xA;Artificielle]{style=&amp;ldquo;color: #000000;&amp;rdquo;}&lt;/a&gt;&#xA;]{style=&amp;ldquo;color: #000000;&amp;rdquo;}, après avoir été organisé conjointement avec&#xA;les conférences CORIA 2016 de la Semaine du Document Numérique, IC 2015&#xA;(PFIA 2015), CORIA 2014 (SDNRI 2014), IC 2013 ,EGC 2012, CORIA 2011,&#xA;INFORSID 2010 et 2009.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Création de la revue OpenScien RIDOWS</title>
      <link>http://www.asso-aria.org/blog/2020/144-creation-de-la-revue-openscien-ridows/</link>
      <pubDate>Thu, 01 Jun 2017 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/144-creation-de-la-revue-openscien-ridows/</guid>
      <description>&lt;p&gt;[&lt;a href=&#34;http://ridows.irisa.fr/&#34;&gt;http://ridows.irisa.fr&lt;/a&gt;]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[Nous avons le plaisir de vous annoncer la création de la revue RIDoWS /&#xA;]{.s2}[Recherche d&amp;rsquo;Information, Document, Web sémantique / dans la&#xA;collection ]{.s2}[OpenScience d&amp;rsquo;ISTE éditions&#xA;&lt;a href=&#34;https://www.openscience.fr/&#34;&gt;[https://www.openscience.fr/]{.s3}&lt;/a&gt;]{.s2}&lt;/p&gt;&#xA;&lt;p&gt;[À l&amp;rsquo;ère des données massives, l&amp;rsquo;accès à l&amp;rsquo;information est devenu une&#xA;]{.s2}[problématique de recherche centrale. La multiplicité des formes&#xA;de ]{.s2}[documents (multimédia, multilingue, structuré ou non) et des&#xA;usages ]{.s2}[favorisent de plus en plus un brassage entre différentes&#xA;communautés ]{.s2}[afin d&amp;rsquo;analyser les documents dans leur complexité.&#xA;RIDoWS se veut ainsi ]{.s2}[le point de rencontre des ces communautés&#xA;scientifiques ou industrielles ]{.s2}[s&amp;rsquo;intéressant à la recherche&#xA;d&amp;rsquo;information, le Web sémantique, l&amp;rsquo;analyse ]{.s2}[de documents ou de&#xA;collections multimédias (textes, images, sons, ]{.s2}[vidéos&amp;hellip;).]{.s2}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Appel à candidatures : Bourses FRANCE L’Oréal-UNESCO Pour les Femmes et la Science 2017</title>
      <link>http://www.asso-aria.org/blog/2020/143-appel-a-candidatures-bourses-france-l-oreal-unesco-pour-les-femmes-et-la-science-2017/</link>
      <pubDate>Thu, 12 Jan 2017 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/143-appel-a-candidatures-bourses-france-l-oreal-unesco-pour-les-femmes-et-la-science-2017/</guid>
      <description>&lt;p&gt;[La Fondation L&amp;rsquo;Oréal, en partenariat avec l&amp;rsquo;UNESCO et l&amp;rsquo;Académie des&#xA;Sciences, est heureuse de vous annoncer l&amp;rsquo;ouverture de l&amp;rsquo;appel à&#xA;candidatures de l&amp;rsquo;édition 2017 des Bourses FRANCE L&amp;rsquo;Oréal-UNESCO Pour&#xA;les Femmes et la Science.]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[Créé en 2007, ce programme a pour objet de révéler et récompenser de&#xA;jeunes chercheuses talentueuses. Au total, 170 jeunes femmes ont&#xA;bénéficié d&amp;rsquo;une Bourse FRANCE L&amp;rsquo;Oréal-UNESCO Pour les Femmes et la&#xA;Science. ]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[En 2017, la Fondation L&amp;rsquo;Oréal remettra 30 Bourses : ]{.s1}&lt;/p&gt;</description>
    </item>
    <item>
      <title>EARIA Days</title>
      <link>http://www.asso-aria.org/earia/earia-2016/earia-days/</link>
      <pubDate>Tue, 08 Nov 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2016/earia-days/</guid>
      <description>&lt;p&gt;Dans la lignée des &lt;a href=&#34;http://hackday.lip6.fr/&#34;&gt;CORIA-CIFED hackdays&lt;/a&gt; 2014&#xA;et 2016, un projet destiné à fédérer les étudiants a été mené durant&#xA;deux jours.&lt;/p&gt;&#xA;&lt;p&gt;Des équipes inter-laboratoires ont été formées et se sont penchées sur&#xA;la problématique de la RI interactive. L&amp;rsquo;idée était de proposer un&#xA;prototype original de RI interactive, basé sur le moteur de recherche&#xA;Indri. L&amp;rsquo;évaluation des moteurs a été faite dans le cadre d&amp;rsquo;une campagne&#xA;d&amp;rsquo;évaluation traditionnelle (TREC) et via une évaluation utilisateur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>GdR MaDICS - Appel à Actions</title>
      <link>http://www.asso-aria.org/blog/2020/141-gdr-madics-appel-a-actions/</link>
      <pubDate>Thu, 21 Jul 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/141-gdr-madics-appel-a-actions/</guid>
      <description>&lt;p&gt;[L&amp;rsquo;objectif du GDR ]{.s2}[MaDICS est de promouvoir et animer des&#xA;activités de recherche interdisciplinaires positionnées dans un&#xA;continuum «des données aux connaissances et à la prise de décision» dont&#xA;le point de départ sont les masses de données en Sciences. MaDICS est&#xA;également un forum d&amp;rsquo;échanges entre scientifiques et acteurs économiques&#xA;confrontés aux problèmes du &amp;ldquo;&lt;em&gt;big data&lt;/em&gt;&amp;rdquo; et des Sciences des données, un&#xA;instrument de prospective et un lieu d&amp;rsquo;accompagnement des jeunes&#xA;chercheurs dans les domaines concernés.]{.s1}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Comités</title>
      <link>http://www.asso-aria.org/earia/earia-2016/comite/</link>
      <pubDate>Fri, 08 Jul 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2016/comite/</guid>
      <description>&lt;p&gt;Pour la mise en place de l&amp;rsquo;école EARIA, deux comités sont formés.&lt;/p&gt;&#xA;&lt;h3 id=&#34;le-comité-dorganisation&#34;&gt;Le comité d&amp;rsquo;organisation&lt;/h3&gt;&#xA;&lt;p&gt;Ce comité prend en charge les aspects pratiques de l&amp;rsquo;école d&amp;rsquo;automne,&#xA;liés à l&amp;rsquo;organisation de l&amp;rsquo;école, et la venue des intervenants. Il est&#xA;composé des personnes suivantes :&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Léa Laporte (&lt;em&gt;Présidente du comité&lt;/em&gt;), LIRIS-INSA Lyon, équipe DRIM&lt;/li&gt;&#xA;&lt;li&gt;Sylvie Calabretto, LIRIS-INSA Lyon, équipe DRIM&lt;/li&gt;&#xA;&lt;li&gt;Michel Beigbeder, EMSE Saint étienne&lt;/li&gt;&#xA;&lt;li&gt;Diana Nurbakova, LIRIS-INSA Lyon, équipe DRIM&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;le-comité-scientifique&#34;&gt;Le comité scientifique&lt;/h3&gt;&#xA;&lt;p&gt;Le comité scientifique a en charge la définition du programme de&#xA;l&amp;rsquo;école, le choix et l&amp;rsquo;interaction avec les intervenants choisis. Ce&#xA;comité est constitué de scientifiques reconnus dans le domaine de la&#xA;recherche d&amp;rsquo;information. Il est composé des personnes suivantes :&lt;/p&gt;</description>
    </item>
    <item>
      <title>Conférenciers</title>
      <link>http://www.asso-aria.org/earia/earia-2016/conferenciers/</link>
      <pubDate>Fri, 08 Jul 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2016/conferenciers/</guid>
      <description>&lt;p&gt;{#section style=&amp;ldquo;font-size: 1.4em; font-family: &amp;lsquo;Titillium Maps&amp;rsquo;, Arial; margin: 0px -5px 10px; padding: 5px; line-height: 1.19em; color: #0d4c89; border-bottom-style: solid; border-bottom-width: 1px; border-bottom-color: #dddddd;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;h1 id=&#34;mohand-boughanem-irit-université-paul-sabatier-de-toulouse&#34; style=&#34;font-size: 1.4em; font-family: &#39;Titillium Maps&#39;, Arial; margin: 0px -5px 10px; padding: 5px; line-height: 1.19em; color: #0d4c89; border-bottom-style: solid; border-bottom-width: 1px; border-bottom-color: #dddddd;&#34;&gt;Mohand Boughanem, IRIT, Université Paul Sabatier de Toulouse&lt;/h1&gt;&#xA;&lt;p&gt;&lt;a href=&#34;http://ama.liglab.fr/~gaussier/&#34;&gt;&lt;strong&gt;Mohand Boughanem&lt;/strong&gt;&lt;/a&gt; est professeur à&#xA;l&amp;rsquo;Université Paul Sabatier de Toulouse depuis 2002. Il est membre de&#xA;l&amp;rsquo;équipe &amp;ldquo;Information Retrieval and Information Synthesis&amp;rdquo; (IRIS) de&#xA;l&amp;rsquo;Institut de Recherche en Informatique de Toulouse.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Doctoriales</title>
      <link>http://www.asso-aria.org/earia/earia-2016/doctoriales/</link>
      <pubDate>Fri, 08 Jul 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2016/doctoriales/</guid>
      <description>&lt;h3 id=&#34;présentation&#34;&gt;Présentation&lt;/h3&gt;&#xA;&lt;p&gt;Nous offrons à tous les doctorants et jeunes docteurs la possibilité de&#xA;communiquer sur leurs travaux de recherche durant les doctoriales de&#xA;l&amp;rsquo;école. Il s&amp;rsquo;agit pour eux de présenter leurs travaux en cours, leurs&#xA;premiers résultats ou leurs perspectives de recherche.&lt;/p&gt;&#xA;&lt;p&gt;L&amp;rsquo;idée est de permettre des échanges sur les&#xA;problèmes/approches/solutions liés aux travaux présentés, sous une forme&#xA;de brainstorming.&lt;/p&gt;&#xA;&lt;h3 id=&#34;organisation&#34;&gt;Organisation&lt;/h3&gt;&#xA;&lt;p&gt;[Les échanges auront lieu lors d&amp;rsquo;une session spéciale &amp;ldquo;Doctoriales&amp;rdquo; le&#xA;lundi 7 novembre au soir, après le dîner. La salle de cours sera&#xA;réservée pour cette&#xA;occasion.]{style=&amp;ldquo;font-family: arial, helvetica, sans-serif; font-size: 10pt;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Informations pratiques</title>
      <link>http://www.asso-aria.org/earia/earia-2016/informations/</link>
      <pubDate>Fri, 08 Jul 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2016/informations/</guid>
      <description>&lt;p&gt;EARIA se déroulera du lundi 7 novembre au mercredi 9 novembre au &lt;a href=&#34;http://www.cis-lyon.com&#34;&gt;CISL&#xA;Ethic Etapes de Lyon&lt;/a&gt;.&lt;/p&gt;&#xA;&lt;h3 id=&#34;sur-place&#34;&gt;Sur place&lt;/h3&gt;&#xA;&lt;p&gt;Le &lt;strong&gt;linge de toilette n&amp;rsquo;est pas fourni&lt;/strong&gt; : pensez à apporter vos&#xA;serviettes de toilette.&lt;/p&gt;&#xA;&lt;p&gt;[]{style=&amp;ldquo;font-size: 14px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;h3 id=&#34;venir-au-cisl&#34;&gt;Venir au CISL&lt;/h3&gt;&#xA;&lt;p&gt;Le CISL est très facilement accessible en transports en commun. Il est&#xA;desservi par la ligne de tram T4, dont l&amp;rsquo;arrêt « Professeur Beauvisage -&#xA;CISL » se situe directement au pied du bâtiment, ainsi que par trois&#xA;lignes de bus (C16, C22 et C25).&lt;/p&gt;</description>
    </item>
    <item>
      <title>Inscription</title>
      <link>http://www.asso-aria.org/earia/earia-2016/inscriptions/</link>
      <pubDate>Fri, 08 Jul 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2016/inscriptions/</guid>
      <description>&lt;p&gt;Les frais d&amp;rsquo;inscriptions couvrent :&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;L&amp;rsquo;hébergement (2 nuits : du lundi 7 au mardi 8 novembre 2016, et du&#xA;mardi 8 au mercredi 9 novembre 2016). &lt;strong&gt;Attention : le linge de&#xA;toilette n&amp;rsquo;est pas fourni, vous devez donc venir avec votre&#xA;serviette de toilette.&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Les repas (petits déjeuners des 8 et 9 novembre 2016, déjeuners des&#xA;7 et 8 novembre 2016, dîners des 7 et 8 octobre 2016)&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Les pauses matin et après-midi&lt;/p&gt;</description>
    </item>
    <item>
      <title>Programme</title>
      <link>http://www.asso-aria.org/earia/earia-2016/programme/</link>
      <pubDate>Fri, 08 Jul 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2016/programme/</guid>
      <description>&lt;p&gt;&lt;em&gt;Programme prévisionnel, susceptible de modifications&lt;/em&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;lundi-7-novembre-après-midi&#34;&gt;Lundi 7 novembre après midi&lt;/h2&gt;&#xA;&lt;p&gt;Accueil et déjeuner&lt;/p&gt;&#xA;&lt;h4 id=&#34;13h30---15h15&#34;&gt;13h30 - 15h15&lt;/h4&gt;&#xA;&lt;h5 id=&#34;session-1---introduction-à-la-recherche-dinformation-par-mohand-boughanem-irit---partie-1---partie-2&#34; style=&#34;margin-left: 30px;&#34;&gt;Session 1 - Introduction à la Recherche d&amp;rsquo;Information par Mohand Boughanem (IRIT) - &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2016/slides/Intro_RI_EARIA_2016_P1.pdf&#34;&gt;Partie 1&lt;/a&gt; - &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2016/slides/Intro_RI_EARIA_2016_P2.pdf&#34;&gt;Partie 2&lt;/a&gt;&lt;/h5&gt;&#xA;&lt;h4 id=&#34;h45---17h30&#34; style=&#34;font-size: 14px;&#34;&gt;15h45 - 17h30&lt;/h4&gt;&#xA;&lt;h5 id=&#34;session-2---modèles-de-recherche-dinformation-par-éric-gaussier-lig&#34; style=&#34;margin-left: 30px;&#34;&gt;Session 2 - &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2016/slides/ModelesRI-EARIA-2016-eg.pdf&#34;&gt;Modèles de Recherche d&amp;rsquo;Information par éric Gaussier&lt;/a&gt; (LIG)&lt;/h5&gt;&#xA;&lt;h4 id=&#34;h30---18h&#34; style=&#34;font-size: 14px;&#34;&gt;17h30 - 18h&lt;/h4&gt;&#xA;&lt;h5 id=&#34;projet-earia-i---présentation-et-lancement-par-karen-pinel-sauvagnat-irit-et-benjamin-piwowarski-lip6&#34; style=&#34;margin-left: 30px;&#34;&gt;Projet EARIA (I) - Présentation et lancement par Karen Pinel-Sauvagnat (IRIT) et Benjamin Piwowarski (LIP6)&lt;/h5&gt;&#xA;&lt;h2 id=&#34;lundi-7-novembre-soirée&#34;&gt;Lundi 7 novembre soirée&lt;/h2&gt;&#xA;&lt;h4 id=&#34;h---22h&#34; style=&#34;font-size: 14px;&#34;&gt;20h - 22h&lt;/h4&gt;&#xA;&lt;h5 id=&#34;session-3---doctoriales-et-échanges-informels&#34; style=&#34;margin-left: 30px;&#34;&gt;Session 3 - Doctoriales et échanges informels&lt;/h5&gt;&#xA;&lt;h2 id=&#34;mardi-8-novembre-matin&#34;&gt;Mardi 8 novembre matin&lt;/h2&gt;&#xA;&lt;h4 id=&#34;8h30---10h15&#34;&gt;8h30 - 10h15&lt;/h4&gt;&#xA;&lt;h5 id=&#34;session-4---word-embeddings-connaissances-et-réseaux-de-neurones-par-benjamin-piwowarski-lip6&#34; style=&#34;margin-left: 30px;&#34;&gt;Session 4 - &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2016/slides/piwowarski.pdf&#34;&gt;Word Embeddings, Connaissances et Réseaux de Neurones par Benjamin Piwowarski&lt;/a&gt; (LIP6)&lt;/h5&gt;&#xA;&lt;h4 id=&#34;h45--12h30&#34; style=&#34;font-size: 14px;&#34;&gt;10h45- 12h30&lt;/h4&gt;&#xA;&lt;h5 id=&#34;session-5---traitement-automatique-de-la-langue-et-extraction-dinformation-par-anne-laure-ligozat-limsi&#34; style=&#34;margin-left: 30px;&#34;&gt;Session 5 - &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2016/slides/cours_ei_earia2016.pdf&#34;&gt;Traitement Automatique de la Langue et Extraction d&amp;rsquo;Information par Anne-Laure Ligozat&lt;/a&gt; (LIMSI)&lt;/h5&gt;&#xA;&lt;h2 id=&#34;mardi-8-novembre-après-midi&#34;&gt;Mardi 8 novembre après-midi&lt;/h2&gt;&#xA;&lt;h4 id=&#34;13h30---15h&#34;&gt;13h30 - 15h&lt;/h4&gt;&#xA;&lt;h5 id=&#34;session-6---recherche-dinformation-contextuelle-et-sociale-par-lynda-tamine-lechani-irit&#34; style=&#34;margin-left: 30px;&#34;&gt;Session 6 - &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2016/slides/Cours%20RI-ContextuelleEARIA2016.pdf&#34;&gt;Recherche d&amp;rsquo;Information Contextuelle et Sociale par Lynda Tamine-Lechani&lt;/a&gt; (IRIT)&lt;/h5&gt;&#xA;&lt;h4 id=&#34;h30---18h30&#34; style=&#34;font-size: 14px;&#34;&gt;15h30 - 18h30&lt;/h4&gt;&#xA;&lt;h5 id=&#34;projet-earia-ii---conception-et-développement---karen-pinel-sauvagnat-benjamin-piwowarski-et-les-autres-intervenants&#34; style=&#34;margin-left: 30px;&#34;&gt;Projet EARIA (II) - Conception et Développement - Karen Pinel-Sauvagnat, Benjamin Piwowarski et les autres intervenants&lt;/h5&gt;&#xA;&lt;h2 id=&#34;mardi-8-novembre-soirée&#34;&gt;Mardi 8 novembre soirée&lt;/h2&gt;&#xA;&lt;h4 id=&#34;20h---22h&#34;&gt;20h - 22h&lt;/h4&gt;&#xA;&lt;h5 id=&#34;projet-earia-iii---finalisation-des-projets-préparation-des-présentations---karen-pinel-sauvagnat-benjamin-piwowarski-et-les-autres-intervenants&#34; style=&#34;margin-left: 30px;&#34;&gt;Projet EARIA (III) - Finalisation des projets, préparation des présentations - Karen Pinel-Sauvagnat, Benjamin Piwowarski et les autres intervenants&lt;/h5&gt;&#xA;&lt;h2 id=&#34;mercredi-9-novembre-matin&#34;&gt;Mercredi 9 novembre matin&lt;/h2&gt;&#xA;&lt;h4 id=&#34;8h30---9h15&#34;&gt;8h30 - 9h15&lt;/h4&gt;&#xA;&lt;h5 id=&#34;projet-earia-iv---présentation-des-projets&#34; style=&#34;margin-left: 30px;&#34;&gt;Projet EARIA (IV) - Présentation des projets&lt;/h5&gt;&#xA;&lt;h4 id=&#34;h15---10h15&#34; style=&#34;font-size: 14px;&#34;&gt;9h15 - 10h15&lt;/h4&gt;&#xA;&lt;h5 id=&#34;session-7---benjamin-habegger---société-boot-start&#34; style=&#34;margin-left: 30px;&#34;&gt;Session 7 - Benjamin Habegger - Société Boot-Start&lt;/h5&gt;&#xA;&lt;h4 id=&#34;h45---12h30&#34; style=&#34;font-size: 14px;&#34;&gt;10h45 - 12h30&lt;/h4&gt;&#xA;&lt;h5 id=&#34;session-8---recherche-dinformation-multimédia-par-georges-quénot-lig&#34; style=&#34;margin-left: 30px;&#34;&gt;Session 8 - &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2016/slides/EARIA-2016-GQ.pdf&#34;&gt;Recherche d&amp;rsquo;Information multimédia par Georges Quénot&lt;/a&gt; (LIG)&lt;/h5&gt;</description>
    </item>
    <item>
      <title>Comités</title>
      <link>http://www.asso-aria.org/earia/earia-2012/comite/</link>
      <pubDate>Mon, 15 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2012/comite/</guid>
      <description>&lt;h2 id=&#34;comité-scientifique&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt;Comité scientifique :&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;Présidente :&lt;/strong&gt; Brigitte Grau, LIMSI-CNRS et ENSIIE&lt;/li&gt;&#xA;&lt;li&gt;Michel Beigbeder, école des Mines de Saint-étienne&lt;/li&gt;&#xA;&lt;li&gt;Mohand Boughanem, IRIT, Université de Toulouse&lt;/li&gt;&#xA;&lt;li&gt;Sylvie Calabretto, LIRIS, INSA de Lyon&lt;/li&gt;&#xA;&lt;li&gt;éric Gaussier, LIG, Université de Grenoble&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;comité-dorganisation&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt;Comité d&amp;rsquo;organisation :&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;&lt;strong&gt;Président :&lt;/strong&gt; Michel Beigbeder, école des Mines de Saint-étienne&lt;/p&gt;</description>
    </item>
    <item>
      <title>Conférenciers</title>
      <link>http://www.asso-aria.org/earia/earia-2012/conferenciers/</link>
      <pubDate>Mon, 15 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2012/conferenciers/</guid>
      <description>&lt;h1 id=&#34;jacques-savoy-université-de-neuchâtel&#34;&gt;Jacques Savoy, Université de Neuchâtel&lt;/h1&gt;&#xA;&lt;hr&gt;&#xA;&lt;p&gt;&lt;img src=&#34;http://labh-curien.univ-st-etienne.fr/~gery/earia2012/jacques_savoy.jpg&#34; alt=&#34;&#34;&gt;   &lt;strong&gt;&lt;a href=&#34;http://www2.unine.ch/jacques.savoy&#34;&gt;Professeur Jacques Savoy&lt;/a&gt;&lt;/strong&gt; est professeur ordinaire en informatique à la Faculté des sciences de l&amp;rsquo;Université de Neuchâtel (Suisse). J. Savoy a obtenu son doctorat en économétrie et informatique à l&amp;rsquo;Université de Fribourg (Suisse), en 1987, sur un thème touchant le livre électronique. Après une année d&amp;rsquo;études post-doctorales au Département d&amp;rsquo;informatique et de Recherche Opérationnelle (DIRO) de l&amp;rsquo;Université de Montréal, il a été professeur-adjoint dans cette institution jusqu&amp;rsquo;en 1993. Il a ensuite rejoint l&amp;rsquo;Université de Neuchâtel, d&amp;rsquo;abord en Faculté des sciences économiques, puis en Faculté des sciences. Ses intérêts de recherche se situent dans le domaine du traitement automatique de la langue naturelle et, en particulier, en recherche d&amp;rsquo;information. Dans ce cadre, il a travaillé dans la prise en compte des liens hypertextes afin d&amp;rsquo;améliorer la qualité de la réponse. Ses travaux touchent également la mise au point de moteurs de recherche dans une vingtaine de langues ou pour des systèmes multilingues. Il participe activement à diverses campagnes internationales d&amp;rsquo;évaluation (TREC, NTCIR, CLEF ou FIRE) touchant ces domaines. Plus récemment, il s&amp;rsquo;est intéressé à a catégorisation automatique des textes et, plus particulièrement, à l&amp;rsquo;attribution d&amp;rsquo;auteur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Doctoriales</title>
      <link>http://www.asso-aria.org/earia/earia-2012/doctoriales/</link>
      <pubDate>Mon, 15 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2012/doctoriales/</guid>
      <description>&lt;p&gt;L&amp;rsquo;édition 2012 de l&amp;rsquo;Ecole d&amp;rsquo;Automne en Recherche d&amp;rsquo;Information et&#xA;Applications (EARIA) offre aux doctorants et aux jeunes docteurs la&#xA;possibilité de communiquer sur leurs travaux de recherche durant les&#xA;doctoriales de l&amp;rsquo;école. Il s&amp;rsquo;agit pour eux de présenter (sous la forme&#xA;d&amp;rsquo;un poster) leurs travaux en cours, leurs premiers résultats ou leurs&#xA;perspectives de recherche liés aux thématiques de l&amp;rsquo;école d&amp;rsquo;automne à&#xA;savoir :&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Théorie et modèles formels pour la RI : modèle logique, modèles de&#xA;langages.&lt;/li&gt;&#xA;&lt;li&gt;Passage à l&amp;rsquo;échelle de système de recherche d&amp;rsquo;information :&#xA;performances, architectures.&lt;/li&gt;&#xA;&lt;li&gt;Classification, clustering, ranking, apprentissage automatique :&#xA;filtrage, spam, TDT, ranking pour les moteurs de recherche.&lt;/li&gt;&#xA;&lt;li&gt;Recherche d&amp;rsquo;information multilingue et crosslingue, traduction&#xA;automatique.&lt;/li&gt;&#xA;&lt;li&gt;Traitement Automatique de la Langue Naturelle pour la recherche&#xA;d&amp;rsquo;information, résumé automatique, systèmes de questions-réponses,&#xA;acquisition lexicale.&lt;/li&gt;&#xA;&lt;li&gt;RI Sémantique : indexation conceptuelle.&lt;/li&gt;&#xA;&lt;li&gt;Extraction d&amp;rsquo;information pour la RI, fouille de texte, Entity&#xA;Searching.&lt;/li&gt;&#xA;&lt;li&gt;Multimédia (image, audio, vidéos, son, musique) : indexation et&#xA;interaction avec le texte.&lt;/li&gt;&#xA;&lt;li&gt;RI Web : grands graphes, utilisation de la topologie du web, lois de&#xA;puissances, citations, analyse de liens.&lt;/li&gt;&#xA;&lt;li&gt;Réseaux sociaux : analyse de blogs et de sites communautaires, suivi&#xA;de conversation, analyse de rumeur, analyse de sentiments, Social&#xA;Tagging.&lt;/li&gt;&#xA;&lt;li&gt;Recherche collaborative : filtrage, systèmes de recommandation.&lt;/li&gt;&#xA;&lt;li&gt;Interaction utilisateur : interrogation flexible, interfaces,&#xA;visualisation, modélisation de l&amp;rsquo;utilisateur, tests d&amp;rsquo;usage,&#xA;visualisation de gros corpus.&lt;/li&gt;&#xA;&lt;li&gt;Traitement et représentation des connaissances : métadonnées,&#xA;ontologies, web sémantique, ingénierie des connaissances.&lt;/li&gt;&#xA;&lt;li&gt;Bibliothèques numériques&lt;/li&gt;&#xA;&lt;li&gt;Systèmes de recherche d&amp;rsquo;information dédiés : recherche d&amp;rsquo;information&#xA;génomique, géographique, technique, ou de composants logiciels.&lt;/li&gt;&#xA;&lt;li&gt;RI distribuée : recherche d&amp;rsquo;information mobile, située, P2P.&lt;/li&gt;&#xA;&lt;li&gt;Outils pour la RI : évaluation, bancs d&amp;rsquo;essais, métriques,&#xA;expérimentations qualitatives des systèmes.&lt;/li&gt;&#xA;&lt;li&gt;Langages de requêtes pour la recherche d&amp;rsquo;information, expansion de&#xA;requêtes.&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;Nous vous encourageons vivement à vous manifester en soumettant une&#xA;proposition de communication auprès des organisateurs des doctoriales&#xA;sous la forme dun courriel adressé à : &lt;a href=&#34;mailto:orga-doct-earia2012@emse.fr&#34;&gt;orga-doct-earia2012@emse.fr&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Informations pratiques</title>
      <link>http://www.asso-aria.org/earia/earia-2012/informations/</link>
      <pubDate>Mon, 15 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2012/informations/</guid>
      <description>&lt;p&gt;L&amp;rsquo;école d&amp;rsquo;Automne aura lieu du 24 octobre au 26 octobre 2012 au &lt;a href=&#34;http://www.couventdelatourette.fr/&#34; title=&#34;Couvent de la Tourette&#34;&gt;Couvent&#xA;de la&#xA;Tourette&lt;/a&gt; à&#xA;éveux, à une trentaine de minutes au Nord Ouest de Lyon.&lt;br&gt;&#xA;&lt;strong&gt;Accès par la route :&lt;/strong&gt; Autoroute A6, sortie Limonest, puis direction&#xA;Roanne jusqu&amp;rsquo;à L&amp;rsquo;Arbresle, puis direction Eveux.&lt;br&gt;&#xA;Coordonnées GPS : 45.821799 x 4.622729.&lt;br&gt;&#xA;&lt;strong&gt;Accès par le train :&lt;/strong&gt; la gare SNCF la plus proche est à L&amp;rsquo;Arbresle (2&#xA;km soit 30 minutes à pied ou taxi +33 (0)4 74 26 90 19). Nous&#xA;organiserons des navettes entre la gare de l&amp;rsquo;Arbresle et le couvent de&#xA;La Tourette le mercredi 24/10 à 10h00 et 10h45.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Inscription</title>
      <link>http://www.asso-aria.org/earia/earia-2012/inscriptions/</link>
      <pubDate>Mon, 15 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2012/inscriptions/</guid>
      <description>&lt;p&gt;Vous pouvez télécharger la fiche d&amp;rsquo;inscription&#xA;&lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2012/Inscription-EARIA-2012.pdf&#34;&gt;ici&lt;/a&gt;.&lt;/p&gt;&#xA;&lt;p&gt;Formulaire à imprimer, compléter et retourner avant le 15 octobre 2012,&#xA;par la poste, accompagné du règlement ou de la preuve du règlement&#xA;(virement, bon de commande, etc.) à :&lt;/p&gt;&#xA;&lt;p&gt;Adresse :&lt;/p&gt;&#xA;&lt;p&gt;ASSOCIATION ARIA&lt;br&gt;&#xA;Vincent Claveau&lt;br&gt;&#xA;IRISA&lt;br&gt;&#xA;Campus de Beaulieu&lt;br&gt;&#xA;35042 RENNES CEDEX&lt;/p&gt;&#xA;&lt;p&gt;Le tarif des inscriptions est fixé à :&lt;/p&gt;&#xA;&lt;pre&gt;&lt;code&gt;           AVANT le 21/09/2012   APRÈS le 21/09/2012&#xA;&lt;/code&gt;&lt;/pre&gt;&#xA;&lt;hr&gt;&#xA;&lt;p&gt;Doctorants   250 euros             300 euros&#xA;Autres       350 euros             400 euros&lt;/p&gt;</description>
    </item>
    <item>
      <title>Comités</title>
      <link>http://www.asso-aria.org/earia/earia-2014/comite/</link>
      <pubDate>Fri, 12 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2014/comite/</guid>
      <description>&lt;p&gt;Pour la mise en place de l&amp;rsquo;école EARIA, deux comités sont formés.&lt;/p&gt;&#xA;&lt;h3 id=&#34;le-comité-dorganisation&#34;&gt;Le comité d&amp;rsquo;organisation&lt;/h3&gt;&#xA;&lt;p&gt;Ce comité prend en charge les aspects pratiques de l&amp;rsquo;école d&amp;rsquo;automne,&#xA;liés à l&amp;rsquo;organisation de l&amp;rsquo;école, et la venue des intervenants. Ce&#xA;comité est composé d&amp;rsquo;une partie des membres de l&amp;rsquo;équipe Modèle &amp;amp;&#xA;Recherche d&amp;rsquo;Information Multimédia du laboratoire LIG, à savoir :&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;[Georges Quénot,&#xA;LIG-CNRS]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Catherine Berrut,&#xA;LIG-UJF]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Jean-Pierre Chevallet,&#xA;LIG-UPMF]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Nathalie Denos,&#xA;LIG-UPMF]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Marie-Christine Fauvet,&#xA;LIG-UJF]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Ahmed Lbath,&#xA;LIG-UJF]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Philippe Mulhem,&#xA;LIG-CNRS]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Nawal Ould-Amer,&#xA;LIG-UJF]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Mateusz Budnik,&#xA;LIG-UJF]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;li&gt;[Mohannad Almasri, LIG-UJF&lt;br&gt;&#xA;]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;le-comité-scientifique&#34;&gt;Le comité scientifique&lt;/h3&gt;&#xA;&lt;p&gt;Le comité scientifique a en charge la définition du programme de&#xA;l&amp;rsquo;école, le choix et l&amp;rsquo;interaction avec les intervenants choisis. Ce&#xA;comité est constitué de scientifiques reconnus dans le domaine de la&#xA;recherche d&amp;rsquo;information française.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Conférenciers</title>
      <link>http://www.asso-aria.org/earia/earia-2014/conferenciers/</link>
      <pubDate>Fri, 12 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2014/conferenciers/</guid>
      <description>&lt;p&gt;Les conférenciers qui participeront à EARIA 2014 sont les personnalités&#xA;reconnues dans le domaine de la recherche d&amp;rsquo;information au niveau&#xA;national et international. Voici leur liste par ordre alphabétique :&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;p&gt;&lt;img src=&#34;http://www.emse.fr/~mbeig/IMAG%20ES/beigbeder.m.jpeg&#34; alt=&#34;Phot                                                                  Michel Beigbeder {#miche&#xA;o&#34;&gt;{.img-rounded   l-beigbeder style=&amp;ldquo;margin: 0px 0p x&#xA;width=&amp;ldquo;100&amp;rdquo;}                                                            10px; padding: 3px 0px; font-si ze:&#xA;1.6em; color: #555555; font-f&#xA;amily: &amp;lsquo;Titillium Maps&amp;rsquo;, Arial;&amp;rdquo;}&#xA;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;-&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;p&gt;Michel Beigbeder est enseignant-chercheur en informatique à l&amp;rsquo;école&#xA;Nationale Supérieure des Mines de Saint-Etienne depuis 1987. Après des&#xA;travaux en analyse et synthèse d&amp;rsquo;images puis en parallélisme, il&#xA;s&amp;rsquo;intéresse depuis 1995 au domaine de la recherche d&amp;rsquo;information, en&#xA;particulier sur le Web. Ses travaux se placent dans le cadre de la RI&#xA;ad-hoc, et avec son équipe, il participe aux campagnes d&amp;rsquo;évaluation de&#xA;&lt;a href=&#34;http://trec.nist.gov/&#34;&gt;TREC&lt;/a&gt;, de &lt;a href=&#34;http://www.clef-campaign.org/&#34;&gt;CLEF&lt;/a&gt;,&#xA;et de &lt;a href=&#34;http://www.inex.otago.ac.nz/&#34;&gt;INEX&lt;/a&gt;.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Doctoriales</title>
      <link>http://www.asso-aria.org/earia/earia-2014/doctoriales/</link>
      <pubDate>Fri, 12 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2014/doctoriales/</guid>
      <description>&lt;p&gt;Présentation&lt;/p&gt;&#xA;&lt;p&gt;Nous proposons à tous les participants de faire une présentation en 5&#xA;minutes environ de leur travail. L&amp;rsquo;idée est que nous puissions échanger&#xA;sur les approches/problèmes/solutions liées aux travaux présentés, sous&#xA;une forme de brainstorming. Ces travaux ne doivent pas nécessairement&#xA;être finalisés, car c&amp;rsquo;est la discussion ouverte qui sera privilégiée.&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Thibaut Thonet (IRIT, Toulouse), &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2014/doctoriales/1-THONET.pdf&#34;&gt;&amp;ldquo;Recherche d&amp;rsquo;information&#xA;agrégative&amp;rdquo;&lt;/a&gt;&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Thomas Palmer (IRIT, Toulouse), &lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2014/doctoriales/2-PALMER.pdf&#34;&gt;&amp;ldquo;Recherche d&amp;rsquo;information en&#xA;contexte dans les flux de&#xA;données&amp;rdquo;&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Informations pratiques</title>
      <link>http://www.asso-aria.org/earia/earia-2014/informations/</link>
      <pubDate>Fri, 12 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2014/informations/</guid>
      <description>&lt;ul&gt;&#xA;&lt;li&gt;[Dates :]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;15-17 Octobre 2014&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;[Localisation&#xA;:]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;Notre Dame Parménie, Beaucroissant&lt;br&gt;&#xA;38610 Izeaux&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;[Cordonnées GPS&#xA;:]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: 1.3em;&amp;rdquo;}&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;45°19&#39;24.1&amp;quot; N 5°28&#39;02.5&amp;quot;E&lt;br&gt;&#xA;45.323359 5.467363&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Accès par le train : gare de Tullins. merci d&amp;rsquo;avance d&amp;rsquo;indiquer par&#xA;mail à&#xA;&lt;a href=&#34;mailto:Philippe.Mulhem@imag.fr?Subject=Arrivee%20Gare%20Beaucroissant&#34;&gt;Philippe.Mulhem@imag.fr&lt;/a&gt;&#xA;votre horaire d&amp;rsquo;arrivée pour qu&amp;rsquo;une navette vous emmène au site de&#xA;l&amp;rsquo;école.&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;Informations horaires :&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Valence TGV vers Tullins-Fures le 15/10&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;10h26--11h09&#34;&gt;8h26 ⇒ 9h09&#xA;9h26 ⇒ 10h09&#xA;10h26 ⇒ 11h09&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Tullins-Fures vers Valence TGV le 17/10&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;15h50--16h36&#34;&gt;13h49 ⇒ 14h35&#xA;14h50 ⇒ 15h34&#xA;15h50 ⇒ 16h36&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Valence ville vers Tullins-Fures le 15/10&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;10h15--11h09&#34;&gt;8h15 ⇒ 9h09&#xA;9h15 ⇒ 10h09&#xA;10h15 ⇒ 11h09&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Tullins-Fures vers Valence ville le 17/10&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;15h50--16h46&#34;&gt;13h49 ⇒ 14h44&#xA;14h50 ⇒ 15h44&#xA;15h50 ⇒ 16h46&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Grenoble vers Tullins-Fures le 15/10&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;12h12--12h34&#34;&gt;8h30 ⇒ 8h49&#xA;9h12 ⇒ 9h34&#xA;9h20 ⇒ 9h49&#xA;12h12 ⇒ 12h34&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Tullins-Fures vers Grenoble le 17/10&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;16h11--16h30&#34;&gt;13h24 ⇒ 13h47&#xA;14h11 ⇒ 14h30&#xA;14h24 ⇒ 14h47&#xA;15h11 ⇒ 15h30&#xA;16h11 ⇒ 16h30&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;Le site de Parménie étant un peu en altitude (800m), il risque de&#xA;faire un peu frais à l&amp;rsquo;extérieur à la mi-octobre : ne pas oublier&#xA;des vêtement adaptés.&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Le linge de toilette n&amp;rsquo;est pas fourni, vous devez donc venir avec&#xA;votre serviette de toilette.&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;</description>
    </item>
    <item>
      <title>Inscription</title>
      <link>http://www.asso-aria.org/earia/earia-2014/inscriptions/</link>
      <pubDate>Fri, 12 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2014/inscriptions/</guid>
      <description>&lt;p&gt;Les frais d&amp;rsquo;inscriptions couvrent :&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;L&amp;rsquo;hébergement (2 nuits : du mercredi 15 au jeudi 16 octobre 2014, et&#xA;du jeudi 16 au vendredi 17 octobre 2014).&lt;strong&gt;Attention : le linge de&#xA;toilette n&amp;rsquo;est pas fourni, vous devez donc venir avec votre&#xA;serviette de toilette.&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Les repas (petits déjeuners des 16 et 17 octobre 2014, déjeuners des&#xA;15/16/17 octobre 2014, dîners des 15 et 16 octobre 2014)&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Les pauses matin et après-midi&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Les sessions comprises dans le programme&lt;/p&gt;</description>
    </item>
    <item>
      <title> Bourses ARIA - Congrès SIF 2016</title>
      <link>http://www.asso-aria.org/blog/2020/96-bourses-aria-congres-sif-2016/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/96-bourses-aria-congres-sif-2016/</guid>
      <description>&lt;p&gt;Afin de favoriser la participation de jeunes chercheur(se)s et jeunes&#xA;docteur(e)s au Congrès SIF 2016, la SIF, via l&amp;rsquo;ARIA, propose aux&#xA;doctorants ou jeunes docteur (post-doc ou jeune MCF) du domaine&lt;/p&gt;</description>
    </item>
    <item>
      <title> CORIA 2015 - 18-20 mars 2015</title>
      <link>http://www.asso-aria.org/blog/2020/91-coria-2015-18-20-mars-2015/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/91-coria-2015-18-20-mars-2015/</guid>
      <description>&lt;p&gt;&lt;a href=&#34;http://coria2015.lip6.fr/&#34;&gt;CORIA&lt;/a&gt; 2015 est la douzième édition de la&#xA;&lt;strong&gt;CO&lt;/strong&gt;nférence en &lt;strong&gt;R&lt;/strong&gt;echerche d&amp;rsquo;&lt;strong&gt;I&lt;/strong&gt;nformation et &lt;strong&gt;A&lt;/strong&gt;pplications.&#xA;Elle aura lieu à Paris.&lt;/p&gt;</description>
    </item>
    <item>
      <title> Journée commune IA et RI, 1er décembre 2015</title>
      <link>http://www.asso-aria.org/blog/2020/97-journee-commune-ia-et-ri-1er-decembre-2015/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/97-journee-commune-ia-et-ri-1er-decembre-2015/</guid>
      <description>&lt;p&gt;&lt;strong&gt;Intelligence artificielle et Recherche d&amp;rsquo;Information&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;[]{.s2 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}[Journée commune AFIA -&#xA;ARIA]{style=&amp;ldquo;margin: 0px; padding: 0px; font-size: 12.16px; line-height: 1.3em;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[Association française pour l&amp;rsquo;intelligence&#xA;artificielle]{style=&amp;ldquo;margin: 0px; padding: 0px; font-size: 12.16px; line-height: 1.3em;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[Association pour la recherche d&amp;rsquo;information et ses applications]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[]{.s2 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[&lt;strong&gt;Paris&lt;/strong&gt;, &lt;strong&gt;1er décembre 2015 de 9h à 18h&lt;/strong&gt;]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[Délégation CNRS d&amp;rsquo;Ivry ]{.s2 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Appel à Ateliers - Assemblée générale constitutive du GdR MaDICS</title>
      <link>http://www.asso-aria.org/blog/2020/93-appel-a-ateliers-assemblee-generale-constitutive-du-gdr-madics/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/93-appel-a-ateliers-assemblee-generale-constitutive-du-gdr-madics/</guid>
      <description>&lt;p&gt;L&amp;rsquo;objectif du GdR &lt;a href=&#34;http://www.madics.fr/&#34;&gt;MaDICS&lt;/a&gt; &amp;ndash; &lt;em&gt;Masses de Données,&#xA;Informations et Connaissances en Sciences (Big Data, Data Science)&lt;/em&gt; &amp;mdash;&#xA;est de promouvoir et d&amp;rsquo;animer des activités de recherche&#xA;interdisciplinaires qui s&amp;rsquo;articulent autour des problèmes générés par&#xA;les masses de données en sciences et qui s&amp;rsquo;inscrivent dans un continuum&#xA;«des données aux connaissances et à la prise de décision».&lt;/p&gt;&#xA;&lt;p&gt;De telles activités pourront porter sur l&amp;rsquo;&lt;em&gt;acquisition&lt;/em&gt; et la &lt;em&gt;collecte&lt;/em&gt;&#xA;des masses de données, leur &lt;em&gt;organisation&lt;/em&gt;, leur&lt;em&gt;stockage&lt;/em&gt; et&#xA;&lt;em&gt;préservation&lt;/em&gt;, l&amp;rsquo;&lt;em&gt;extraction de connaissances&lt;/em&gt;, l&amp;rsquo;&lt;em&gt;accès&lt;/em&gt; efficace aux&#xA;données et la &lt;em&gt;recherche&lt;/em&gt; d&amp;rsquo;information, l&amp;rsquo;&lt;em&gt;analyse&lt;/em&gt; statistique, la&#xA;&lt;em&gt;fouille de données&lt;/em&gt;, l&amp;rsquo;&lt;em&gt;interprétation&lt;/em&gt; et la &lt;em&gt;visualisation&lt;/em&gt; des&#xA;masses de données pour la prise de décision et l&amp;rsquo;extraction de valeur.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Appel à candidature pour l&#39;organisation de l’édition conjointe de CORIA/TALN 2018</title>
      <link>http://www.asso-aria.org/blog/2020/98-appel-a-candidature-pour-l-organisation-de-l-edition-conjointe-de-coria-taln-2018/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/98-appel-a-candidature-pour-l-organisation-de-l-edition-conjointe-de-coria-taln-2018/</guid>
      <description>&lt;p&gt;La recherche d&amp;rsquo;informations (RI) et le traitement automatique des&#xA;langues (TAL) ont de nombreuses problématiques communes que les&#xA;associations ARIA et ATALA souhaitent faire converger à travers&#xA;l&amp;rsquo;organisation d&amp;rsquo;une édition conjointe des conférences CORIA et TALN en&#xA;2018.&lt;/p&gt;&#xA;&lt;p&gt;Pour faire acte de candidature à l&amp;rsquo;organisation de cette édition&#xA;conjointe de CORIA/TALN 2018, un modèle de dossier à compléter est&#xA;disponible à l&amp;rsquo;adresse suivante :&#xA;&lt;a href=&#34;http://www.atala.org/-Candidater-a-l-organisation-de,103&#34;&gt;[http://www.atala.org/-Candidater-a-l-organisation-de,103]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/a&gt;&#xA;-&amp;amp;nbsp&lt;/p&gt;&#xA;&lt;p&gt;Les dossiers de candidature devront être envoyés d&amp;rsquo;ici le &lt;strong&gt;31 mars&#xA;2016&lt;/strong&gt; aux deux adresses suivantes : &lt;a href=&#34;mailto:emmanuel.morin@univ-nantes.fr&#34;&gt;emmanuel.morin@univ-nantes.fr&lt;/a&gt; et&#xA;&lt;a href=&#34;mailto:%20Cet%20adresse%20mail%20est%20prot%C3%A9g%C3%A9%20contre%20les%20spambots.%20Vous%20avez%20d&#39;activer%20le%20javascript%20pour%20la%20visualiser.&#34;&gt;&lt;/a&gt;&lt;a href=&#34;mailto:Max.Chevalier@irit.fr&#34;&gt;Max.Chevalier@irit.fr&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Appel à démonstrations à CIFED-CORIA 2016, 9-11 mars Toulouse</title>
      <link>http://www.asso-aria.org/blog/2020/100-appel-a-demonstrations-a-cifed-coria-2016-9-11-mars-toulouse/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/100-appel-a-demonstrations-a-cifed-coria-2016-9-11-mars-toulouse/</guid>
      <description>&lt;p&gt;[Une session démonstrations est organisée dans le cadre de la conférence&#xA;CIFED-CORIA. Les propositions de démonstrations de logiciels ou&#xA;prototypes doivent être envoyées à&#xA;&lt;a href=&#34;mailto:sylvie.calabretto@insa-lyon.fr&#34;&gt;[sylvie.calabretto@insa-lyon.fr]{.s3}&lt;/a&gt;&#xA;et&#xA;&lt;a href=&#34;mailto:Bertrand.Couasnon@irisa.fr&#34;&gt;[Bertrand.Couasnon@irisa.fr]{.s3}&lt;/a&gt;&#xA;(2 pages maximum au format de la conférence :&#xA;&lt;a href=&#34;https://www.irit.fr/sdnri2016/&#34;&gt;[https://www.irit.fr/sdnri2016/]{.s3}&lt;/a&gt;).&#xA;Les démonstrations devront relever des thématiques de CIFED-CORIA.]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[Les personnes souhaitant présenter une démonstration devront être&#xA;inscrites à la conférence CIFED-CORIA.]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[]{.s1}&lt;/p&gt;&#xA;&lt;p&gt;[Dates importantes : ]{.s1}&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Soumission des propositions : jeudi 18 février 2016&lt;/li&gt;&#xA;&lt;li&gt;Notification : lundi 21 février 2016&lt;/li&gt;&#xA;&lt;li&gt;Session démonstrations : 9 mars 2016&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;[]{.s1}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Bourses ARIA étudiants - CLEF 2015</title>
      <link>http://www.asso-aria.org/blog/2020/94-bourses-aria-etudiants-clef-2015/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/94-bourses-aria-etudiants-clef-2015/</guid>
      <description>&lt;p&gt;8 au 11 septembre 2015 &amp;ndash; Toulouse - France&lt;/p&gt;&#xA;&lt;p&gt;&lt;a href=&#34;http://clef2015.clef-initiative.eu/&#34;&gt;http://clef2015.clef-initiative.eu&lt;/a&gt;&lt;/p&gt;&#xA;&lt;p&gt;Pour promouvoir les thématiques de Recherche d&amp;rsquo;Information, l&amp;rsquo;ARIA&#xA;propose aux doctorants du domaine, &lt;strong&gt;trois bourses&lt;/strong&gt; pour pouvoir&#xA;assister à la conférence CLEF 2015 qui se déroulera à Toulouse en&#xA;septembre 2015&#xA;(&lt;a href=&#34;http://clef2015.clef-initiative.eu/&#34;&gt;http://clef2015.clef-initiative.eu&lt;/a&gt;).&lt;/p&gt;&#xA;&lt;p&gt;::: {style=&amp;ldquo;margin: 0px; padding: 1pt 4pt; border: 1pt solid windowtext;&amp;rdquo;}&#xA;&lt;p class=&#34;MsoNormal&#34; style=&#34;margin: 8px 0px; padding: 0cm; line-height: 1.7em; text-align: justify; border: none;&#34;&gt;&lt;strong style=&#34;margin: 0px; padding: 0px;&#34;&gt;* Conditions d&amp;rsquo;admission :&lt;/strong&gt;&#xA;&lt;/p&gt;&#xA;:::&lt;/p&gt;&#xA;&lt;p&gt;Etre doctorant inscrit en thèse dans un laboratoire&#xA;français/francophone.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Bourses ARIA étudiants - ESSIR 2015</title>
      <link>http://www.asso-aria.org/blog/2020/95-bourses-aria-etudiants-essir-2015/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/95-bourses-aria-etudiants-essir-2015/</guid>
      <description>&lt;p&gt;[31 août - 5 septembre 2015 &amp;ndash; Thessalonique - Grèce]{.s1&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[&lt;a href=&#34;http://mklab.iti.gr/essir2015/&#34;&gt;http://mklab.iti.gr/essir2015/&lt;/a&gt;]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[]{.s1 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[Pour promouvoir les thématiques de Recherche d&amp;rsquo;Information, l&amp;rsquo;ARIA&#xA;propose aux doctorants du domaine, &lt;strong&gt;deux bourses&lt;/strong&gt; pour pouvoir&#xA;assister à l&amp;rsquo;école d&amp;rsquo;été ESSIR 2015 qui se déroulera à Thessalonique,&#xA;Grèce, du 31 août au 5 septembre 2015&#xA;(&lt;a href=&#34;http://mklab.iti.gr/essir2015/&#34;&gt;[http://mklab.iti.gr/essir2015/]{.s3&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/a&gt;&#xA;).]{.s1 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>CORIA 2013 - 3/5 avril 2013</title>
      <link>http://www.asso-aria.org/blog/2020/89-coria-2013-3-5-avril-2013/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/89-coria-2013-3-5-avril-2013/</guid>
      <description>&lt;h2 id=&#34;section&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt;&lt;a href=&#34;../SiteV1/calendrier-annonces/89-coria-2013-35-avril-2013&#34;&gt;  &lt;/a&gt;&lt;/h2&gt;&#xA;&lt;p&gt;&lt;a href=&#34;http://coria.unine.ch/&#34;&gt;CORIA 2013&lt;/a&gt; est la dixième édition de&#xA;la &lt;strong&gt;CO&lt;/strong&gt;nférence en &lt;strong&gt;R&lt;/strong&gt;echerche d&amp;rsquo;&lt;strong&gt;I&lt;/strong&gt;nformation&#xA;et &lt;strong&gt;A&lt;/strong&gt;pplications. Elle aura lieu à Neuchâtel (Suisse).&lt;/p&gt;&#xA;&lt;p&gt;Le programme prévoit deux conférences invitées, l&amp;rsquo;une de Jamie Callan&#xA;(CMU), la seconde de Donna Harman (NIST).&lt;/p&gt;</description>
    </item>
    <item>
      <title>CORIA-CIFED 2014 - 19/21 mars 2014</title>
      <link>http://www.asso-aria.org/blog/2020/90-coria-cifed-2014-19-21-mars-2014/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/90-coria-cifed-2014-19-21-mars-2014/</guid>
      <description>&lt;h2 id=&#34;section&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt; &lt;/h2&gt;&#xA;&lt;p&gt;[[Après le succès des éditions communes en 2010 à Sousse et en 2012 à&#xA;Bordeaux de leurs conférences respectives l&amp;rsquo;ARIA (Association&#xA;francophone de Recherche d&amp;rsquo;Information et Applications) et le GRCE&#xA;(Groupement de Recherche en Communication Ecrite) ont décidé d&amp;rsquo;organiser&#xA;simultanément les conférences &lt;a href=&#34;http://sdnri2014.loria.fr/&#34;&gt;CORIA et CIFED en mars 2014 à&#xA;Nancy&lt;/a&gt;.]{style=&amp;ldquo;margin: 0px; padding: 0px; line-height: normal;&amp;rdquo;}]{style=&amp;ldquo;margin: 0px; padding: 0px; color: #363636; font-family: Arial, Helvetica, sans-serif;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>EARIA 2012 - 24/26 octobre 2012</title>
      <link>http://www.asso-aria.org/blog/2020/118-earia-2012-24-26-octobre-2012/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/118-earia-2012-24-26-octobre-2012/</guid>
      <description>&lt;p&gt;EARIA (école d&amp;rsquo;Automne en Recherche d&amp;rsquo;Information et Application) a pour&#xA;objectif principal la formation des doctorants dans le domaine de la&#xA;Recherche d&amp;rsquo;Information (RI).&lt;/p&gt;&#xA;&lt;p&gt;La dernière édition de l&amp;rsquo;école d&amp;rsquo;Automne a eu lieu du 24 au 26 octobre&#xA;2012 à une trentaine de minutes de Lyon. La prochaine se tiendra près de&#xA;Grenoble en octobre 2014&lt;/p&gt;</description>
    </item>
    <item>
      <title>EARIA 2014</title>
      <link>http://www.asso-aria.org/blog/2020/92-earia-2014/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/92-earia-2014/</guid>
      <description>&lt;p&gt;&lt;a href=&#34;http://www.asso-aria.org/earia/&#34;&gt;EARIA&lt;/a&gt; (École d&amp;rsquo;Automne en Recherche&#xA;d&amp;rsquo;Information et Application) a pour objectif principal la formation des&#xA;doctorants dans le domaine de la Recherche d&amp;rsquo;Information&#xA;(RI).&lt;/p&gt;&#xA;&lt;!-- more --&gt;&#xA;&lt;p&gt;La prochaine se tiendra près de Grenoble en octobre 2014.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Liens importants</title>
      <link>http://www.asso-aria.org/ressources/120-liens-importants/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/ressources/120-liens-importants/</guid>
      <description>&lt;h4 id=&#34;conférences-internationales-à-venir&#34;&gt;Conférences internationales à venir&lt;/h4&gt;&#xA;&lt;p&gt;&lt;a href=&#34;http://www.wikicfp.com/cfp/call?conference=information%20retrieval&amp;amp;page=1&#34;&gt;Liste des conférences à venir triées par date limite de&#xA;soumission.&lt;/a&gt;&lt;/p&gt;&#xA;&lt;h4 id=&#34;journaux-du-domaine-international&#34;&gt;Journaux du domaine (international)&lt;/h4&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.nowpublishers.com/INR&#34;&gt;Foundation and Trends in Information&#xA;Retrieval&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.elsevier.com/wps/find/journaldescription.cws_home/244/description#description&#34;&gt;IP&amp;amp;M&lt;/a&gt;,Information&#xA;Processing &amp;amp; Management&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://link.springer.com/journal/799&#34;&gt;IJODL&lt;/a&gt;, International Journal&#xA;on Digital Libraries&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://link.springer.com/journal/10791&#34;&gt;IRJ&lt;/a&gt;, Information Retrieval&#xA;Journal&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.emeraldinsight.com/journal/jd&#34;&gt;JDOC&lt;/a&gt;, Journal of&#xA;Documentation&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.asis.org/jasist.html&#34;&gt;JASIST&lt;/a&gt;, Journal of the American&#xA;Society for Information Science and Technology&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.cs.uvm.edu/~kais/&#34;&gt;KAIS&lt;/a&gt;, Knowledge and Information&#xA;Systems&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.elsevier.com/wps/find/journaldescription.cws_home/525448/description#description&#34;&gt;KBS&lt;/a&gt;,&#xA;Knowledge-Based Systems&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://link.springer.com/journal/778&#34;&gt;VLDB&lt;/a&gt;, International Journal&#xA;on Very Large Data Bases&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://tois.acm.org/&#34;&gt;TOIS&lt;/a&gt;, Transactions on Information Systems&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://toit.acm.org/&#34;&gt;TOIT&lt;/a&gt;, Transactions on Internet Technology&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h4 id=&#34;ouvrages&#34;&gt;Ouvrages&lt;/h4&gt;&#xA;&lt;h5 id=&#34;ouvrages-généraux&#34;&gt;Ouvrages généraux&lt;/h5&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.dcs.gla.ac.uk/Keith/Preface.html&#34;&gt;Van Rijsbergen (1977) Information Retrieval, on-line version!&#xA;Butterworths&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://nlp.stanford.edu/IR-book/&#34;&gt;Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze&#xA;(2008), Introduction to Information Retrieval, Cambridge University&#xA;Press.&lt;/a&gt; (version en ligne)&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.mir2ed.org/&#34;&gt;Baeza-Yates and Ribeiro-Neto (2011) Modern Information Retrieval,&#xA;Addison-Wesley&lt;/a&gt; (avec transparents supports&#xA;de cours)&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.eyrolles.com/Informatique/Livre/recherche-d-information-9782212135329&#34;&gt;Massih-Reza Amini, Eric Gaussier (2013) Recherche d&amp;rsquo;information -&#xA;Applications, modèles et algorithmes. Fouille de données,&#xA;décisionnel et big data,&#xA;Eyrolles&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;</description>
    </item>
    <item>
      <title>Programme </title>
      <link>http://www.asso-aria.org/earia/earia-2012/programme/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2012/programme/</guid>
      <description>&lt;h2 id=&#34;mercredi-24-octobre&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt;Mercredi 24 octobre&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;10h30 : accueil&lt;/li&gt;&#xA;&lt;li&gt;11h00-12h15 : Session 1. Introduction au domaine (Mohand Boughanem,&#xA;IRIT, Université Paul Sabatier de Toulouse)&lt;/li&gt;&#xA;&lt;li&gt;Déjeuner&lt;/li&gt;&#xA;&lt;li&gt;14h00-15h30 : Session 2. Modèles de RI (éric Gaussier, LIG,&#xA;Université de Grenoble)&lt;/li&gt;&#xA;&lt;li&gt;Pause&lt;/li&gt;&#xA;&lt;li&gt;16h00-17h30 : Session 3. Logiciels pour la RI (Michel Beigbeder,&#xA;école des Mines de Saint-étienne)&lt;/li&gt;&#xA;&lt;li&gt;18h00-19h00 : Doctoriales 1.&lt;/li&gt;&#xA;&lt;li&gt;Dîner&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;jeudi-25-octobre&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt;Jeudi 25 octobre&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;8h45-10h15 : Session 4. Evaluation et collection-tests en recherche&#xA;d&amp;rsquo;information et catégorisation de textes (Jacques Savoy, Université&#xA;de Neuchâtel)&lt;/li&gt;&#xA;&lt;li&gt;10h45-12h15 : Session 5. RI et Apprentissage Automatique&#xA;(Massih-Reza Amini, LIG, Université Joseph Fourier, Grenoble)&lt;/li&gt;&#xA;&lt;li&gt;Déjeuner&lt;/li&gt;&#xA;&lt;li&gt;14h00-15h30 : Session 6. Approches génériques du Traitement&#xA;Automatique des Langues pour la Recherche d&amp;rsquo;Information (Patrice&#xA;Bellot, LSIS, Université d&amp;rsquo;Aix-Marseille)&lt;/li&gt;&#xA;&lt;li&gt;16h00-17h30 : Session 7. Détection de sentiments (Vincent Guigue,&#xA;LIP6, Université Pierre &amp;amp; Marie Curie, Paris)&lt;/li&gt;&#xA;&lt;li&gt;18h00-19h00 : Doctoriales 2.&lt;/li&gt;&#xA;&lt;li&gt;Dîner&lt;/li&gt;&#xA;&lt;li&gt;20h30-22h00 : Table ronde&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;vendredi-26-octobre&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt;Vendredi 26 octobre&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;8h45-10h15 : Session 8. RI contextuelle, mobile (Lynda&#xA;Tamine-Lechani, IRIT, Université Paul Sabatier de Toulouse)&lt;/li&gt;&#xA;&lt;li&gt;10h45-12h15 : Session 9. RI sociale (Maarten de Rijke, ILPS - ISLA,&#xA;University of Amsterdam)&lt;/li&gt;&#xA;&lt;li&gt;Déjeuner&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h1 id=&#34;résumés-des-cours-et-accès-aux-présentations&#34; style=&#34;margin: 0px -5px 10px; padding: 5px; font-size: 1.4em; line-height: 1.19em; color: #0d4c89; border-bottom-style: solid; border-bottom-width: 1px; border-bottom-color: #dddddd; font-family: &#39;Titillium Maps&#39;, Arial;&#34;&gt;Résumés des cours et accès aux présentations&lt;/h1&gt;&#xA;&lt;h4&gt;&lt;/h4&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Introduction au domaine (Mohand Boughanem, IRIT, Université P.&#xA;Sabatier)&lt;/p&gt;</description>
    </item>
    <item>
      <title>Programme </title>
      <link>http://www.asso-aria.org/earia/earia-2014/programme/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/earia/earia-2014/programme/</guid>
      <description>&lt;h3 style=&#34;margin: 0px; padding: 0px; line-height: 1.3em;&#34; id=&#34;mercredi-15-octobre-après-midi&#34;&gt;[Mercredi 15 octobre après-midi]&lt;/h3&gt;&#xA;&lt;h4 id=&#34;14h15---16h15&#34;&gt;14h15 - 16h15&lt;/h4&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2014/slides/1-BOUGHANEM.pdf&#34;&gt;Introduction - Les bases communes partie 1&#xA;(PDF)&lt;/a&gt;&#xA;par Mohand Boughanem (IRIT)&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Les aspects fondamentaux de la RI\&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Panorama de la RI - applications, scénarios, industries&lt;br&gt;&#xA;\&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h4 id=&#34;16h45---18h45&#34;&gt;16h45 - 18h45&lt;/h4&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;Introduction - Les bases communes partie 2 par Eric Gaussier&#xA;(LIG)&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;&lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2014/slides/2-GAUSSIER-part1.pdf&#34;&gt;Apprentissage &amp;amp;&#xA;RI&lt;/a&gt;&#xA;(PDF)\&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2014/slides/3-GAUSSIER-part2.pdf&#34;&gt;Indexation&#xA;automatique&lt;/a&gt;&#xA;(PDF)&lt;br&gt;&#xA;\&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h4 id=&#34;20h15---22h&#34;&gt;20h15 - 22h&lt;/h4&gt;&#xA;&lt;p&gt;&lt;a href=&#34;../doctoriales&#34;&gt;Doctoriales&lt;/a&gt;&#xA;et échanges informels.&lt;/p&gt;&#xA;&lt;h3 style=&#34;margin: 0px; padding: 0px; line-height: 1.3em;&#34; id=&#34;jeudi-16-octobre-matin&#34;&gt;[Jeudi 16 octobre matin]&lt;/h3&gt;&#xA;&lt;h4 id=&#34;8h---10h&#34;&gt;8h - 10h&lt;/h4&gt;&#xA;&lt;ol start=&#34;2&#34;&gt;&#xA;&lt;li&gt;&lt;a href=&#34;http://www.asso-aria.org/images/FichiersEARIA/earia2014/slides/4-TELLIER.pdf&#34;&gt;TAL et Extraction d&amp;rsquo;information&#xA;(PDF)&lt;/a&gt;,&#xA;par Isabelle Tellier (LaTTiCe)&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;introduction :&lt;/p&gt;</description>
    </item>
    <item>
      <title>Séminaire des Doctorant(e)s en Informatique de la SIF</title>
      <link>http://www.asso-aria.org/blog/2020/99-seminaire-des-doctorant-e-s-en-informatique-de-la-sif/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/99-seminaire-des-doctorant-e-s-en-informatique-de-la-sif/</guid>
      <description>&lt;p&gt;[Premier appel à contributions ]{.s1 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;h1 id=&#34;section&#34; class=&#34;p4&#34; style=&#34;margin: 0px -5px 10px; padding: 5px; font-size: 1.4em; line-height: 1.19em; font-weight: normal; color: #0d4c89; border-bottom-style: solid; border-bottom-width: 1px; border-bottom-color: #dddddd; font-family: &#39;Titillium Maps&#39;, Arial; text-align: center;&#34;&gt;[&lt;img src=&#34;http://www.asso-aria.org/images/FichiersNews/SID_SIF.png&#34; alt=&#34;&#34;&gt;{width=&amp;ldquo;300&amp;rdquo;}]{.s1 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/h1&gt;&#xA;&lt;p&gt;[&lt;strong&gt;SDI 2016&lt;/strong&gt; ]{.s1 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[]{.s1 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[&lt;strong&gt;S&lt;/strong&gt;]{.s2 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}[&lt;strong&gt;éminaire des&lt;/strong&gt; ]{.s1&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}[&lt;strong&gt;D&lt;/strong&gt;]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}[&lt;strong&gt;octorant(e)s en&lt;/strong&gt; ]{.s1&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}[&lt;strong&gt;I&lt;/strong&gt;]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}[&lt;strong&gt;nformatique de la SIF&lt;/strong&gt; ]{.s1&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Thèses et habilitations à diriger des recherches</title>
      <link>http://www.asso-aria.org/ressources/119-theses/</link>
      <pubDate>Thu, 11 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/ressources/119-theses/</guid>
      <description>&lt;p&gt;Pour ajouter une thèse ou une habilitation à diriger des recherches à&#xA;cette liste, merci de remplir le&#xA;&lt;a href=&#34;index.php?option=com_breezingforms&amp;amp;view=form&amp;amp;Itemid=529&#34;&gt;formulaire&lt;/a&gt;.&lt;/p&gt;&#xA;&lt;h3 id=&#34;2016&#34;&gt;2016&lt;/h3&gt;&#xA;&lt;p&gt;&lt;br&gt;&#xA;Liana Ermakova. Short Text Contextualization in Information Retrieval:&#xA;Application to Tweet Contextualization and Automatic Query Expansion.&#xA;Thèse de doctorat, Université de Toulouse-le-Mirail, mars 2016.&lt;br&gt;&#xA;URL : &lt;a href=&#34;ftp://ftp.irit.fr/IRIT/SIG/my_thesis.pdf&#34;&gt;ftp://ftp.irit.fr/IRIT/SIG/my_thesis.pdf&lt;/a&gt;&lt;/p&gt;&#xA;&lt;h3 id=&#34;2015&#34;&gt;2015&lt;/h3&gt;&#xA;&lt;p&gt;Rafik Abbes. Filtrage et agrégation d&amp;rsquo;informations vitales relatives à&#xA;des entités. Thèse de doctorat, Université Paul Sabatier, décembre&#xA;2015.&lt;br&gt;&#xA;URL : &lt;a href=&#34;https://www.irit.fr/publis/SIG/2015_theseAbbes.pdf&#34;&gt;https://www.irit.fr/publis/SIG/2015_theseAbbes.pdf&lt;/a&gt;&lt;/p&gt;&#xA;&lt;p&gt;Adrian Chifu. Adaptation des systèmes de recherche d&amp;rsquo;information aux&#xA;contextes : le cas des requêtes difficiles. Thèse de doctorat,&#xA;Université Paul Sabatier, juin 2015.&lt;br&gt;&#xA;URL : &lt;a href=&#34;https://www.irit.fr/publis/SIG/2015_These_CAG.pdf&#34;&gt;https://www.irit.fr/publis/SIG/2015_These_CAG.pdf&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>Bureau de l&#39;ARIA / Chargés de communication</title>
      <link>http://www.asso-aria.org/aria/bureau/</link>
      <pubDate>Wed, 10 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/aria/bureau/</guid>
      <description>&lt;h1 id=&#34;bureau-actuel-2023-à-2027&#34;&gt;Bureau actuel (2023 à 2027)&lt;/h1&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Président : Sébastien Fournier (LIS, Marseille)&lt;/li&gt;&#xA;&lt;li&gt;Vice-président : Lorraine Goeuriot (LIG, Grenoble)&lt;/li&gt;&#xA;&lt;li&gt;Trésorier : Christophe Servan (Qwant/LISN, Orsay)&lt;/li&gt;&#xA;&lt;li&gt;Trésorier adjoint : José Moreno (IRIT, Marseile)&lt;/li&gt;&#xA;&lt;li&gt;Secrétaire : Benjamin Piwowarki (ISIR/CNRS, Paris)&lt;/li&gt;&#xA;&lt;li&gt;Chargée de communication / Webmaster : Adrian Chifu (LIS, Marseille)&lt;/li&gt;&#xA;&lt;li&gt;Animation : Laure Soulier (ISIR, Paris)&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h1 id=&#34;précédents-bureaux&#34;&gt;Précédents bureaux&lt;/h1&gt;&#xA;&lt;h2 id=&#34;2019-à-2023&#34;&gt;2019 à 2023&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Président : Benjamin Piwowarki (CNRS/LIP6, Paris)&lt;/li&gt;&#xA;&lt;li&gt;Vice-président : Patrice Bellot ( LIS, Marseille)&lt;/li&gt;&#xA;&lt;li&gt;Trésorier : Sébastien Fournier (LIS, Marseille)&lt;/li&gt;&#xA;&lt;li&gt;Trésorier adjoint : Christophe Servan (Qwant)&lt;/li&gt;&#xA;&lt;li&gt;Secrétaire : Karen Pinel-Sauvagnat (IRIT, Toulouse)&lt;/li&gt;&#xA;&lt;li&gt;Chargée de communication / Webmaster : Georges Quénot (LIG, Grenoble)&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2015-à-2019&#34;&gt;2015 à 2019&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Président : Max CHEVALIER&lt;/li&gt;&#xA;&lt;li&gt;Vice-présidente : Patrice BELLOT&lt;/li&gt;&#xA;&lt;li&gt;Trésorier : Vincent CLAVEAU&lt;/li&gt;&#xA;&lt;li&gt;Trésorier adjoint : Jean-Pierre CHEVALLET&lt;/li&gt;&#xA;&lt;li&gt;Secrétaire : Léa LAPORTE&lt;/li&gt;&#xA;&lt;li&gt;Chargé de communication : Karen PINEL-SAUVAGNAT&lt;/li&gt;&#xA;&lt;li&gt;Chargé des relations internationales : Éric GAUSSIER&lt;/li&gt;&#xA;&lt;li&gt;Chargée des relations avec les sociétés savantes : Florence SEDES&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2011-2015&#34;&gt;2011-2015&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Présidente : Sylvie CALABRETTO&lt;/li&gt;&#xA;&lt;li&gt;Vice-président : Max CHEVALIER&lt;/li&gt;&#xA;&lt;li&gt;Trésorier : Vincent CLAVEAU -   Trésorier adjoint : Jean Pierre CHEVALLET&lt;/li&gt;&#xA;&lt;li&gt;Secrétaire : Lynda TAMINE-LECHANI&lt;/li&gt;&#xA;&lt;li&gt;Chargé de la communication : Patrice BELLOT&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2004-2007&#34;&gt;2004-2007&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Président : Mohand BOUGHANEM&lt;/li&gt;&#xA;&lt;li&gt;Vice-présidente : Catherine BERRUT&lt;/li&gt;&#xA;&lt;li&gt;Secrétaire : Sylvie CALABRETTO&lt;/li&gt;&#xA;&lt;li&gt;Trésorier : Michel BEIGBEDER&lt;/li&gt;&#xA;&lt;li&gt;Chargé de communication : Max CHEVALIER&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2007-2011&#34;&gt;2007-2011&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Présidente : Catherine BERRUT&lt;/li&gt;&#xA;&lt;li&gt;Vice-présidente : Sylvie CALABRETTO&lt;/li&gt;&#xA;&lt;li&gt;Secrétaire : Lynda TAMINE-LECHANI&lt;/li&gt;&#xA;&lt;li&gt;Trésorier : Max CHEVALIER&lt;/li&gt;&#xA;&lt;li&gt;Trésorier adjoint : Michel BEIGBEDER&lt;/li&gt;&#xA;&lt;li&gt;Chargé de la communication : Philippe MULHEM&lt;/li&gt;&#xA;&lt;/ul&gt;</description>
    </item>
    <item>
      <title>CORIA-CIFED 2012 - 21/23 mars 2012</title>
      <link>http://www.asso-aria.org/blog/2020/76-coria-cifed-2012-21-23-mars-2012/</link>
      <pubDate>Wed, 10 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/76-coria-cifed-2012-21-23-mars-2012/</guid>
      <description>&lt;p&gt;Semaine du document numérique et de la recherche d&amp;rsquo;information 2012 &amp;ndash;&amp;gt;&lt;/p&gt;&#xA;&lt;!-- more --&gt;&#xA;&lt;h3 id=&#34;semaine-du-document-numérique-et-de-la-recherche-dinformation-2012&#34; style=&#34;margin: 20px 0px 10px; padding: 0px; font-size: 1.1em; color: #555555; font-family: arial, helvetica, sans-serif; line-height: normal;&#34;&gt;&lt;a href=&#34;http://cifed-coria2012.labri.fr/&#34;&gt;Semaine du document numérique et de la recherche d&amp;rsquo;information 2012&lt;/a&gt;&lt;/h3&gt;&#xA;&lt;p&gt;Après une première édition commune en 2010 à Sousse, l&amp;rsquo;ARIA (Association&#xA;francophone de Recherche d&amp;rsquo;Information et Applications) et le GRCE&#xA;(Groupement de Recherche en Communication écrite) ont décidé d&amp;rsquo;organiser&#xA;de nouveau simultanément les conférences&#xA;[CORIA]{style=&amp;ldquo;color: #095197;&amp;rdquo;} et CIFED du 21 au 23 mars 2012, à&#xA;Bordeaux.&lt;/p&gt;</description>
    </item>
    <item>
      <title>EARIA 2012 - 24/26 octobre 2012</title>
      <link>http://www.asso-aria.org/blog/2020/77-earia-2012-24-26-octobre-2012/</link>
      <pubDate>Wed, 10 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/blog/2020/77-earia-2012-24-26-octobre-2012/</guid>
      <description>&lt;p&gt;[&lt;a href=&#34;http://www.asso-aria.org/earia2012&#34;&gt;EARIA&lt;/a&gt; (École d&amp;rsquo;Automne en&#xA;Recherche d&amp;rsquo;Information et Application) a pour objectif principal la&#xA;formation des doctorants dans le domaine de la Recherche d&amp;rsquo;Information&#xA;(RI).]{style=&amp;ldquo;margin: 0px; padding: 0px; font-size: 13px; line-height: 21px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[La dernière édition de l&amp;rsquo;École d&amp;rsquo;Automne a eu lieu du 24 au 26 octobre&#xA;2012]{style=&amp;ldquo;margin: 0px; padding: 0px; font-size: 13px; line-height: 21px;&amp;rdquo;}[ à&#xA;une trentaine de minutes de Lyon. La prochaine se tiendra près de&#xA;Grenoble en octobre&#xA;2014.]{style=&amp;ldquo;margin: 0px; padding: 0px; font-size: 13px; line-height: 21px;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Journée thématique AFIA-ARIA, Ivry-syr-Seine, 1er décembre 2015</title>
      <link>http://www.asso-aria.org/journees-thematiques/87-journee-thematique-ia-ri-1er-decembre-2015/</link>
      <pubDate>Wed, 10 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/journees-thematiques/87-journee-thematique-ia-ri-1er-decembre-2015/</guid>
      <description>&lt;p&gt;{#section style=&amp;ldquo;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &amp;lsquo;Titillium Maps&amp;rsquo;, Arial;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;&lt;strong&gt;Intelligence artificielle et Recherche d&amp;rsquo;Information&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;Journée commune AFIA - ARIA&lt;/p&gt;&#xA;&lt;p&gt;Association française pour l&amp;rsquo;intelligence artificielle&lt;/p&gt;&#xA;&lt;p&gt;[Association pour la recherche d&amp;rsquo;information et ses applications]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[&lt;strong&gt;Paris&lt;/strong&gt;, &lt;strong&gt;1er décembre 2015 de 9h à 18h&lt;/strong&gt;]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[Délégation CNRS d&amp;rsquo;Ivry]{.s2 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[27, rue Paul Bert - 94204 Ivry-sur-Seine]{.s2&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title>Journée thématique GRCE-ARIA, Lyon, 2 avril 2015</title>
      <link>http://www.asso-aria.org/journees-thematiques/86-journee-thematique-grce-aria-2-avril-2015/</link>
      <pubDate>Wed, 10 Feb 2016 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/journees-thematiques/86-journee-thematique-grce-aria-2-avril-2015/</guid>
      <description>&lt;h2 id=&#34;section&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt; &lt;/h2&gt;&#xA;&lt;h2 id=&#34;programme-de-la-journée&#34; style=&#34;margin: 0px 0px 10px; padding: 3px 0px; font-size: 1.6em; color: #555555; font-family: &#39;Titillium Maps&#39;, Arial; line-height: normal;&#34;&gt;Programme de la journée&lt;/h2&gt;&#xA;&lt;p&gt;[ ]{.s1 style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[&amp;mdash;&amp;mdash; Similarités et métriques visuelles &amp;mdash;&amp;mdash;&amp;mdash;&amp;mdash;&amp;ndash;]{.s1&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[9h30- Matthieu Cord (Lips6 Paris)]{.s1&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;&#xA;&lt;p&gt;[Does Scarlett smile more than her French lover ? Constraints and&#xA;regularization in visual metric learning]{.s1&#xA;style=&amp;ldquo;margin: 0px; padding: 0px;&amp;rdquo;}&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>http://www.asso-aria.org/authors/stephane-clinchant/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/authors/stephane-clinchant/</guid>
      <description></description>
    </item>
    <item>
      <title></title>
      <link>http://www.asso-aria.org/coria/publications-coria/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/publications-coria/</guid>
      <description>&lt;p&gt;Publications CORIA&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ajouter une offre</title>
      <link>http://www.asso-aria.org/offres/instructions/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/offres/instructions/</guid>
      <description>&lt;p&gt;Envoyer un courriel à &lt;a href=&#34;mailto:webmaster@asso-aria.org&#34;&gt;webmaster@asso-aria.org&lt;/a&gt; en suivant le format suivant :&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-md&#34; data-lang=&#34;md&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;---&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;title: TITRE&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;contacts:&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;-&lt;/span&gt; NOM 1 &amp;lt;email 1&amp;gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;-&lt;/span&gt; NOM 2 &amp;lt;email 2&amp;gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;when: dates&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;where: lieu&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;what: type de contrat (stage master, thèse, emploi)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;salary: salaire&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;tags: &#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;-&lt;/span&gt; mots-clé&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;date: date de publication (ex. 2020-05-01 pour le 1er mai 2020)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;expiryDate: date de fin de publication (ex. 2020-05-01 pour le 1er mai 2020)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;---&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;Résumé (format markdown)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&amp;lt;!-- more --&amp;gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;Détails (format markdown)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;</description>
    </item>
    <item>
      <title>COCoFil: une plateforme de filtrage collaboratif orientée vers la communauté.</title>
      <link>http://www.asso-aria.org/coria/2004/papers/coria.2004.9/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2004/papers/coria.2004.9/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Face à la quantité et la rapidité d&amp;rsquo;apparition de nouvelles informations au quotidien, l&amp;rsquo;utilisateur peut s&amp;rsquo;en remettre non seulement à des systèmes de filtrage d&amp;rsquo;information par le contenu mais aussi à des systèmes de filtrage collaboratif. Ainsi, il peut recevoir des recommandations grâce aux évaluations de la communauté des personnes partageant les mêmes centres d&amp;rsquo;intérêt. Cependant, l&amp;rsquo;utilisateur ne perçoit pas toujours favorablement le rapport coût-bénéfice que ce type de système apporte. Alors que la plupart des travaux dans la littérature focalisent sur les fonctions internes du système, nous présentons dans cet article une plateforme de filtrage collaboratif tournée vers l&amp;rsquo;innovation en matière de fonctionnalités interactives visant à améliorer ce rapport coût-bénéfice. Cela est fait notamment au travers de fonctionnalités orientées vers la notion de communauté. La possibilité de paramétrer personnellement et finement le système (confidentialité, choix des fonctionnalités intéressantes) est également assurée, car elle devient indispensable dans ce nouveau cadre.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Healthcare information retrieval: A survey of user needs, tasks and requirements.</title>
      <link>http://www.asso-aria.org/coria/2017/papers/coria.2017.40/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2017/papers/coria.2017.40/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Les connaissances médicales se développent si rapidement qu&amp;rsquo;il est difficile pour les professionnels de la santé de se tenir au courant. À mesure que le volume des études publiées augmente chaque année, l&amp;rsquo;écart entre les connaissances en recherche et les pratiques professionnelles augmente de plus en plus. Les professionnels de l&amp;rsquo;information en soins de santé jouent un rôle essentiel dans la réduction de cet écart en synthétisant les résultats de la recherche biomédicale sous la forme de revues systématiques de la littérature. Ce faisant, ils abordent systématiquement certains des problèmes les plus difficiles d&amp;rsquo;extraction de l&amp;rsquo;information (IR) de n&amp;rsquo;importe quelle profession, mais les outils les outils sur lesquels ils s&amp;rsquo;appuient sont insufficiants à bien des égards. Cet article présente les résultats d&amp;rsquo;une enquête sur les pratiques et les besoins en matière de recherche d&amp;rsquo;informations concernant les systèmes et applications IR.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Indexation manuelle et automatique: une évaluation comparative basée sur un corpus en langue française.</title>
      <link>http://www.asso-aria.org/coria/2005/papers/coria.2005.11/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2005/papers/coria.2005.11/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;Cette communication évalue et compare l&amp;rsquo;efficacité du dépistage de l&amp;rsquo;information utilisant une indexation automatique ou manuelle, cette dernière s&amp;rsquo;appuyant sur un vocabulaire contrôlé. Le corpus d&amp;rsquo;évaluation interrogé par dix modèle de dépistage de l&amp;rsquo;information comprend des notices bibliographiques écrites en français et couvrant diverses disciplines. Finalement, nous analysons la performance obtenue en combinant les deux formes d&amp;rsquo;indexation.&lt;/p&gt;&#xA;&lt;h1 id=&#34;abstract&#34;&gt;Abstract&lt;/h1&gt;&#xA;&lt;p&gt;None&lt;/p&gt;</description>
    </item>
    <item>
      <title>Quelques pas vers l&#39;Honnêteté et l&#39;Explicabilité de moteurs de recherche sur le Web</title>
      <link>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2019/papers/coria.2019.coria_2019_paper_2/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La transparence des algorithmes est un sujet de préoccupation pour les utilisateurs et les autorités. Parmi les différents aspects de cette notion de transparence, est-il possible d&amp;rsquo;étu- dier dans quelle mesure les moteurs de recherche sur le web sont honnêtes par rapport à leur politique de personnalisation déclarée, et dans quelle mesure est-il possible d&amp;rsquo;expliquer leur comportement, ne serait-ce que succinctement ? Cet article décrit un cadre expérimental pour étudier ces aspects, et des résultats obtenus sur l&amp;rsquo;étude du principal moteur de recherche sur le Web. L&amp;rsquo;idée suivie est d&amp;rsquo;étudier les différences dans les résultats du moteur, afin de mesu- rer leur honnêteté et leur explicabilité. Nous avons formalisé le protocole expérimental et les mesures d&amp;rsquo;évaluations. Nous trouvons, pour plusieurs utilisateurs et plusieurs requêtes choisies avec soin, qu&amp;rsquo;il y a de larges variations dans les résultats. Nous les quantifions et nous les ordonnons l&amp;rsquo;importance relative des paramètres étudiés. Nous montrons que ces informations seraient utiles pour améliorer la transparence des moteurs de recherche sur le Web.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Représentations Gaussiennes pour le Filtrage Collaboratif</title>
      <link>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper31/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>http://www.asso-aria.org/coria/2018/papers/coria.2018.paper31/</guid>
      <description>&lt;h1 id=&#34;résumé&#34;&gt;Résumé&lt;/h1&gt;&#xA;&lt;p&gt;La plupart des systèmes de filtrage collaboratifs, comme par exemple la factorisation matricielle, utilisent des représentations vectorielles pour les articles et les utilisateurs. Ces représentations sont déterministes, et ne permettent pas de modéliser l&amp;rsquo;incertitude des représentations apprises, ce qui peut être utile quand un utilisateur a évalué un petit nombre d&amp;rsquo;articles (problème du démarrage à froid), ou quand le modèle est confronté à des informations contradictoires concernant le comportement d&amp;rsquo;un utilisateur ou les évaluations d&amp;rsquo;un utilisateur. Dans cet article, nous nous appuyons sur des représentations gaussiennes qui modélisent cette incertitude, et définissons un cadre d&amp;rsquo;apprentissage et d&amp;rsquo;inférence approprié à ce type de représentations. Nous montrons en outre que ce modèle fonctionne bien sur trois collections représentatives, et analysons les représentations apprises par le modèle.&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
