Gallica Métadonnées : mieux visualiser les métadonnées pour mieux filtrer les résultats d’une recherche

Logo Gallica Méta

Auteur

Grégoire Clémencin, Autonoia.

Le constat

Un grand nombre de sessions de recherche sur Gallica s’achèvent dès la première requête, sur la première page de résultats, et sont abandonnées sans même avoir permis la consultation d’un document.

Plusieurs facteurs peuvent expliquer ces comportements. L’un d’entre eux est sans doute le sentiment de trop plein face au volume des résultats renvoyés par le moteur de recherche et une certaine difficulté à faire le tri parmi ces résultats.

Or, il existe des outils pour permettre de trier et de réorganiser les résultats et ainsi mieux interpréter la requête initiale. Ce sont tous les “filtres” proposés en colonne gauche, issus des “métadonnées” collectées dans les notices des documents produits en résultats. Mais peut-être ces filtres ne sont-ils aujourd’hui ni suffisamment visibles ni suffisamment parlants.

Pour redynamiser les sessions de recherche et amener les utilisateurs à découvrir plus de documents répondant à leur recherche ou tout simplement susceptibles de les intéresser, on propose ici de mieux mettre en avant ces métadonnées, en particulier les métadonnées descriptives que sont les Thèmes et les descripteurs Sujet. Cette mise en avant prend, entre autres, la forme de nuages de mots et de graphes d’associations permettant visuellement d’apprécier, d’évaluer et de sélectionner les documents selon leurs contenus.

On espère ainsi inciter les utilisateurs de Gallica à mieux interagir – et à interagir plus ! – avec la page de résultats de recherche et à ne plus hésiter à explorer – lister, trier, filtrer et finalement consulter – ces résultats. Ce faisant, un effet de sérendipité n’est jamais exclu !

Le prototype, baptisé Gallica Métadonnées, est accessible en ligne à l’adresse suivante :

https://gmd.autonoia.com

Vue d’ensemble de l’application

Gallica Métadonnées est une application permettant l’interrogation de trois corpus de la base de Gallica via son API de recherche. Les corpus retenus sont ceux du Patrimoine équestre, de la région Normandie et des Bibliothèques d’Orient (voir aussi cette page).

L’application se présente comme un formulaire de recherche libre accompagné de divers critères facultatifs (dont la sélection d’un des trois corpus).

La soumission d’une requête entraîne en réponse l’affichage d’une page de résultats de recherche classique, très proche de celle de Gallica :

Techniquement, les requêtes des utilisateurs sont adressées au moteur de recherche de Gallica via son API. Celle-ci retourne à l’application une liste ordonnée de réponses sous la forme de flux XML. Ces réponses sont analysées par Gallica Métadonnées et importées dans une base de données locale qui sert alors de référence pour la suite de la session. Une nouvelle recherche de l’utilisateur réenclenche un nouveau cycle en recréant une nouvelle base locale. (Pour plus de détails, les lecteurs intéressés pourront se référer à la page de présentation fonctionnelle ci-dessous, dans la rubrique « En savoir plus ».)

L’affichage des résultats de recherche suit un format là encore proche de celui de Gallica. Il en diffère toutefois par la présence d’une section liminaire « Filtrer les résultats » donnant accès aux métadonnées retenues comme filtres par l’application.

Une fois déplié, le panneau des filtres propose d’influer sur les résultats selon plusieurs critères cumulables que l’utilisateur peut sélectionner à sa convenance.

Deux grandes catégories de métadonnées ont été retenues comme filtres potentiels dans l’application Gallica Métadonnées. Elles ne représentent cependant qu’un sous-ensemble de toutes les métadonnées disponibles dans les notices de Gallica :

  • Les métadonnées « sémantiques » descriptives, provenant d’une part des Sujets (les descripteurs du contenu des documents) et d’autre part des Thèmes (les libellés de classification Dewey). Ces métadonnées sont présentées sous la forme de nuages de mots où l’importance relative de chaque descripteur est marquée par le corps de son caractère.

  • Les métadonnées factuelles, décrivant la nature (physique, bibliographique, etc.) des documents, en l’espèce les types de document. Cette métadonnée est présentée sous la forme d’une simple liste.

À ces éléments extraits des notices, l’application ajoute une option de filtrage « libre » par mot-clé. Cette option (également proposée dans l’interface de Gallica) permet l'interrogation de l’ensemble des champs textuels des documents de la liste des résultats, y compris le texte intégral des documents primaires. À la différence des filtres par métadonnées, ce filtrage par mot-clé peut entraîner un réordonnancement des résultats Gallica : il s’appuie en effet sur son propre algorithme de classement par pertinence réévaluant le poids de chaque document au regard du mot-clé recherché.

Les opérations de filtrage des résultats sont cumulables. Chaque activation d’un filtre par l’utilisateur entraîne la redéfinition de la liste des résultats par application de ce filtre ainsi que la redéfinition de la liste des filtres applicables à la nouvelle liste de résultats. De même, les filtres peuvent être désactivés librement.

Enfin, à titre expérimental, l’application propose de visualiser les descripteurs thématiques sous forme de graphes d’associations. Cette option, signalée par le lien «Vue graphique» en regard  des nuages de mots-clés, est disponible dès lors que les résultats courants comprennent des notices indexées à la fois par des descripteurs Dewey et des descripteurs Sujet. Le principe du graphe est d’afficher les liens attestés entre ces deux catégories de descripteurs, comme dans l’exemple suivant :

(En bleu, les descripteurs Dewey ; en orange, les descripteurs Sujet.)

Comme pour les nuages de mots-clés, l’importance relative des descripteurs (leur fréquence parmi les résultats) est marquée par l’importance du nœud correspondant. Les associations entre nœuds indiquent, elles, le volume de documents indexés conjointement par les deux nœuds liés.

En survolant les nœuds ou les liens avec la souris, on peut visualiser les informations factuelles qui y sont attachées.

Enfin, en double-cliquant sur un nœud, on sélectionne le descripteur correspondant comme filtre à appliquer à la liste des résultats de recherche.

En savoir plus

Question

Bonjour,

Je ne comprends pas bien la valeur ajoutée, par rapport à une bonne utilisation du formulaire de recherche avancée et des filtres.

Vous écrivez que les métadonnées sémantiques et les factuelles "ne représentent cependant qu’un sous-ensemble de toutes les métadonnées disponibles dans les notices de Gallica". Quelles sont les autres méta-données disponibles ?

Merci. Cordialement,

Eric Vanzieleghem.

Réponse

Bonjour,

Et tout d’abord merci pour cette marque d’intérêt pour l’application Gallica Métadonnées.

Le démonstrateur Gallica Métadonnées ne cherche pas à bousculer l’expérience de recherche sur Gallica, mais plutôt à explorer quelques pistes assurant une meilleure exposition des utilisateurs aux métadonnées issues des résultats d’une recherche, afin de les inciter à mieux exploiter ces ressources pour tirer un meilleur parti des résultats renvoyés par le moteur de recherche.

Pour qui est familier du formulaire de recherche avancée et à l’aise avec les filtres dans leur présentation actuelle, la valeur ajoutée de ce démonstrateur sera sans doute minime (mais peut-être pas nulle pour autant, voir ci-dessous). Mais ce n’est pas le public visé, qui est justement celui qui n’est pas à l’aise avec le formulaire de recherche avancée et qui ne « voit » pas les filtres dans la page de résultats actuelle. De manière générale, on observe peu d’actions de filtrage sur les pages de résultats de Gallica. En effet, ces filtres ne sont pas forcément les plus attendus, surtout par un public non averti dont les recherches sont souvent des recherches « thématiques » du type « je cherche des ouvrages sur… » pour lesquelles les filtres proposés par défaut s’avèrent inopérants.

La « valeur ajoutée » de l’application Gallica Métadonnées, si elle est avérée, tient aux modes de présentation des filtres de type « sémantique » (Sujets et Thèmes), d’une part en les regroupant sous la forme de nuages de mots-clés, permettant ainsi une consultation rapide des différentes « thématiques » propres à l’ensemble des résultats de votre recherche, d’autre part en les restituant au niveau de chaque résultat de recherche concerné sous une forme immédiatement cliquable. Dans ce dernier cas, l’application propose de « rebondir » directement depuis le résultat consulté pour récupérer tous les autres résultats de la recherche initiale partageant cette même métadonnée, comme illustré dans l’exemple ci-dessous.

C’est une opération qu’il n’est pas possible d’effectuer dans l’application Gallica d’aujourd’hui.

 Concernant la liste des métadonnées disponibles, il s’agit potentiellement de l’ensemble des champs associés aux notices du catalogue de la BnF, tels que vous pouvez les découvrir soit directement dans Gallica en demandant les informations détaillées associées à un résultat :

soit en consultant la notice du catalogue de la BnF (accessible depuis les informations détaillées précédentes). Tous les champs des notices (des plus factuels aux plus textuels) pourraient potentiellement servir de critère de filtrage des résultats. Par exemple, pour trier les résultats en fonction de la taille physique du document ! Évidemment, tous ces champs ne présentent pas tous le même intérêt.

Cordialement,

Grégoire Clémencin

Mots-clé: 
recherche
filtrage
métadonnées
API Gallica de recherche
application
prototype

Commentaires

(3)

Bonjour,
Je ne comprends pas bien la valeur ajoutée, par rapport à une bonne utilisation du formulaire de recherche avancée et des filtres.
Vous écrivez que les métadonnées sémantiques et les factuelles "ne représentent cependant qu’un sous-ensemble de toutes les métadonnées disponibles dans les notices de Gallica". Quelles sont les autres méta-données disponibles ?
Merci. Cordialement,

Eric Vanzieleghem.

Bonjour,
Dommage que la réponse à cette question ne soit pas visible...
Salutations.
Gérard Leroyer

Bonjour,

L'auteur de l'application a fourni une réponse, intégrée en fin d'article.

Cordialement,

Cécile Quach

Ajouter un commentaire

Billets récents