Gallica Métadonnées : mieux visualiser les métadonnées pour mieux filtrer les résultats d’une recherche

Logo Gallica Méta

Auteur

Grégoire Clémencin, Autonoia.

Le constat

Un grand nombre de sessions de recherche sur Gallica s’achèvent dès la première requête, sur la première page de résultats, et sont abandonnées sans même avoir permis la consultation d’un document.

Plusieurs facteurs peuvent expliquer ces comportements. L’un d’entre eux est sans doute le sentiment de trop plein face au volume des résultats renvoyés par le moteur de recherche et une certaine difficulté à faire le tri parmi ces résultats.

Or, il existe des outils pour permettre de trier et de réorganiser les résultats et ainsi mieux interpréter la requête initiale. Ce sont tous les “filtres” proposés en colonne gauche, issus des “métadonnées” collectées dans les notices des documents produits en résultats. Mais peut-être ces filtres ne sont-ils aujourd’hui ni suffisamment visibles ni suffisamment parlants.

Pour redynamiser les sessions de recherche et amener les utilisateurs à découvrir plus de documents répondant à leur recherche ou tout simplement susceptibles de les intéresser, on propose ici de mieux mettre en avant ces métadonnées, en particulier les métadonnées descriptives que sont les Thèmes et les descripteurs Sujet. Cette mise en avant prend, entre autres, la forme de nuages de mots et de graphes d’associations permettant visuellement d’apprécier, d’évaluer et de sélectionner les documents selon leurs contenus.

On espère ainsi inciter les utilisateurs de Gallica à mieux interagir – et à interagir plus ! – avec la page de résultats de recherche et à ne plus hésiter à explorer – lister, trier, filtrer et finalement consulter – ces résultats. Ce faisant, un effet de sérendipité n’est jamais exclu !

Le prototype, baptisé Gallica Métadonnées, est accessible en ligne à l’adresse suivante :

https://gmd.autonoia.com

Vue d’ensemble de l’application

Gallica Métadonnées est une application permettant l’interrogation de trois corpus de la base de Gallica via son API de recherche. Les corpus retenus sont ceux du Patrimoine équestre, de la région Normandie et des Bibliothèques d’Orient (voir aussi cette page).

L’application se présente comme un formulaire de recherche libre accompagné de divers critères facultatifs (dont la sélection d’un des trois corpus).

La soumission d’une requête entraîne en réponse l’affichage d’une page de résultats de recherche classique, très proche de celle de Gallica :

Techniquement, les requêtes des utilisateurs sont adressées au moteur de recherche de Gallica via son API. Celle-ci retourne à l’application une liste ordonnée de réponses sous la forme de flux XML. Ces réponses sont analysées par Gallica Métadonnées et importées dans une base de données locale qui sert alors de référence pour la suite de la session. Une nouvelle recherche de l’utilisateur réenclenche un nouveau cycle en recréant une nouvelle base locale. (Pour plus de détails, les lecteurs intéressés pourront se référer à la page de présentation fonctionnelle ci-dessous, dans la rubrique « En savoir plus ».)

L’affichage des résultats de recherche suit un format là encore proche de celui de Gallica. Il en diffère toutefois par la présence d’une section liminaire « Filtrer les résultats » donnant accès aux métadonnées retenues comme filtres par l’application.

Une fois déplié, le panneau des filtres propose d’influer sur les résultats selon plusieurs critères cumulables que l’utilisateur peut sélectionner à sa convenance.

Deux grandes catégories de métadonnées ont été retenues comme filtres potentiels dans l’application Gallica Métadonnées. Elles ne représentent cependant qu’un sous-ensemble de toutes les métadonnées disponibles dans les notices de Gallica :

  • Les métadonnées « sémantiques » descriptives, provenant d’une part des Sujets (les descripteurs du contenu des documents) et d’autre part des Thèmes (les libellés de classification Dewey). Ces métadonnées sont présentées sous la forme de nuages de mots où l’importance relative de chaque descripteur est marquée par le corps de son caractère.

  • Les métadonnées factuelles, décrivant la nature (physique, bibliographique, etc.) des documents, en l’espèce les types de document. Cette métadonnée est présentée sous la forme d’une simple liste.

À ces éléments extraits des notices, l’application ajoute une option de filtrage « libre » par mot-clé. Cette option (également proposée dans l’interface de Gallica) permet l'interrogation de l’ensemble des champs textuels des documents de la liste des résultats, y compris le texte intégral des documents primaires. À la différence des filtres par métadonnées, ce filtrage par mot-clé peut entraîner un réordonnancement des résultats Gallica : il s’appuie en effet sur son propre algorithme de classement par pertinence réévaluant le poids de chaque document au regard du mot-clé recherché.

Les opérations de filtrage des résultats sont cumulables. Chaque activation d’un filtre par l’utilisateur entraîne la redéfinition de la liste des résultats par application de ce filtre ainsi que la redéfinition de la liste des filtres applicables à la nouvelle liste de résultats. De même, les filtres peuvent être désactivés librement.

Enfin, à titre expérimental, l’application propose de visualiser les descripteurs thématiques sous forme de graphes d’associations. Cette option, signalée par le lien «Vue graphique» en regard  des nuages de mots-clés, est disponible dès lors que les résultats courants comprennent des notices indexées à la fois par des descripteurs Dewey et des descripteurs Sujet. Le principe du graphe est d’afficher les liens attestés entre ces deux catégories de descripteurs, comme dans l’exemple suivant :

(En bleu, les descripteurs Dewey ; en orange, les descripteurs Sujet.)

Comme pour les nuages de mots-clés, l’importance relative des descripteurs (leur fréquence parmi les résultats) est marquée par l’importance du nœud correspondant. Les associations entre nœuds indiquent, elles, le volume de documents indexés conjointement par les deux nœuds liés.

En survolant les nœuds ou les liens avec la souris, on peut visualiser les informations factuelles qui y sont attachées.

Enfin, en double-cliquant sur un nœud, on sélectionne le descripteur correspondant comme filtre à appliquer à la liste des résultats de recherche.

En savoir plus

Mots-clé: 
recherche
filtrage
métadonnées
API Gallica de recherche
application
prototype

Ajouter un commentaire

Billets récents