Gallicarte, un projet de géolocalisation des résultats de recherche dans Gallica

L’équipe qui a remporté le premier Hackathon de la BnF a présenté le projet Gallicarte. Celui-ci consiste à afficher les résultats d’une recherche effectuée dans Gallica (Bibliothèque numérique de la BnF) sur une carte. La nouvelle fonctionnalité permet de visualiser, par exemple, l’ensemble d’un fonds photographique géolocalisé sur une carte interactive en présentant les documents et leurs métadonnées issues du catalogue. Pour le grand public, la carte comme mode d‘affichage est d’utilisation simple. Pour les utilisateurs plus avertis, la carte comme mode de visualisation peut faire émerger des hypothèses de recherches. Le prototype, développé en 24 heures pendant le concours, proposait des fonctions simples sur un corpus documentaire relativement réduit. A la suite de cet événement, l’engagement de la BnF consiste à proposer ce mode de présentation des résultats sur un grand nombre de documents dans Gallica.

Dans un premier temps, des cartes thématiques (gastronomie, événements sportifs, monuments historiques, villes françaises …) feront leur apparition dans l’interface de la bibliothèque numérique. Par la suite, de nouvelles fonctionnalités comme la visualisation des entités nommées (noms de personnes, de lieux, d’organisations, dates) sur des fonds de cartes récents ou anciens seront accessibles depuis les pages de résultats de requête.

Les étapes du géocodage des données du projet

  • Reconnaissance des entités nommées : le moteur de recherche Exalead de Gallica détecte les occurrences de lieux dans les notices mais aussi dans le texte océrisé.

Exemple avec la photographie suivante :

16-2-13, Parc des Princes, équipe des Harlequins : [photographie de presse] / [Agence Rol]

 

  • Géocodage des données : ces entités sont ensuite envoyées au moteur Nominatim d’Openstreetmap qui va leur attribuer des coordonnées géographiques : https://nominatim.openstreetmap.org/

 

https://nominatim.openstreetmap.org/details.php?place_id=83171638

La base de données, la création des flux géocodés, la création des cartes

  • Le moteur Nominatim est interrogé pour l’ensemble des données (environ  180 000 points pour la première version) et rempli la base de données de Gallicarte.
  • Une interface permet d’intérroger la base de 3 façons différentes :

o    Via une requête SRU prédéfinie (plus d'informations sur cette page du site api.bnf.fr).

o    Via une liste de lien ark (lien Gallica des documents).

o    Via une recherche simple.

L’interface permet ensuite de créer un flux Géojson ou KLM utilisable par des interfaces de cartographie (voir l'exemple disponible dans le bloc "En libre accès" à la fin de cet article).

  • Création de la carte : les cartes sont librement créées via des sites tiers de cartographie (MaCarte – IGN, Framacarte, Umap) en important les flux géojson.  Elles peuvent être intégrées dans des articles de médiation, comme l'exemple ci-dessous.

Voir en plein écran

Dans un second temps, des opérations collaboratives avec les Gallicanautes seront organisées pour améliorer la précision des données présentées : les utilisateurs pourraient aider à identifier précisément le lieu de certaines prises de vues ou retracer le parcours d’un héros de roman. Gallica pourra aussi proposer des services géolocalisés à ces utilisateurs comme des recueils d’affiches ou de photos anciennes en fonction de l’endroit de consultation. Ces nouveautés seront disponibles progressivement dans Gallica à partir de la fin de l’année.

L'équipe de Gallicarte
Un projet issu du Hackathon de la BnF
Qui a participé à ce projet ?

Maïwenn Bourdic, Romain Bouyé, Philippe Gambette, Jean Jouberton, Matthieu Klein et Shervin Le Du.

Mots-clé: 
Gallicarte
cartographie

Ajouter un commentaire

Billets récents