Moteur de recherche "Fichier Bossu"

Logo du moteur de recherche Fichier Bossu

Le moteur de recherche "Fichier Bossu" effectue des recherches dans les 165 896 fiches indexées du Fichier Bossu. Ce fichier est conservé dans le Fonds maçonnique du Département des manuscrits de la Bibliothèque nationale de France. En savoir plus sur le moteur de recherche ici.

Auteur

Thomas

Voir son interview ici.

Avatar : Mineur de la Vallée de Ste-Marie-aux-Mines et des Mines de Potasse de Mulhouse, en costume d'apparat

Ressources utilisées

  • Web scraping des métadonnées du Fichier Bossu, inscrites dans le catalogue des Archives et Manuscrits de la BnF ;
  • Récupération des images de chaque fiche du Fichier Bossu via Gallica ;
  • OCRisation des images de chaque fiche via le logiciel libre Tesseract ;
  • Extraction des entités nommées (dates, noms de loges, villes) via un script personnel ;
  • Indexation des métadonnées collectées et des textes OCRisés ;
  • Développement d'un moteur de recherche.

Fichier

Projet non inscrit dans un dépôt.

Licence

Libre utilisation de l'application mise en ligne.

Mots-clé: 
moteur de recherche
OCR
franc-maçonnerie
histoire
fichier Bossu

Ajouter un commentaire

Billets récents