Home Projet Ensembles de données Groundtruth

Groundtruth

Cet ensemble de données contient ce qu’on appelle la Groundtruth au format PageXML des transcriptions utilisées pour la formation des modèles de reconnaissance de texte via la plateforme Transkribus (voir l’explication sur la reconnaissance de texte). Il s’agit de 515 scans qui constituent un échantillon représentatif des résolutions manuscrites des États Généraux entre 1576 et 1796.

L’ensemble de données peut être téléchargé depuis la bibliothèque numérique Zenodo. De plus amples informations sur la création de l’ensemble de données y sont également disponibles.