Groundtruth
Deze dataset bevat de zogenoemde groundtruth in PageXML-formaat van de transcripties die zijn gebruikt voor training van tekstherkenningsmodellen via het platform Transkribus (zie de uitleg over tekstherkenning). Het gaat om 515 scans die een representatieve dwarsdoorsnede vormen van handgeschreven resoluties van de Staten-Generaal tussen 1576 en 1796.
De dataset is te downloaden via de digitale bibliotheek Zenodo. Daar is ook meer informatie beschikbaar over de totstandkoming van de dataset.