Home Entités

Entités

Dans Goetgevonden, les résolutions des États Généraux sont proposées sous forme de scans et de transcriptions. Plusieurs éléments significatifs ont été identifiés dans les transcriptions. Nous appelons ces éléments « entités ». Les occurrences des différentes entités ont été extraites des résolutions. Les ensembles de données initiaux ainsi produits ont ensuite été organisés.

À l’époque où le projet RÉPUBLIQUE a été réalisé, la reconnaissance d’entités dans un corpus de textes historiques aussi vaste que les résolutions des États Généraux était techniquement avancée. Étant donné que l’extraction et la conservation des entités (compte tenu de la taille du matériau) sont largement automatisées, les différents ensembles de données d’entités peuvent contenir des erreurs. Les occurrences d’entités dans les transcriptions peuvent avoir été manquées ou mal liées. Il est bon d’en tenir compte lors de l’utilisation des entités pour filtrer les résolutions.

Il n’existe pas de règles strictes quant à ce qui peut être considéré comme une entité. Dans Goetgevonden, des entités ont été sélectionnées pour aider les utilisateurs à rechercher les résolutions. On distingue les types d’entités suivants :

Toutes les entités apparaissent dans les résolutions sous plusieurs variantes en raison d’orthographes et de méthodes d’écriture différentes. De plus, des erreurs peuvent se produire dans la reconnaissance automatique de texte. Cela produit encore plus de variantes. Dans le processus de curation, chaque variante qui apparaît dans le texte est liée à une forme standardisée de l’entité.

Dans le processus de curation, la plupart des types d’entités sont divisés en catégories. L’explication des ensembles de données avec les types d’entités distincts indique toujours quelles catégories sont distinguées.

Les ensembles de données d’entités sont également disponibles sous forme de fichiers téléchargeables.