Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données | Carnet de la Bibliothèque nationale de France

Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données | Carnet de la Bibliothèque nationale de France
Cet article décrit comment une technique innovante de reconnaissance de mise en page (OLR, optical layout recognition) appliquée lors d’un grand projet européen de numérisation de la presse ancienne (Europeana Newspapers, 2012-2015) a été utilisée dans une expérience de fouille de données ciblant les métadonnées quantitatives de quotidiens numérisés. Les fichiers numériques de six titres de journaux français des collections de la BnF ont ainsi été analysés avec des techniques d’extraction et de visualisation de données démontrant des voies prometteuses pour la production de connaissances sur la presse ancienne, à l’usage des acteurs des bibliothèques numériques (gestionnaires de programmes de numérisation, conservateurs et médiateurs des collections de presse), ceux du champ des humanités numériques mais aussi le grand public utilisateur des bibliothèques numériques. Démonstration est également faite de l’intérêt de ces métadonnées quantitatives pour la recherche d’information.

Aucun commentaire: