Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données | Carnet de la Bibliothèque nationale de France
Cet article décrit comment une technique innovante de reconnaissance de mise en page (OLR, optical layout recognition) appliquée lors d’un grand projet européen de numérisation de la presse ancienne (Europeana Newspapers, 2012-2015) a été utilisée dans une expérience de fouille de données ciblant les métadonnées quantitatives de quotidiens numérisés. Les fichiers numériques de six titres de journaux français des collections de la BnF ont ainsi été analysés avec des techniques d’extraction et de visualisation de données démontrant des voies prometteuses pour la production de connaissances sur la presse ancienne, à l’usage des acteurs des bibliothèques numériques (gestionnaires de programmes de numérisation, conservateurs et médiateurs des collections de presse), ceux du champ des humanités numériques mais aussi le grand public utilisateur des bibliothèques numériques. Démonstration est également faite de l’intérêt de ces métadonnées quantitatives pour la recherche d’information.
Veille Scientifique et Technologique quotidienne sur les thématiques de recherche du département Cosys de
l'Université Gustave Eiffel et plus largement sur les thématiques de la ville durable.
Environ 25 000 articles issus de différentes sources, académiques, industrielles, gouvernementales, françaises et internationales.
Utilisez le moteur de recherche du blog.
Aucun commentaire:
Enregistrer un commentaire