Zukünftige Veranstaltungen

  • Einführung in Theorie und Praxis der OCR mit neuronalen Netzwerke
    Dienstag, 4. Oktober 2021, 17.15 Uhr
    In unserem 90-minütigen Workshop erklären wir im ersten Teil die theoretischen und technischen Grundlagen von OCR, im zweiten Teil wenden wir uns der Praxis zu. Mit Hilfe des Tools «Transkribus» können die Teilnehmenden digitale Dokumente für die Texterkennung vorbereiten und erlernen zudem, wie das Trainieren eines eigenen Modells funktioniert.

Nichts mehr verpassen!

Über unseren monatlichen Newsletter halten wir Sie neben neuen Veranstaltungen aus der digitalen Werkstatt auch über zahlreiche weitere Angebote der ZB auf dem Laufenden.

Vergangene Veranstaltungen

31. August 2021: Einführung in Theorie und Praxis der OCR mit neuronalen Netzwerken

Optical Character Recognition (OCR), die automatische Texterkennung, ist eine der wichtigsten Methoden im Bereich der Retrodigitalisierung. Dadurch werden grosse Textmengen maschinell lesbar und durchsuchbar gemacht. Insbesondere die Texterkennung von gedruckten historischen Dokumenten weist Erfolge auf, bleibt aber nach wie vor anspruchsvoll: Frakturschrift, Flecken auf den Seiten, durchscheinender Text sowie verschiedene Schriftgrössen führen dazu, dass ältere OCR-Systeme oft unverständliche und verstümmelte Texte extrahieren. Hier funktioniert die Textsuche anschliessend nur schlecht. Moderne auf neuronalen Netzwerken basierende OCR-Systeme schaffen neuerdings Abhilfe und sind in der Lage, Buchstaben zuverlässig und korrekt zu erkennen. 

In unserem 90-minütigen Workshop erklärten wir im ersten Teil die theoretischen und technischen Grundlagen von OCR, im zweiten Teil wendeten wir uns der Praxis zu. Mit Hilfe des Tools «Transkribus» konnten die Teilnehmenden digitale Dokumente für die Texterkennung vorbereiten und erlernten zudem, wie das Trainieren eines eigenen Modells funktioniert.

05. März 2020: Quality Assurance für Digitalisierungsprojekte

Martina Hoffmann: «Ein Überblick über Quality Assurance Workflows für Digitalisierungsprojekte»

Die Digitalisierung von Manuskripten, Büchern oder anderem Kulturerbe gehört mittlerweile für viele Institutionen zum Tagesgeschäft. Inzwischen gibt es globale Standards für ein «gutes» Digitalisat und unzählige Software-Pakete unterstützen den Digitalisierungsworkflow oder scheinen diesen gar massgeblich zu steuern. Wie findet man sich im Dschungel der Möglichkeiten zurecht? Worin unterscheiden sich Digitalisierungsprojekte und worin gleichen sie sich? Welche Grundkenntnisse sind zentral für eine erfolgreiche Quality Assurance? Der Vortrag gibt darauf Antworten.

Florian Steffen: «Die Teil-Automatisierung des Zeitungsdigitalisierungsprozesses in der NB»

Bei der Digitalisierung von Zeitungen treffen zwei Faktoren aufeinander: der Umfang der zu digitalisierenden Seiten und die strukturelle Komplexität des Mediums Zeitung. Beides zusammen führt zu komplexen Datenmengen, deren Qualität geprüft werden muss. Die Schweizerische Nationalbibliothek setzt dazu auf einen vollständig kontrollierten, IT-gestützten Digitalisierungsprozess und strebt einen möglichst hohen Automatisierungsgrad an. Der Vortrag stellt diesen Prozess vor und erläutert, wie sich die Quality Assurance in der NB in den letzten Jahren zu diesem Modell hin entwickelt hat.

30. Oktober 2019: The present and future use of the Metamorfoze Preservation Imaging Guidelines

The speaker

Hans van Dormolen worked in the Metamorfoze programme (the Nether­lands‘ national programme for the preservation of paper heritage), which is situated in the National Library of the Netherlands in The Hague (Koninkli­jke Bibliotheek). He’s the author of several important Preservation Imaging Guidelines, e.g. the «Metamorfoze Preservation Imaging Guidelines, Image Quality, Version 1.0». He was awarded in 2014 for his work in objective capture practices for cultural heritage imaging by the Society for Imaging Science and Technology (IS&T). Van Dormolen works now as an indepen­dent imaging consultant (Imaging & Preservation Imaging, Haarlem, The Netherlands).

The lecture

Hans van Dormolen will give an introduction of the Metamorfoze Preser­vation Imaging Guidelines. He explains the what, why and how of its basic principle «What you see is what you get». This basic principle is granted in all three Metamorfoze quality levels. And he will present the new elements of version 2.0 of the Metamorfoze Preservation Imaging Guidelines. Version 2.0 is under construction now and will be published later this year.