Details of the event

Tuesday, 02. September 2025 - Wednesday, 03. September 2025

09:00 - 19:30 o'clock

Zentralbibliothek Zürich, Hermann-Escher-Saal

Von der Quelle zum Datensatz

Diese interdisziplinäre Summer School richtet sich an Historiker*innen, die ihre Quellen mit grossen Sprachmodellen (LLMs) wie ChatGPT bearbeiten möchten. Bisher waren Textmining-Kenntnisse erforderlich, um serielle Quellen wie Karteikarten, Register, Listen, Kataloge oder Bibliografien in eine strukturierte Datenform zu übertragen. Heute können auch grosse Sprachmodelle solche Aufgaben übernehmen. Die Summer School vermittelt die dafür notwendigen Kompetenzen: Wie verfeinert man den Prompt so, dass das Modell die Texte und Zahlen möglichst präzise wiedergibt? Wie überträgt man den in der grafischen Oberfläche entwickelten Prompt in ein Python-Script, mit dem sich eine grössere Anzahl von Dokumenten verarbeiten lässt? 

Der zweite Schwerpunkt liegt auf der kritischen Reflexion der digitalen Methodik. Die Ergebnisse der Transformation der Quellen zum Datensatz müssen im wissenschaftlichen Kontext überprüft werden. Welche etablierten Vorgehensweisen der Qualitätsmessung gibt es, und wie kann die Datenqualität anhand eines Goldstandards überprüft werden? Neben automatisierten Verfahren steht auch die manuelle Dateninspektion zur Verfügung. Hierfür hat sich OpenRefine als effizientes Tool etabliert, mit dem sich Ungereimtheiten schnell erkennen und bereinigen lassen. Zudem bietet OpenRefine die Möglichkeit, Personen- und Ortsnamen mit Referenzwerken wie WikiData, Geonames oder der GND abzugleichen. 

Die Summer School besteht aus verschiedenen methodischen Inputs und praktischen Arbeitsphasen. Die Teilnehmenden können entweder mit dem Beispieldatensatz oder mit ihren eigenen Quellen arbeiten. Der Beispieldatensatz besteht aus einem Korpus so genannter «Nachtzedel» der Stadt Zürich (1780-1810). Ein Nachtschreiber zählte jeden Abend die Hotelgäste, schrieb dabei ihren Beruf und ihre Herkunft auf. In anderen Städten ist diese Quellengattung als «Fremdenlisten» bekannt. Solche Listen geben Einblick in die vielfältigen Beziehungen und transnationale Vernetzung der Stadt. Sie zeigen, welche Händler und Kunstschaffenden die Stadt besuchten und woher sie stammten.  

Die öffentlichen Abendvorträge erweitern die Thematik durch Erfahrungen aus konkreten Forschungsprojekten und durch kritische Reflexion der automatisierten Quellenverarbeitung. Die Roundtable bietet Raum zur kontroversen Diskussion von Chancen und Risiken beim Einsatz von KI in der Geschichtswissenschaft.

Teilnahme:

Die Summer School richtet sich an digital affine Historiker*innen und Geisteswissenschaftler*innen des Mittelbaus sowie an Masterstudierende in der Abschlussphase. Vorkenntnisse in Python oder Datenformaten wie JSON und CSV sind von Vorteil, aber nicht Voraussetzung. Es wird jedoch erwartet, dass die Teilnehmenden an beiden Tagen durchgehend anwesend sind. Die Summer School findet im Hermann-Escher-Saal der Zentralbibliothek Zürich statt.  

Ein Online-Pre-Event am 18. August bietet eine Einführung in die Funktionsweise von Sprachmodellen. 

Die Teilnahme selbst ist kostenlos. Anreise und Unterkunft sind von den Teilnehmenden selbst zu organisieren und tragen.  

Interessierte senden ihre Bewerbung bis zum 20. Juli an summerschool@zb.uzh.ch. Über die Teilnahme wird am 31.7. informiert. Bitte reichen Sie Ihre Bewerbung als PDF ein. Sie soll folgendes umfassen:

  • Motivationsschreiben: Was interessiert Sie am Thema der Summer School besonders? Wie nutzen Sie bereits ChatGPT zur Verarbeitung oder Analyse von Quellen? Welche Herausforderungen sind Ihnen dabei begegnet? Welche Quellen verwenden Sie, und welche Themen oder Fragestellungen möchten Sie in die Summer School einbringen? Bitte fügen Sie einen repräsentativen Auszug Ihrer Quelle im Umfang von einer Seite bei.  

  • Lebenslauf (CV)

Programm:

Pre-Event: Montag, 18.8., 13:30 - 17:00, online
Einführung in die Funktionsweise von Sprachmodellen 

Zeit

Dienstag, 2. September 2025
Hermann-Escher-Saal, ZB Zürich 
Mittwoch, 3. September 2025
Hermann-Escher-Saal, ZB Zürich 

9:00

Begrüssung  

Einführung in die Thematik, Elias Kreyenbühl 

Entwicklung eines geeigneten Prompts für die vorliegende Quelle, Sarah Kiener 

Evaluationsverfahren zur Qualitätsmessung: Vorstellung von Metriken. Auswertungen mit Goldstandard.  

Ausführen der Skripts 

Interpretation der Ergebnisse 

10:45 

Aktive Arbeitsphase

Input und Austausch über Promptingstrategien, Sarah Kiener 

Dateninspektion mit OpenRefine 
Elias Kreyenbühl, Benjamin Rosemann 




13:00

Einführung in die Arbeit mit der ChatGPT

API: Python-Script anpassen, API Keys, Dateimanagement, Verarbeitung von 10 Files oder mehr
Sarah Kiener und Assistierende 

Zwischendurch Pause mit Projektslam: alle Teilnehmenden 

Datenbereinigung und Entity Linking mit OpenRefine
Benjamin Rosemann 

Open Science: Open Research Data, Datenbeschreibung, Lizenzierung, Reproduzierbarkeit
Elisabeth-Christine Gamer 




18:15

Öffentlicher Abendvortrag: 
Tobias Hodel: Chancen, Risiken und bias: Grosse und kleine Sprachmodelle in den Geisteswissenschaften.

Öffentlicher Inputvortrag:
Christiane Sibille: Zwischen KI und Quelle - Wer redet mit wem? 

Mit anschliessender Podiumsdiskussion.