Episode 5

full
Published on:

4th May 2023

Wo Maschinen Handschriften lesen lernten – KI im Staatsarchiv

Wer an künstliche Intelligenz denkt, hat wahrscheinlich kein Archiv mit tausenden historischen Dokumenten vor Augen. Doch genau dort, im Zürcher Staatsarchiv, hat eine Maschine lesen gelernt. Alles begann mit rund 40 Studierenden, die in einem mehrjährigen Projekt rund 150000 Seiten handschriftlicher Protokolle des Zürcher Kantons- und Regierungsrats Wort für Wort abgeschrieben haben. Die Texte und die Bilder wurden später im EU-Forschungsprojekt READ als Trainingsset wiederverwendet, um «der Maschine» das Lesen beizubringen und es so möglich zu machen, historische Handschriften zu durchsuchen.

In dieser Folge beschreiben Tobias Hodel, Assistenzprofessor für Digital Humanities von der Universität Bern, und Christian Sieber, Leiter der Abteilung Nacherschliessung und Digitalisierung im Staatsarchiv Zürich, wie sie der KI gezeigt haben, was ein Buchstabe ist. Sie diskutieren ausserdem, wie die künstliche Intelligenz die Geschichtsforschung und die Geisteswissenschaften im Allgemeinen verändern werden und wie die Gesellschaft von ihnen lernen kann, mit den Gefahren der «intelligenten Maschinen» umzugehen.

Host: Florian Niedermann

Fragen und Anregungen: staatsarchivzh@ji.zh.ch

Links zur Folge:

Listen for free

Show artwork for Die Festplatte

About the Podcast

Die Festplatte
Der Podcast des Staatsarchivs Zürich
Das Staatsarchiv ist wie eine riesige «Festplatte» des Kantons Zürich. In diesem Podcast schauen wir Mitarbeitenden des Archivs bei ihrer Arbeit über die Schulter. Zudem nehmen uns Forscherinnen und Forscher mit auf Zeitreisen in Zürichs spannende Vergangenheit. Ihr, liebe Hörer:innen, erhaltet so Einblicke in eine Welt, die nur wenige kennen. Denn das Staatsarchiv hütet die Datenbestände von Behörden, Verwaltung und Anstalten des Kantons Zürich sowie die Akten des Alten Stadtstaats Zürich, die zurückgehen bis ins Frühmittelalter. Die Speicherung all dieser Daten hat einen Hauptzweck: Sie sollen so rasch wie möglich öffentlich zugänglich werden.

Host des Formats ist Florian Niedermann.

About your host

Profile picture for Florian Niedermann

Florian Niedermann