Aktuelle Veranstaltungen
14. 09. 2023

München

Workshop: KI-gestützte Texterkennung bei "kleinen" Sprachen

– zusammen mit der Universität Augsburg am 14. September 2023 in München

 

Das Collegium Carolinum veranstaltet in Kooperation mit dem Lehrstuhl „Verflechtungsgeschichte Deutschlands mit dem östlichen Europa“ der Universität Augsburg einen Workshop zum Thema „KI-gestützte Texterkennung (OCR/HTR) bei ‚kleinen‘ Sprachen“ - am 14. September 2023 (Museumspädagogik im Sudetendeutschen Haus, Erdgeschoss, Hochstr. 8, 81669 München)

 Martina Niedhammer (CC) und Jana Osterkamp (Universität Augsburg)

Automatische Text- und zunehmend auch Handschriftenerkennung (OCR / HTR) spielen im historischen Arbeitsalltag eine nicht zu unterschätzende Rolle. Dabei wird jedoch häufig übersehen, dass entsprechende Modelle oftmals anhand „großer“ Sprachen, wie Englisch oder Deutsch, entwickelt wurden, weshalb ihr Nutzen für „kleine“ Sprachen begrenzt ist. In dem am 14. September am Collegium Carolinum stattfindenden Workshop nehmen wir mit dem östlichen Europa eine Region in den Blick, in der Historiker:innen traditionell mit einer Vielzahl „kleiner“ Quellensprachen konfrontiert werden und fragen einerseits nach den Spezifika der Forschungsarbeit mit eben diesen Sprachen. Andererseits erproben und diskutieren wir Lösungsansätze, die für die Forschungspraxis „kleiner“ Sprachen bereits entwickelt wurden.

Das besondere Augenmerk der eintägigen Veranstaltung liegt auf der Verzahnung von methodischer Reflexion und Praxis, weshalb neben Historiker:innen auch Kolleg:innen aus den Digital Humanities, der IT und dem Bibliothekswesen beteiligt sind. Auf diese Weise möchten wir unter anderem folgende Fragen adressieren: Welchen Mehrwert kann das ursprünglich in der Soziolinguistik entwickelte Konzept der „kleinen“ Sprache für die historische Forschung zu Zentral- und Osteuropa entfalten? Inwieweit knüpft es an die Selbstwahrnehmung von historischen Akteur:innen und / oder die praktische Frage nach der Sichtbarkeit und Zugänglichkeit von Quellen an? Anders gefragt: Gibt es auch große „kleine“ Sprachen? Inwiefern sind dabei auch das Nebeneinander mehrerer „kleiner“ Sprachen oder Interferenzen mit „großen“ Sprachen, die sich in Quellen häufig finden, von Bedeutung?

 

Interessierte Gäste sind nach vorheriger Anmeldung herzlich willkommen. Eine digitale Zuschaltung per Zoom ist auf Anfrage möglich. Teilnehmende sind eingeladen, für die Hands-on-Session gedruckte und handschriftliche Quellenbeispiele (in digitalisierter Form) aus ihrer eigenen historischen Forschungsarbeit zum östlichen Europa mitzubringen. Zur besseren Planung bitten wir um eine entsprechende Nachricht bis einschließlich 11. September 2023 an martina.niedhammer@collegium-carolinum.de

 

 

PROGRAMM

 

9.00 – 9.30 Uhr

„Kleine“ Sprachen in den Geschichtswissenschaften. Probleme und Herausforderungen einer Quellen- und Analysekategorie

Martina Niedhammer / München; Jana Osterkamp / Augsburg

 

9.30 – 10.15 Uhr

Keynote: Das „Ruthenische“ im habsburgischen Galizien (1772–1918): Aspekte der Sichtbarkeit und Nachhaltigkeit einer großen „kleinen“ Sprache

Michael Moser / Wien

 

10.15 – 10.45 Uhr Kaffeepause

 

Slavische Sprachen: Wege zur „digitalen Gleichberechtigung“

Moderation: Johannes Gleixner / München

 

10.45 – 11.15 Uhr

Die Neukatalogisierung der Ruthenica-Sammlung an der Österreichischen Nationalbibliothek: neue Zugänge mithilfe von KI?

Annette Höslinger-Finck / Wien

 

11.15 – 12.15 Uhr

Quelloffene Workflows zur automatischen Texterkennung für ressourcenarme Sprachen am Beispiel des Obersorbischen

Kay-Michael Würzner / Dresden; Wito Böhmak / Bautzen

 

Mittagessen

 

13.30 – 15.30 Uhr

Hands-on-Session

Moderation: Michael Kabelka / Augsburg

 

Praktischer Teil mit eigenen Quellenbeispielen der Teilnehmenden

Niklas Platzer / Florenz; Florian Langhanki / Würzburg

 

15.30 – 16.00 Uhr Kaffeepause

 

Diasporasprachen im östlichen Europa und ihre Quellen

Moderation: Martina Niedhammer / München

 

16.00 – 17.30 Uhr

Erfahrungen aus der Praxis: Armenisch und Armeno-Kipčak

Arpine Maniero / München; Jürgen Heyde / Leipzig (online)

 

Erfahrungen aus der Praxis: Jiddisch

Daria Vakhrushova / München, Düsseldorf (online)

 

Von der Handschrift zum Algorithmus: HTR in der Slavistischen Linguistik und darüber hinaus. Das Beispiel nichtlateinischer Alphabete

Aleksej Tikhonov / Zürich-Freiburg i. Br.

 

Abschlussdiskussion und gemeinsames Abendessen