Springe direkt zu Inhalt

Arbeitspakete

AP 1 Computerlinguistik 

MLU Halle: Prof. Dr. Paul Molitor, Dr. Jörg Ritter, Sascha Heße, Janis Dähne, Dr. Marcus Pöckelmann, Elisabeth Hannah Werner

Univ. Potsdam: Prof. Dr. Manfred Stede, Steffen Frenzel

Entwicklung und Implementierung von innovativen Algorithmen zum automatischen sprachübergreifenden Textvergleich auf Abschnitts-, Satz-, Phrasen- und Wortebene

In dem Arbeitspaket werden Algorithmen erarbeitet, die auf unterschiedlichen Textebenen (Absätzen, Sätzen, Phrasen, Wörtern bzw. elementaren Diskurseinheiten) Alignierungen zwischen mehreren, zum Teil verschiedensprachigen Versionen eines Textes vornehmen. Dazu wird vornehmlich mit Wort-/Satz-Einbettungen gearbeitet, aus denen dann die semantische Ähnlichkeit errechnet werden kann. Besondere Herausforderungen sind hierbei unter anderem n-zu-m-Alignierungen, die Qualität der Einbettungen, das Zusammenspiel der unterschiedlichen Textebenen und die Frage nach effizienten Algorithmen zum Vergleich von mehr als zwei Textversionen. Um die Interoperabilität zu gewährleisten, werden in diesem Arbeitsschritt zudem standardisierte Formate für Import und Export erarbeitet.

AP 2 Informatik

MLU Halle: Prof. Dr. Paul Molitor, Dr. Jörg Ritter, Sascha Heße, Janis Dähne, Dr. Marcus Pöckelmann, Elisabeth Hannah Werner

Erweiterung der Arbeitsumgebung LERA um eine Close-Reading-Visualisierung für mehrsprachige Alignierungsergebnisse u. Interaktionsmöglichkeiten zur manuellen Nachbereitung

Ein Anwendungsszenario für die in AP 1 entwickelten Verfahren besteht in einer nutzerfreundlichen Bereitstellung der erzeugten Segmentierungs- und Alignierungsdaten bzw. Varianzinformationen, damit zum einen die Fachwissenschaftler:innen die Ergebnisse der Algorithmen überprüfen und ggf. manuell nachbearbeiten können und zum anderen Dritten ein exploratives Durchstöbern des Textvergleiches ermöglicht wird. Im Rahmen des AP 2 wird dies im Sinne eines Proofs-of-Concept erfolgen und die Arbeitsumgebung LERA um eine Close-Reading-Visualisierung für mehrsprachige Alignierungsergebnisse erweitert.

AP 3 Evaluation und Digitale Edition 

FU Berlin: Dr. Brigitte Grote, Sandra Balck, Fabian Etling

Erprobung und Anwendung von (semi-)automatisch erzeugten Alignierungsdaten zur selektiven Auswertung, Visualisierung und Nutzung in der Editionsarbeit

Das Arbeitspaket AP 3 ist verantwortlich für die Erprobung und Anwendung von Alignierungsdaten in ausgewählten Einsatzszenarien im Bereich der Digitalen Editionen. Dies geschieht in enger Kooperation mit dem Editionsprojekt »Hannah Arendt. Kritische Gesamtausgabe« an der FU Berlin. Die Aufgaben umfassen unter anderem die Untersuchung der Möglichkeiten zur selektiven Auswertung und Visualisierung der (semi-)automatisch erzeugten Alignierungsdaten in der Einzeltext-Darstellung. Darüber hinaus werden Konzepte zur effektiven Nutzung dieser Daten in der Editionsarbeit ausgearbeitet und implementiert, um die Qualität und Effizienz bei der Bearbeitung kritischer Editionen zu steigern.

AP 4 Digitale Literaturwissenschaft 

FU Berlin: Prof. Dr. Frank Fischer, Yashee Singh

Demonstration der entwickelten Technologie anhand prominenter Fälle literarischer Übersetzungen/Adaptionen als konkreter Anwendungsfall der Computational Literary Studies

Im Mittelpunkt dieses Arbeitspakets steht die exemplarische Analyse einiger prominenter Übersetzungen mithilfe der entwickelten Tools. Die Fälle stammen aus vier Zeitperioden (frühes und spätes 18. Jahrhundert sowie 19. und 20. Jahrhundert) und beziehen sich auf verschiedene Genres (Romane, Prosadramen, Versdramen). Zwei der Texte wurden aus dem Englischen ins Deutsche, die beiden anderen Texte in umgekehrte Richtung übersetzt. Das Korpus wird im TEI/XML-Format aufbereitet und mit Metadaten angereichert. Durch die Analyse syntaktischer, lexikalischer und semantischer Unterschiede soll ein Einblick in die Praxis im Umgang mit den entwickelten Tools gewährt und deren Anwendbarkeit für die computergestützte Literaturwissenschaft validiert werden, um Forschungsabläufe zu unterstützen und das Verständnis für mehrsprachige Textadaptionen zu fördern.