Wrap-Up zum Vortrag von Chiara Cenati (29.11.2023): Vergangenheit, Gegenwart und Zukunft der Digitalen Epigraphik: von EpiDoc zu KI

Was ist Digitale Epigraphik und was können wir in Zukunft von ihr erhoffen? Welche besonderen Erfordernisse stellen Inschriften überhaupt an digitale Editionen? Und wird die Künstliche Intelligenz (KI) irgendwann in der Lage sein, epigraphische Fragmente verlässlich zu ergänzen? Inschriften variieren schließlich eklatant in Form und Inhalt – von der kurzen Weihinschrift zum langen carmen – und können auch nicht als reine Textquellen angesprochen werden. Chiara Cenati (Institut für Alte Geschichte und Altertumskunde, Papyrologie und Epigraphik) zeigte in ihrem Vortrag, wie neuere digital-epigraphische Projekte den gattungsspezifischen und materiellen Erscheinungsformen von Inschriften gerecht werden wollen.

Dies galt allerdings nicht von Anbeginn: In der Pionierzeit der Digitalen Epigraphik (1980er) lag der Fokus noch auf der Erstellung von Datenbanken, deren vornehmliches Ziel die Durchsuchbarmachung von Text(-Corpora) war. Einige der damals entwickelten Projekte werden heute noch fortgeführt, aktualisiert und bleiben in ihren Gebieten maßgeblich: Für die Lateinische Epigraphik existiert die nahezu vollständige Epigraphik-Datenbank Clauss/Slaby (EDCS), für die Griechische Epigraphik die (unvollständige) Datenbank Searchable Greek Inscriptions (PHI). Bereits in den 1990ern gab es zunehmend Bemühungen um eine stärkere Berücksichtigung materieller und historischer Aspekte, was sich etwa in der Epigraphischen Datenbank Heidelberg (EDH; für die römischen Provinzen) oder der Epigraphic Database Roma (EDR; für die Stadt Rom) niederschlug.

Ab den 2000ern wurden mit EpiDoc (TEI-XML) eine eigene Metasprache sowie Richtlinien entwickelt, die sich an den Bedürfnissen der Epigraphik ausrichteten und nach wie vor etwa halbjährlich ein Update erfahren. Für dieses Vorhaben musste das ursprünglich nur auf Texte und nicht auch auf Textträger ausgerichtete TEI-Format adaptiert werden. EpiDoc wurde vielfach aufgegriffen, von digitalen Ausgaben bestehender Editionen (etwa den Vindolanda Tablets Online, heute Teil der Roman Inscriptions of Britain), aber auch von gänzlich anderen Projekten, etwa papyri.info.

Obwohl dieses Tool weite Verbreitung finden konnte, bleibt festzuhalten, dass sich viele Projekte – mit ihren sehr diversen Bedürfnissen und Zielsetzungen – gegen EpiDoc entschieden. Einen ersten großen Schritt zu gemeinsamen Standards, insbesondere mit der Etablierung von weithin verwendeten Vokabularen, setzte das mittlerweile nicht mehr weiterfinanzierte Best Practice Network EAGLE. EAGLE sollte die existierenden Plattformen miteinander verbinden; unterschiedliche Aufbereitungen der Daten in den Einzelprojekten und unzureichende Koordination der Datenflüsse zwischen EAGLE und den Datenbanken führten allerdings zu unbefriedigenden Suchoptionen, was das Netzwerk für die breite Verwendung unattraktiv machte.

Mit epigraphy.info (seit 2018) wurde die Idee eines gemeinsamen Portals mit Zugriff auf alle Einzelprojekte wieder aufgegriffen; daneben zielt das auf den FAIR-Prinzipien basierende Vorhaben auf die Instandhaltung abgeschlossener Projekte und die Erarbeitung von Richtlinien. Wichtige Schwerpunkte der Unternehmung sind die Erstellung von Vokabularen (also von für alle antiken epigraphischen Kulturen nutzbaren Datensätzen), Ontologien (von z.T. auf CIDOC CRM aufbauenden Definitionen und formalen Strukturen von Daten durch Angabe der (hierarchischen) Beziehungen untereinander) sowie eines „Epifinders“: Dies ist ein Tool zur Suche, Analyse und Bearbeitung von Inschriften, das mit den einzelnen Projekten interoperabel ist. Die Gewährleistung des Datenflusses in beide Richtungen – bei EAGLE nicht möglich – ist ebenfalls ein wichtiges Anliegen.

Hierfür ist es aber notwendig, dass die Daten abgeglichen werden und im XML-Format vorliegen. Da eine Neukodierung aller Daten unmöglich ist, muss auf Converter und Editors zurückgegriffen werden. Zurzeit steht der im Rahmen des ERC-Projekts PATRIMONIVM entwickelte Converter Open Access zur Verfügung, der die Konvertierung von Eingaben im Leidener System ermöglicht. Der Editor des DFG-geförderten EDEp-Projekts (Editionstools für eine Digitale Epigraphik) befindet sich in der Testphase und wird nach Abschluss des Vorhabens (2024) freigegeben.

Chiara Cenati ist selbst Mitarbeiterin im ERC-Projekt MAPPOLA (Mapping Out the Poetic Landscapes of the Roman Empire; PI: Peter Kruschwitz). Im Zuge dessen werden in einer Datenbank (Open Access, momentan noch in der Testphase mit beschränktem Zugang) die etwa 4.000 Versinschriften des Römischen Reichs gesammelt und auch auf einer Karte dargestellt. MAPPOLA adaptiert das EAGLE-Vokabular durch die Einführung von neuen Ober- und Unterkategorien sowie von für Versinschriften wichtigen Vokabularen für das Inschriftenlayout. Ebenso wird eine Ontologie für die verschiedenen Textgattungen (Prosa- und Versinschriften, quantitative und akzentuierende Schemata und die verschiedenen Versmaße) entwickelt. Zwar wurde der PATRIMONIVM-Converter integriert, für die Inschriften stehen jedoch drei Formen der Visualisierung (diplomatisch/interpretativ/Visualisierung nach Versen) zur Verfügung, was im Moment ein Alleinstellungsmerkmal von MAPPOLA ist. Bislang wurde höchstens auf die Versform hingewiesen, ohne weitere Angaben zur Unterscheidung von Vers und Zeile – was in den Inschriften aber differieren kann.

Ein rezentes Arbeitsfeld der Digitalen Epigraphik ist Machine Learning (ML). Prominent ist etwa ITHACA: Das Ziel ist eine mit existierenden Datenbanken trainierte KI, die Lücken in griechischen Inschriften ergänzen kann; Probleme bei derartigen Projekten betreffen etwa die Tatsache, dass die verwendeten Datenbanken unvollständig und teilweise fehlerhaft sind (und somit viel Arbeit in die Datenbereinigung investiert werden muss), aber auch, dass insgesamt zu wenig Inschriften bekannt (und ediert) sind, um Daten für zuverlässige Ergebnisse bereitzustellen. Oftmals ist zudem nicht eindeutig, wie viele Buchstaben in einer fragmentierten Inschrift überhaupt fehlen. Nichtsdestotrotz ist ML zur Lückenergänzung ein wichtiges Forschungsvorhaben; neben ITHACA entstehen gerade weitere Initiativen.

In der akademischen Lehre fristet die Digitale Epigraphik immer noch ein Nischendasein; für Interessierte hat das Project ENCODE einen MOOC zur Digitalen Epigraphik und Papyrologie entwickelt, der demnächst online zugänglich sein wird.

In der Diskussion bestand Einigkeit, dass eine automatisierte Ergänzung (die in jedem Fall von Wissenschaftler*innen überprüft werden muss) epigraphische Arbeit lediglich unterstützen könne; auch die historische Interpretation der Inschriften obliege weiterhin den Expert*innen. Erneut wurde auch die nicht immer gewährleistete freie Zugänglichkeit und langfristige Finanzierung der Datenbanken betont. Möglichkeiten und Grenzen institutioneller Anbindungen der Digitalen Epigraphik – etwa im Zuge eigener Professuren – wurden diskutiert. (Bericht: Felix Michler)

Liste der Partner von epigraphy.info (inkl. Verlinkungen).