Elektronische Editionen der BBAW |
|
Die Entwicklung eines digitalen Systems für historisch-kritische Editionen an der BBAW. Ein Werkstattbericht aus der TELOTA-Initiative "Projekt des Monats".
Berlin-Brandenburgische Akademie der Wissenschaften, 21. Juli 2006
Gerald Neumann
Abstract
|
Telota (The electronic life of the academy) ist eine Initiative der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW). Sie entwickelt Instrumente, mit denen die BBAW ihre Forschungsergebnisse digital erarbeitet, dokumentiert und präsentiert.Sie unterstützt und befördert die Standards der digitalen geisteswissenschaftlichen Arbeit. Die aktuellen Aufgaben von Telota sind zur Zeit die Evaluation des digitalen Zustands der Forschungsvorhaben der BBAW, die Entwicklung von Konzepten und das Setzen von Ziele der Entwicklung digitaler Arbeitsmethoden sowie die Initiierung von Projekten zur Förderung der digitalen Forschungsarbeit. Das aktuelle Projekt ist das "Telota - Projekt des Monats (TPM)". TPM arbeitet arbeitet seit dem Februar 2005. Es besteht im Wesentlichen aus 2 Mitarbeitern (Alexander Czmiel und Christiane Fritze) und 2 Studenten (Stephan Klinger und Mandy Krause). Es präsentiert jeden Monat ein neues, digitales Projekt der Akademienvorhaben. Es soll das Informationsangebot für die geisteswissenschaftliche Forschung bereichern und einer interessierten Öffentlichkeit Einblicke in die aktuelle Forschung geben. |
Die bisherigen Projekte (Stand Juli 2006) sind:
- der Online-Ritterkatalog, Erschließungsinstrument für Leibniz-Handschriften
- die Jahresberichte für deutsche Geschichte der Zwischenkriegszeit, bibliographische Fachinformation zur deutschen Geschichte
- das Wörterbuch der deutschen Gegenwartssprache, größtes frei zugängliches, akademisches Bedeutungswörterbuch der deutschen Sprache
- die Berliner Klassik, umfangreiche Datensammlungen zum kulturellen Leben Berlins in der Zeit von 1786 bis 18156
- das Deutsche Wörterbuch von Jacob Grimm und Wilhelm Grimm, erste Online-Lieferung der Neubearbeitung
- Preußen als Kulturstaat, historische Akten in digitaler Verarbeitung
- das Goethe-Wörterbuch, erster Einblick in die aktuelle Lieferung
- die Marx-Engels-Gesamtausgabe, eine elektronische Edition in ihrem historischen Kontext
- das Corpus Medicorum Graecorum / Latinorum, eine neue Galen-Edition
- die Leibniz-Edition Reihe IV Band 1 und 3, vollständige PDF-Ausgabe der Reihe IV
- die Turfan-Forschung, elektronische Einblicke in die Turfan-Oase
- der Census of Antique Works of Art and Architecture Known in the Renaissance, ein georeferenzierter Zugang per googlemap auf die Daten des Census
- das Corpus Vitrearum Medii Aevi, die ikonographische Beschreibung von mittelalterlichen Kirchenfenstern
- Kant's gesammelte Schriften, eine elektronische Darstellung der Transkription des 'Opus postumum'
- Die griechischen christlichen Schriftsteller, die elektronische Edition von "Hippolyt Werke, Kommentar zu Daniel"
- die Deutschen Texte des Mittelalters, Dateneingabe und Recherche im Handschriftenarchiv der BBAW
Der aktuelle Stand der Arbeiten ist unter http://www.bbaw.de/pom/pom.html zu sehen.
Die TPM-Projekte im Bereich der digitalen Editionen umfassten bisher:
- die Marx-Engels-Gesamtausgabe,
- das Corpus Medicorum Graecorum / Latinorum,
- die Leibniz-Edition Reihe IV Band 1 und 3,
- die Editionen der Turfan-Forschung.
Ziele der Bearbeitung
Die Ziele bei der Bearbeitung dieser 4 Projekte waren die Verwendung einer einheitlichen technische Grundlage für alle Projekte, die bevorzugte Benutzung und Entwicklung von Open-Source-Software, die Wiederverwendung existierender Module und die Benutzung, Einhaltung und gegebenenfalls Weiterentwicklung von internationalen Standards. Eine schematische Übersicht über die existierenden Module und ihre Verwendung gibt nachfolgende Abbildung.
Die sich aus der gewählten Datenaufbereitung ergebenen Möglichkeiten sollen hier nicht im Einzelnen aufgeführt werde. Sie sind vielfältig, bisher nur teilweise erschlossen und können leicht an neue Nutzerbedürfnisse angepasst werden. Jede Strukturierungsarbeit an den Daten hat unmittelbare Auswirkungen auf die Darstellung und Recherchierbarkeit derselben.
Einige Schlussfolgerungen und Konsequenzen
- Die verfügbare Datenbanken, Webserver, andere Software und Hilfsmittel aus dem Open-Source-Bereich erfüllen die notwendigen Voraussetzungen an Funktionalität und Performance gut bis sehr gut.
- Die Standards für Datenauszeichnung (XML/TEI), Datenkonvertierung (XSLT, FO), und Datenabfrage (XQuery) sind für grundlegenden Anliegen hinreichend weit entwickelt.
- Die Unicode-Unterstützung in den verwendeten Applikationen deckt (fast) alle Bedürfnisse der Zeichendarstellung und Suchfunktionalität ab.
- Die Datenmodellierung der XML-Dokumente und die konsequente Nutzung von Open-Source-Technologien sichert ein hohes Maß an Unabhängigkeit und Langzeitverfügbarkeit der erschlossenen Quellen.
- Neben den grundlegenden Problemen gibt es eine Reihe von Einzelproblemen, für die es (noch) keine allgemeinen Lösungen gibt, z.B. Formeldarstellung.
- Einzellösungen sind zwar möglich, widersprechen aber dem Ansatz, nur standardisierte, möglichst gut dokumentierte Software zu benutzen.
- Die Umsetzung der Unicode-Unterstützung in den modernen Browsern und Datenbanken ist verhältnismäßig gut und verbessert sich mit jeder neuen Version. Fehlende Implementierungen gibt es z.B. noch bei 'kombinierten Zeichen'.
- Die Benutzung unabhängiger Formate und die Verlagerung der Informationen in die XML-Strukturen führen zu einem erhöhten Aufwand bei der Datenkonvertierung und gelegentlich auch bei der Datenausgabe.
- Dieser erhöhte Aufwand scheint uns aber gerechtfertigt durch den Zugewinn an Unabhängigkeit, Verfügbarkeit und nicht zuletzt Archivierbarkeit.
Links zu Telota - Projet des Monats
http://www.bbaw.de/pom/pom.html
Telota - Projekt des Monats Team kontaktieren.