Prof. Dr. Werner Wegstein, z.Z. noch als Senior Professor an der Universität Würzburg aktiv, zu den Anfängen von TextGrid, zu Community-Building und der Schönheit von TEI

Wann haben Sie angefangen, TextGrid zu konzeptionieren?

Wegstein: Genau genommen habe nicht ich damit angefangen zu planen, sondern das Konzept hat sich einfach so entwickelt. Der Anstoß dazu stammt von Heike Neuroth. Mit Blick auf eine Ausschreibung des Bundesministeriums für Bildung und Forschung hat sie sondiert, wer als Partner für einen Projektantrag in Frage kommen könnte. Wir hatten in Würzburg schon seit den siebziger Jahren Erfahrungen mit der Anwendung der Datenverarbeitung in der philologischen Forschung gesammelt. Dabei ist auch ein beachtliches Volumen von Text-Editionen und Sprachdaten in elektronischer Form zusammengekommen. Durch Tagungen in Würzburg - z.B. über die „Maschinelle Verarbeitung altdeutscher Texte V“ (1997) oder über „Korpuslinguistik deutsch - synchron, diachron, kontrastiv“ (2003)- waren wir national wie international ganz ordentlich mit den einschlägigen Fachkreisen vernetzt und auch von daher auf der Suche nach neuen Wegen für eine philologisch geprägte Datenverarbeitung in der geisteswissenschaftlichen Forschung. Und so kam es dann, dass 2004 Frau Neuroth auf dem roten Sofa der Deutschen Sprachwissenschaft in Würzburg saß und zusammen mit einigen Kolleginnen und Kollegen aus anderen Universitäten überlegte, was alles für einen halbwegs aussichtreichen Projektantrag nötig ist und was die Beteiligten aus den einzelnen Institutionen an Vorarbeiten dafür einbringen können.

Sie haben also gemeinsam das Projekt TextGrid geplant?

Wegstein: Geplant setzt vielleicht schon zuviele feste Zielvorstellungen voraus. In meiner Erinnerung an die Anfänge haben sich die Projektziele erst bei der Detailarbeit an dem Antrag herauskristallisiert. Auch der Name „TextGrid“ ist erst spät auf einer Planungssitzung in Trier erfunden worden. Dass schließlich das Antragskonzept ein Erfolg geworden ist, liegt meines Erachtens vor allem an dem motivierenden Zusammenwirken aller Beteiligten aus Institutionen mit ganz unterschiedlichen Hintergründen und Schwerpunkten, die auf den ersten Blick eher zufällig zueinander gefunden haben: einerseits die universitäre fachwissenschaftliche Forschung - aufgefächert in Neuere deutsche Literaturwissenschaft, Mediävistik und Sprachwissenschaft, mit jeweils eigenen Methoden und Forschungsinteressen, aber stets auf der Basis einer grundsätzlichen Übereinstimmung, was den Einsatz der Datenverarbeitung in den Geisteswissenschaften betrifft. Andererseits auf Dauer angelegte Institutionen wie die SUB Göttingen, die nicht nur das tragfähige organisatorische Projektfundament beiträgt, sondern natürlich auch - als Bibliothek - den immer wichtiger werdenden Bereich der Metadaten in einem digitalen Umfeld und schließlich das Institut für deutsche Sprache, als zentrale außeruniversitäre Einrichtung zur Erforschung und Dokumentation der deutschen Sprache in der Gegenwart und der jüngeren Geschichte, prädestiniert für ein Projekt, das die neuen Grid-Strukturen zur digitalen Sicherung des - zunächst einmal sprachgebundenen - kulturellen Erbes entwickeln will. In die technische Umsetzung ist natürlich die Informatik einbezogen. Um Spezialfragen, etwa die Grid-Anbindung oder die Authentifizierung, kümmern sich zwei IT-Firmen aus dem universitären Umfeld. Das ist im Grund der komplette Satz an Kompetenzen, die man braucht um ein solches Projekt in den Geisteswissenschaften in Gang zu bringen.

Wofür brauchen Geisteswissenschaftler Gridpower?

Wegstein: Am Anfang war das noch nicht so ganz sicher. Dass sich für die kollaborative Arbeit an den riesigen Datenmengen unseres kulturellen Erbes eine ausfallsichere Grid-Technologie, also ein „storage grid“ empfiehlt, das war von Anfang an klar. Erst recht, wenn man - wie wir - anstrebt, nicht nur die Sprachdaten in digitale Form zu überführen, sondern auch die Materialien, auf denen sie überliefert sind: Handschriften, Inkunabeln, Drucke und was sonst noch früher als Träger sprachlicher Information verwendet wurde, und zwar in Archivqualität, praktisch als Ersatz für die Originale. Mit fortschreitender Arbeit an der Strukturierung digitaler Sprachdaten in einer feinen Granulierung sahen wir dann aber, dass z.B. für die komplexe Analyse solcher Daten in Sprachkorpora von der Größe, wie sie das IDS verwaltet, Rechnerleistung gebraucht wird, die den Einsatz eines computing grid auch in den Geisteswissenschaften sinnvoll erscheinen lässt, wenn man nicht wochenlang auf Ergebnisse warten will.

Haben sich irgendwelche Ihrer Hoffnungen an TextGrid nicht erfüllt?

Wegstein: Nein, inhaltliche Hoffnungen nicht. Aber unsere Anfangsvorstellungen vom Zeitrahmen, den wir benötigen würden, um ein produktionsreifes Programmpaket zu erstellen, konnten wir nicht einhalten. Den Aufwand haben wir einfach unterschätzt. Andererseits erscheint mir das Arbeitstempo für einen akademischen Forschungsverbund - auch im internationalen Vergleich - trotzdem immer noch als durchaus respektabel. Und nicht nur das Arbeitstempo. Was ich  ganz besonders geschätzt habe, war die Arbeitsatmosphäre innerhalb des TextGrid-Projekts: ein angenehmes und inspirierendes Miteinander, motivierend und sehr konfliktarm, unabhängig von unterschiedlichen sachlichen Positionen, die durchaus kontrovers diskutiert wurden.

Was haben Sie selbst mit TextGrid vor?

Wegstein: Ich vertrete die Anwenderseite und wende die Werkzeuge, die im TextGrid-Projekt entwickelt wurden, in Forschungsprojekten an, um skeptische Fachkollegen vom Nutzen des TextGrid-Konzepts zu überzeugen. Mein erster Musterfall ist die Edition des Campe-Wörterbuch. Es ist als umfangreiches Wörterbuch mit sehr komplexen Strukturen, die aber nicht immer konsequent angewandt sind, ganz gut geeignet als Modell für so etwas Diffiziles wie eine elektronische Kodierung nach internationalen Standards, und zwar mit einem einheitlichen, validierbaren Strukturgerüst.

Für die Digitalisierung kodieren Sie das gesamte Wörterbuch im Dokumentenformat der Text Encoding Initiative – ist das nicht mit der Zeit etwas eintönig?

Wegstein: Keineswegs. Ich vergleiche die TEI-Kodierung von Texten gern mit der Repräsentation eines musikalischen Werkes in einer Orchesterpartitur, obwohl mir klar ist, dass der Vergleich etwas hinkt, was das Verhältnis von Linearität und Hierarchie betrifft. Aber die Partitur macht die Strukturen sichtbar, aus denen sich der Klang des Ganzen zusammensetzt. Das gilt entsprechend auch für die TEI-Kodierung von Texten.

Wenn man es noch nicht kennt, wirkt TEI so wie Noten auf Noten-Unkundige wirken: die sehen nur schwarze Striche und Punkte, keine Musik...

Wegstein: Deswegen ist es günstig, nicht mit den spitzen Klammern anzufangen, sondern bei den Texten anzusetzen und genau zu überlegen, was man daran untersuchen und wie man das festhalten und überprüfbar machen will. Unter diesem Aspekt sehe ich die Beschränkungen, die das Datenformat XML mit den spitzen Klammern und die Logik der TEI-Kodierung dem Anwender auferlegen nicht als Zwangsjacke, sondern eher als eine Herausforderung an den Philologen, auf der Basis des TEI-Standards eine Kodierung zu entwerfen, die die Strukturen des Textes deutlich macht.

Welche Hausaufgaben hat das TextGrid-Projekt noch zu erledigen?

Wegstein: Wir müssen für das Projekt selbst noch eine dauerhafte Trägerstruktur finden und das Community-Building in den Fachwissenschaften voranbringen. Das wird noch mal ein hartes Stück Arbeit. – Ich halte es mit Nancy Ide, die das in der Einleitung zur ersten Version der TEI-Guidelines P1 von 1990 so formuliert hat: „Standards cannot be imposed: they must be accepted by the community.“ Das ist exakt der Punkt, an dem TextGrid ansetzen muss. Community-Building ist für uns als Geisteswissenschaftler das A und O. Das geht nur Projekt für Projekt, Forscher für Forscher. Und diese Überzeugungsarbeit zu leisten ist schwierig. Ein Geisteswissenschaftler lässt sich am ehesten überzeugen, wenn ihm jemand aus dem eigenen Fachumfeld zeigt, dass es sich lohnt, sich auf etwas Neues einzulassen. Dazu braucht es entsprechende Vermittlungskonzepte. Vielleicht solche, die so dynamisch und flexibel angelegt sind wie die TEI-Kurse an der Brown-Universität, die Julia Flanders, Direktorin des „Women Writers Projects“, und ihr Team zur Verbreitung der TEI-Anwendung in den USA anbieten. Auf ähnliche Weise, denke ich, müssten wir auch TextGrid aussäen können.

Die Fragen stellte Esther Lauer.

Zurück zur Pressemappe …