Jenseits von Schreibmaschine und Laptop – Mit TextGrid beschreiten Geistes- und Kulturwissenschaften neue Wege der Forschung im Informationszeitalter

Muffige Archive, staubige Bibliotheken? Sieht so der natürliche Lebensraum von Geisteswissenschaftlern aus, während Naturwissenschaftler in Hightech-Laboren forschen oder mit Supercomputern mal eben die Welt simulieren? Geistes- und Kulturwissenschaftlern scheint ein buchbedecktes Arbeitszimmer auszureichen, dem man noch ansieht, wo die Schreibmaschine ihr letztes Gefecht gegen den Laptop verloren hat. So stellen wir uns das vielleicht gerne vor.

Können wir uns aber auch vorstellen, dass sich verschiedene Disziplinen der Geistes- und Kulturwissenschaften sowie wissenschaftliche Bibliothekare zusammenschließen, um selbst ein digitales Instrument analog zu den Simulatoren der Klimaforscher oder Astronomen zu bauen? Dass sie ihre Arbeitszimmer und Bibliotheken im virtuellen Raum neu erfinden, um mit Kollegen weltweit gemeinsam forschen zu können? Und dass sie dabei modernste Technologien nutzen, die sonst eher Teilchenphysikern oder Informatikern vorbehalten sind? Genau das unternimmt das deutsche TextGrid-Projekt.

TextGrid setzt auf eine Technologie, die zur Lösung der großen Menschheitsfragen entwickelt wurde: Grid-Computing. Astronomen etwa suchen den Ursprung des Universums mit riesigen Teleskopen im All, Physiker mit dem Large Hadron Collider (LHC) in der Schweiz und Biologen entschlüsseln auf Großrechnern das menschliche Genom. Alle erzeugen gigantische Datenmengen. Am LHC etwa fallen 15 Petabyte im Jahr an – weit über 7 Billionen Textseiten. Um diese Datenflut zu speichern, zu analysieren und über die ganze Welt verteilten Forschergruppen zugänglich zu machen, wurde die Grid-Technologie entwickelt. Sie erlaubt es, Rechner und Daten zu verbinden und komplexe Berechnungen gleichzeitig auf mehreren Systemen durchzuführen, egal in welchem Land sie stehen.

TextGrid nutzt diese Architektur, damit Wissenschaftler gemeinsam am Kulturgut der Menschheit forschen können. Denn auch die Datenmengen, die zum Beispiel bei der Digitalisierung von Text anfallen, wachsen rasant. Datenbanken machen Abertausende von antiken Inschriften, mittelalterlichen Handschriften und neuzeitlichen Drucken digital verfügbar, während Bibliotheken und Firmen wie Google Millionen von Büchern digitalisieren.

Internet-Technologien und die Digitalisierung unseres kulturellen Erbes haben aber ein noch viel größeres Potenzial, als uns vom heimischen Rechner aus bequem digitalen Zugang zu den Archiven, Museen und Bibliotheken dieser Welt zu verschaffen. Online-Projekte wie Wikipedia zeigen, wie man das Internet einsetzen kann, um weltweit zusammenzuarbeiten. Wissenschaftler nutzen mehr und mehr auch diese Technologien, um gemeinsam im virtuellen Raum neue Forschung voranzutreiben. Hinter diesen Virtuellen Forschungsumgebungen steht die Vision, zukünftig zur Lösung eines Problems ohne großen Aufwand Spezialisten Zugriff auf alle nötigen Daten und Werkzeuge geben zu können. Daher unterstützen die Deutsche Forschungsgemeinschaft (DFG) oder das Bundesministerium für Bildung und Forschung (BMBF) die Entwicklung solcher virtueller Umgebungen, um Wissenschaftlern über fachliche und geographische Grenzen hinweg die Zusammenarbeit zu erleichtern oder erst zu ermöglichen.

Um diese Vision Wirklichkeit werden zu lassen, muss man Forscher, Daten und technische Infrastruktur zusammenbringen. Als international herausragendes Pilotprojekt hat sich TextGrid mit Förderung des Bundesministeriums für Bildung und Forschung genau dieser Aufgabe angenommen. Zehn deutsche Forschungseinrichtungen kooperieren seit 2006 bei der Entwickelung einer Virtuellen Forschungsumgebung für die Kultur- und Geisteswissenschaften. Im Vordergrund steht das verteilte Arbeiten mit Texten aller Art, von Lexika aus dem 18. Jahrhundert über seltene Handschriften bis zu digitalen Musikeditionen. Zudem gehören auch Bilder zum Repertoire von TextGrid. Grid-Computing liefert die Basis, ständig wachsende Datenbestände zusammenzuführen und Wissenschaftlern Werkzeuge für das gemeinsame Arbeiten mit diesen Materialien zu geben.

Virtuelle Forschungsumgebungen wie TextGrid ermöglichen es, neue Antworten auf alte Fragen zu finden – und ganz neue Fragen zu stellen. So lässt sich etwa durch den automatischen Abgleich tausender Texte viel einfacher herausfinden, wer sich von wem hat inspirieren lassen oder wie sich Ideen um die Welt verbreitet haben. Philologen können systematisch untersuchen, wie sich Sprache entwickelt hat und haben es dabei leichter, neben Texten aus der Hochkultur auch die Masse populärer Schriften zu analysieren. TextGrid bietet nicht nur einzelnen Forschern die Möglichkeit, Datenbestände zu durchsuchen, es erlaubt ihnen auch, gemeinsam an Texten zu arbeiten und sie digital aufzubereiten. Wissenschaftlichen Editionen eröffnen sich damit beispielsweise ganz neue Möglichkeiten. Für Professor Fotis Jannidis, Universität Würzburg, ist Visualisierung, wie sie TextGrid unterstützt, eine Schlüsseltechnologie:

„Im digitalen Bereich kann nun der Leser per Mausklick entscheiden, welche von mehreren Textvarianten für ihn sichtbar sein soll. Er kann sich Anmerkungen und andere Textvarianten auf den Bildschirm holen oder sich die Darstellung dynamisiert anzeigen lassen, so dass sich die verschiedenen Varianten direkt vor seinen Augen aufbauen. Die Visualisierung ist eine der ganz großen Chancen der digitalen Edition.“

Um schwierige Textstellen zu entschlüsseln, können bei digitalen Editionen Experten aus verschiedenen Ländern sogar unmittelbar kooperieren, während zeitgleich andere Kollegen daran arbeiten, Computern die Bedeutung von Texten beizubringen. Dadurch wird es etwa möglich, dass man bei einer Suche in historischen Texten auch die Orte finden kann, die mit uralten statt den heutigen Namen bezeichnet werden, oder automatisch vom Namen einer Person zu ihrer Biographie zu verlinken und so weitere Informationen über die Person zu erhalten oder sie überhaupt erst zu verifizieren.

In einer Umgebung wie TextGrid werden die Daten selbst zu Werkzeugen. Professor Andrea Rapp von der Technischen Universität Darmstadt erklärt das so:

„In der Arbeit mit einem literarischen Text kann beispielsweise die Frage auftauchen, ob ein bestimmtes Wort für diesen Dichter spezifisch ist, ob es regional begrenzt oder aber ganz weit verbreitet ist. Die miteinander verknüpften, aufbereiteten Wörterbücher geben mir Antworten auf diese Fragen. Und so können Daten, die ein Wissenschaftler erzeugt hat, für einen anderen zu neuen Werkzeugen werden. Dafür braucht man allerdings eine kritische Masse.“

TextGrid wird diese kritische Masse nicht nur anbieten, sondern auch eine Arbeitsumgebung zur Verfügung stellen, in der solche Forschungsfragen beantwortet werden können. Die Ergebnisse können dort veröffentlicht und für die Nachwelt erhalten werden.

Daten, Werkzeuge und Forschungsergebnisse online zusammenzuführen, erleichtert es auch, zur Lösung kniffliger Probleme Spezialisten aus anderen Fächern hinzuzuziehen. Heute arbeiten bereits Physiker, Bibliothekare, Informatiker, Linguisten und andere Wissenschaftler zusammen, um Virtuelle Forschungsumgebungen wie TextGrid aufzubauen. In Zukunft werden sie mit dieser Infrastruktur gemeinsam neue Wege zur Lösung wissenschaftlicher Probleme beschreiten können. Für die DFG ist die interdisziplinäre Zusammenarbeit ein wichtiger Grund, solche Projekte zu fördern, wie Programmdirektorin Dr. Sigrun Eckelmann erklärt:

„Neuerdings gibt es Gemeinschaftsprojekte von Disziplinen, die früher nichts miteinander zu tun hatten, zum Beispiel Linguisten und Biologen oder Klimaforscher und Historiker. So etwas ist jetzt möglich und das ist eine gravierende qualitative Änderung.“

Bibliotheken spielen bei diesen Entwicklungen eine wichtige Rolle, wie Dr. Heike Neuroth von der Universität Göttingen betont:

„Projekte wie TextGrid geben uns die Chance, die Forschungsprozesse in den jeweiligen Fachdisziplinen besser zu verstehen und damit die Wissenschaftler optimal mit Werkzeugen und Daten zu unterstützen. Dies ist ja nun keine neue Aufgabe für wissenschaftliche Bibliotheken, sondern hat eine jahrtausendlange Tradition. In der heutigen Wissens- und Informationsgesellschaft werden diese Aufgaben nur um die Dimension der neuartigen Technologien ergänzt. Es wird sicherlich weiterhin Aufgabe von Bibliotheken bleiben, notwendige Literatur und Bücher für die Forschung bereit zu stellen und aufzubewahren.“

Zurück zur Pressemappe …

Über Dr. Torsten Reimer

Dr. Torsten Reimer ist Programm-Manager beim Digital Infrastructure
Joint Information Systems Committee (JISC), London.