SlaVaComp

 

Ansprechpartner:

Dr. Irina Podtergera

E-Mail-Adresse:

irina.podtergera@slavistik.uni-freiburg.de

Titel des Projekts:

SlaVaComp – COMPutergestützte Untersuchung von VAriabilität im KirchenSLAvischen

Webseite:

http://www.slavacomp.uni-freiburg.de/

Institution/Projektträger:

Slavisches Seminar und Rechenzentrum der Albert-Ludwigs-Universität Freiburg

Fachdisziplin:

Slavistik

Kurze Vorhabensbeschreibung:

Am Beispiel der griechisch-kirchenslavischen Übersetzungen und kirchenslavischer Originaltexte im ost- und südosteuropäischen Raum werden exemplarisch diachrone und regionale Differenzierungen der Sprache Kirchenslavisch untersucht, die trotz der wissenschaftlichen Unangemessenheit dieses Vergleichs oftmals als „Latein des Ostens“ bezeichnet wird. Ziel des Projekts ist es, mit Hilfe modernster, zum Teil noch zu entwickelnder Computertechnologie Analysewerkzeuge (kirchenslavische Tools in TextGrid), einen Index und ein zweisprachiges Online-Wörterbuch für die Erforschung graphischer und lexikalischer Variabilität des Kirchenslavischen in seiner zeitlichen und räumlichen Entwicklung zu erstellen. Dies wird in Zukunft eine zeitliche und räumliche Zuordnung bisher unerforschter Texte beziehungsweise Handschriften erleichtern.

Im Mittelpunkt stehen zwei Parameter: zum einen der Wortschatz, dessen chronologische und regionale Differenziertheit in allen historisch arbeitenden Philologien anerkannt ist, zum anderen die graphische Variabilität. Letztere ist ein typisches Merkmal mittelalterlicher Texte und wird hier zum ersten Mal zur computergestützten zeitlichen und räumlichen Einordnung der betreffenden Texte und Handschriften herangezogen. Als Quellen dienen überwiegend bereits edierte, digital vorhandene griechisch-slavische mittelalterliche Glossare, daneben auch einsprachige slavische Formenverzeichnisse und Editionen kirchenslavischer Texte, die entsprechend lemmatisiert werden. Für letztere werden Indices mittels entsprechender Tools (z. B. Lemmatisierer) automatisch erstellt. Die dabei entwickelten Instrumente können prinzipiell für alle historisch arbeitenden Philologien eingesetzt werden und berücksichtigen die hohe Variabilität mittelalterlicher Texte.

Als technische Infrastruktur wird TextGrid genutzt, welche Werkzeuge enthält, die für die methodologische Realisierung äußerst nützlich sind. Umfangreiche Module wurden für die Analyse und Lemmatisierung deutschsprachiger Texte entwickelt. Für die Anwendung auf die altgriechische und kirchenslavische Sprache müssen Algorithmen angepasst oder ausgetauscht werden. Dadurch erfährt TextGrid eine wesentliche qualitative Erweiterung:

  • in Hinblick auf die untersuchten Sprachen (bisher vor allem Deutsch und Englisch, nun auch Griechisch und Kirchenslavisch),

  • in Hinblick auf Schriften, nämlich die griechische und die kyrillische Schrift, inklusive historischer und lokaler Eigentümlichkeiten und Varianten,

  • in Hinblick auf Textsorten (bisher meist Belletristik, jetzt auch Bibel-, Kirchenväter- und ähnliche Texte, die in Handschriften überliefert sind),

  • in Hinblick auf den Zeitraum (bisher meist 18.–21. Jh., jetzt 10.–16. Jh.).

Die angewandten Verfahren werden auch für nicht-slavistische Geisteswissenschaften offen zugänglich gemacht, was zu einer stärkeren Vernetzung vor allem zwischen den Philologien beitragen wird. Darüber hinaus werden neue Impulse für eine engere Zusammenarbeit zwischen Informatikern und Vertretern unterschiedlicher Philologien, darunter Slavisten, gegeben.

Laufzeit:

15.01.2013 – 14.01.2016

Genutzte Tools und Anforderungen:

Rekodierungswerkzeuge, Tokenizer, Lemmatisierung mittels verschiedener Algorithmen bzw. weitestgehende Nutzung bereits vorhendener TextGrid-Werkzeuge

Links zu weiteren Materialien:

Kurzpräsentation SlaVaComp

Interessensschwerpunkte (z.B. TEI, W3C-Standards, Repository, Annotationstool usw.):

  • Handling mehrerer Textschichten nach Normalisierung bzw. Lemmatisierung;

  • Nutzung linguistischer Algorithmen;

  • Entwicklungen in Konformität mit Standards;

  • Chance der Nachnutzung der eigenen Entwicklungen durch die Community / durch andere Philologien;

  • Entwicklung weiterer Open Source Module