Methodik computerunterstützter Textinterpretation
Weitere Informationen gibt es auch im
PDF-Format zum Downloaden !!
Der Arbeitsbereich wird von Prof. Dr. Harald Schweizer geleitet
und zählt zur PRAKTISCHEN INFORMATIK. Bewußt wurde das Wissenschaftsetikett
"Computerlinguistik" vermieden: Im Wortsinn gäbe
es zwar keine Einwände, da ebenfalls Sprache mit Hilfe des Computers
untersucht wird; darüberhinaus weckt der Begriff aber
Vorstellungen methodischer und konzeptioneller Orientierung, die
vermieden werden sollten. Zur Erläuterung:
Wesentlicher Hintergrund des Arbeitens sind Grundeinsichten
von Semiotik und Systemtheorie. An der Zeichendefinition entlang, dabei einzelne
selbstreferentielle Subsysteme auseinanderhaltend, werden folgende Basistermini
definiert:
- SYNTAX: Das Ausdrucksrepertoire einer Sprache kann automatisch
vom Computer in drei verschiedenen Feldern distributionell
untersucht werden, und zwar inhaltsfrei:
- Morphologie, Strukturierung
des Repertoires an Ausdrücken einer Sprache
- innerhalb eines gegebenen Textes die Wortformen-Distribution
- aus einem gegebenen Text heraus die Suche im umgebenden Korpus
nach geprägter Sprache (stehende Wendungen, Formeln, Anspielungen
usw.).
Zu den Bereichen (b) und (c) gibt es inzwischen ausführliche
theoretische und praktische Erfahrungen, lauffähige Programme.
An Bereich (a) wird derzeit gearbeitet.
- SEMANTIK ist verstanden als Analyse des Wortsinnes eines
Satzes. Damit übernimmt diese SEMANTIK die inhaltsbezogenen Fragestellungen
des alten, aber immer noch weithin akzeptierten
Syntax-Begriffs, zugleich wird die Analyse ausgeweitet und radikalisiert.
Zum Einsatz kommt ein elaborierter Set von Analysetermini
im Rahmen der Fragestellungen:
- Illokution=Sprechakte
- Prädikation (Prädikatbeschreibung, Aktanten und Deixis [Ort,
Zeit] umfassend)
- Codes=Modalitäten
- Adjunktionen.
Damit sind kognitive Basiskategorien umrissen, die bei der Verwendung jedweder
Sprache von Bedeutung sind. Bis in kleinste Nuancen sind
damit gegebene Sätze beschreibbar. Abspeicherung in einer Datenbank,
unterschiedliche, auch statistisch-grafische Auswertung
der Befunde.
- PRAGMATIK - in sich noch weiter differenziert - beschreibt
einerseits die vielfältigen Mechanismen, die die Einzelsätze zum
Text verketten; andererseits wird stufenweise der gemeinte,
übertragene Sinn der Äußerungen erfaßt. Das schon bei der SEMANTIK
erwähnte Terminologiegerüst kommt weiterhin zum Einsatz -
nur eben auf neuer Analyseebene, so daß die Transparenz bei der
Beschreibung der verschiedenen Ebenen der Inhaltsanalyse sehr
hoch ist. - Die PRAGMATIK führt letztlich dazu, die Beschränkung
auf die literarische Ebene aufzugeben und Brücken zu benachbarten
Handlungswissenschaften zu schlagen, z.B. Geschichtswissenschaft,
Soziologie, Psychologie. In letzter Zeit resultierten daraus verschiedene Arbeiten zur Übersetzungstheorie.
Vorgeschaltet ist diesem System der Textbeschreibung und
-interpretation die Stufe:
KONSTITUIERUNG DES TEXTES
Auf ihr werden vorbereitende Analysen für den nachfolgenden Dreischritt
durchgeführt. Mindestens gehört dazu die Segmentierung des Textes
in Äußerungseinheiten (Sätze, Nicht-Sätze), bei fremdsprachigen
Texten kann die Klärung schwieriger grammatischer
oder lexikalischer Konstruktionen bzw. Bedeutungen notwendig
werden, bei alten Texten die Sichtung des Handschriften-/Editionsbefundes
(Textkritik), auch die Frage, ob ein gegebener Text nachträgliche
Überarbeitungen erfahren hat (Literarkritik, zu der wir inzwischen über zwei
unterstützende Programme verfügen). - Schließlich gehören in diesen Bereich auch
Fragen der Hermeneutik: das Nachdenken über das, was mit diesem Vorgehen
erreicht werden kann und was nicht, wie Verstehen, Kommunikation, überhaupt
möglich ist. Sowenig wir auf künstlerische Texte
fixiert sind, so verdichtet sich die hermeneutische Fragestellung bei ihnen am
stärksten: Wie läßt sich der Wahrnehmungsprozeß bei der Konfrontation mit einem fremden Werk beschreiben?
Der Arbeitsbereich "Textwissenschaft" deckt somit nicht nur
ein umfangreiches, sondern ein letztlich - das hängt eben mit
dem Thema "menschliche Kommunikation" zusammen - auch sehr spannendes
Feld ab. Die Einsatzmöglichkeiten des Computers, die immer
weiter erforscht werden, sind dabei sehr verschiedenartig:
von vollautomatischen Befunderhebungen über halb-automatische
Unterstützung der Arbeit bis lediglich zum raffinierten Schreibgerät.
Das Sprach-/Textmaterial, an dem gearbeitet wird,
ist sehr unterschiedlich und wird häufig ergänzt. Längere Untersuchungen
laufen derzeit an der "Blechtrommel" von Grass. Französische,
englische und finnische Texte werden ebenfalls herangezogen
- z.B. Bei Fragen bedeutungsfreier Morphologie. Aufgrund
der historischen Herkunft des Arbeitsbereichs werden auch weiterhin
Texte in alten Sprachen bearbeitet werden (Latein,
Griechisch, Hebräisch). - Selbstverständlich werden für die, die
hier mitarbeiten, Texte in Sprachen ausgewählt, die sie auch
beherrschen.
Was oben rudimentär als theoretischer Rahmen
unseres Arbeitens skizziert wurde, hat sich inzwischen exemplarisch
in z.T. voluminösen
Publikationen
niedergeschlagen. An der alttestamentlichen
Josefsgeschichte
wurde der Kanon der Methodenschritte ausführlich durchgespielt, mit z.T. sehr
vielen Neuerungen auf den einzelnen Ebenen.
Die beschriebene Orientierung wird auch durch die Herausgabe einer wissenschaftlichen
Reihe THLI unterstützt: Ihr Zweck ist dann am besten erfüllt,
wenn Publikationen von möglichst unterschiedlicher methodischer und fachlicher
Orientierung darin vertreten sein werden.
nbsp;
Seit einigen Semestern wird speziell versucht, den Kontakt zu textwissenschaftlich
interessierten ForscherInnen in anderen Fakultäten zu pflegen
Textwissenschaftliches
Colloquium. Auch ist seit Jahren die kontinuierliche Mitarbeit von mehreren
Nachwuchsforschern, z.T. Auch von außerhalb der Universität, wichtiges
Merkmal.
Im Rahmen eines Informatikstudiums kann die Textwissenschaft
bzw. textwissenschaftlich ausgerichtete Computerlinguistik als
Nebenfach innerhalb derselben Fakultät gewählt werden.
Über die näheren Modalitäten gibt die je geltende
Studienordnung Auskunft.
Seit SoSe 96 greift die neue Regelung, daß man sich eigens gekennzeichnete
Lehrveranstaltungen (in der Regel: Vorlesungen) alternativ auch für das
Fach
INFORMATIK und GESELLSCHAFT anrechnen lassen
kann.
Die Lehrveranstaltungen können auch im Rahmen des neuen Studiengangs
MEDIENINFORMATIK eingebracht werden und decken dort den geisteswissenschaftlichen Anteil ab.
Das
Lehrangebot folgt im Turnus
von 4 Semestern den oben genannten Schwerpunkten, sowohl auf
Vorlesungs- wie Seminarebene. Übungen und jährlich ein Proseminar
vertiefen den Stoff.
Vgl. Zusätzlich die verschiedenen Veranstaltungen und Dienste der Abteilung
Startseite | letzte Aktualisierung: 17. November 2009