Kriterien für Äußerungseinheiten

ausgehend von: H. SCHWEIZER, Textsegmentierung in Äußerungseinheiten: Sprache und Datenverarbeitung 18 (1994) 3-18.

Die Kriterien entspringen nicht positivistischen Setzungen, sondern sind Kristallisationen des Sprachverständnisses, wie es in SCHWEIZER, H, Metaphorische Grammatik. Wege zur Integration von Grammatik und Textinterpretation in der Exegese. ATS 15. St.Ottilien 1981. 1990, 2. Aufl. bzw. SCHWEIZER, H, Biblische Texte verstehen. Arbeitsbuch zur Hermeneutik und Methodik der Bibelinterpretation. Stuttgart 1986, erläutert ist.

Eine Äußerungseinheit (=ÄE) ist, was eine kommunikativ/inhaltlich/pragmatisch beschreibbare, in sich abgerundete Funktion erfüllt. Unter "Funktion" ist hier der Bereich "Sprechakt/Illokution" zu verstehen: Inwiefern gibt ein Sprecher zu erkennen, daß er eine neue Sprechhandlung beginnt, mit einer veränderten Einstellung zu Sachverhalt (das kann auch heißen: er redet von einem neuen Sachverhalt) und/oder Adressaten? Stellt er Fakten nüchtern dar? Versucht er, zum Handeln zu animieren? Drückt er eigene Gefühle aus? Sorgt er sich nur um den Sprechkontakt, die Aufmerksamkeit der Kommunikationspartner? Beginnt er einen Gedanken, bricht ihn aber vorzeitig ab zugunsten zunächst eines anderen, komplett formulierten? Nicht bloße Sachverhaltslogik/-semantik ist somit die Beurteilungsbasis - wie meist in der langen Geschichte versuchter Satzdefinitionen -, sondern die Frage der aktuellen Sprachverwendung, die Einbeziehung des Sprechers und seiner über die Formulierungen faßbar werdenden Interessen und Intentionen. Daher liegt es auf der Linie verschiedener in diesem Sinn vorgehender linguistischer Werke, wenn - dies als weitere Illustration - von der "langue"-Orientierung ab - und zur "parole"-Orientierung übergegangen wird. Auch wird nicht mehr nur von "Satz", sondern eben von "Äußerung" gesprochen - was immer diese speziell beinhalte. Daher wurde auch als englischer Terminus "Illocution Unit" (=IU) vorgeschlagen, vgl. SCHWEIZER, H, The Predication-Model as a component of a Semantic and Pragmatic Content-Analysis: "Bible et Informatique: méthodes, outils, résultats", Jérusalem, 9-13 Juin 1988. Genève 1989. 537-562.

Unter den nachfolgenden Kriterien finden sich "harte" und "weiche". Die ersteren lassen sich programmieren, so dass ein Text - ohne dass er vorher im Einzelnen analysiert wäre - in einem hohen Maß schon automatisch vorsegmentiert wird. Die "weichen" Kriterien betreffen die Stellen, die sich nicht formalisieren lassen und die den Eingriff des verstehenden Sprachbenutzers erfordern.

Eine Segmentierung, nachdem man zuvor Satzteile=Phrasen bestimmt hat (Parsing), ist vielfach Praxis: sie muss zuvor einen großen Analyseaufwand bewältigen; wenn dieser automatisch vollzogen wurde, stellt sich ebenfalls das Verifikationsproblem (s.u.), da man nicht unterstellen kann, kommunikative Äußerungen würden komplett nach vorgefertigten Regeln ablaufen. Eine Segmentierung nach der Analyse bedeutet keinen Erkenntnisfortschritt, sie macht nur sichtbar, was zuvor an Analyse investiert worden war.

Standard wird sein, dass an einer Textstelle mehrere Kriterien zusammenwirken und eine sichere Entscheidung ermöglichen. Daneben müssen diffizil gebaute Äußerungen von Hand entdröselt vom Sprachbenutzer segmentiert werden (was dann von ihm zu begründen ist).

Die Vorstellung, es müsse eine komplette automatische Segmentierung erreichbar sein, impliziert die Annahme, sprachliche Äußerungen würden immer einer vordefinierten Schablone entsprechen - eine Einstellung, die offenkundig jede Kreativität ausschließt und insofern realitätsfremd ist.

Zugleich ist eine ÄE immer durch die Grenzen der umgebenden ÄEen mitdefiniert. Wichtiger pragmatischer Gesichtspunkt: Bei der Segmentierung eines Textes in ÄEen wird der Text sequentiell (linear) und entsprechend der unumkehrbaren Leserichtung (Textanfang => Textende) betrachtet. Immer wenn in dieser Bewegung - entsprechend den folgenden Kriterien - ein Einschnitt notwendig ist, beginnt eine neue ÄE. Eine ÄE kann in zwei Formen auftreten:

Der so aufgeteilte Text wird neu geschrieben und durchgezählt. - Es fungieren - wenn die Numerierung per Programm vollzogen wird - als Steuerzeichen: | für Kapitelanfang, @ für Anfang eines grafischen Abschnitts, # Beginn einer ÄE. Dabei besteht ein Inklusionsverhältnis:

( Kapitel ( Abschnitt ( ÄE ) ) ). Vgl. auch Regel (11).

Vorschlag für die Syntax der Zählung: [Kapitel] und [Abschnitt] werden - durch Komma getrennt - numerisch gezählt, die einzelne ÄE alphabetisch angefügt. Da manche Abschnitte sehr lang sind, kann es leicht sein, daß ein Durchgang des Alphabets nicht ausreicht. Daher ist in solchen Fällen neu mit dem Alphabet zu starten, aber zusätzlich anzugeben, in welchem Alphabet-Durchgang man sich befindet, z.B. 15,4h2 = Kapitel 15, Abschnitt 4, ÄE h im 2. alphabetischen Durchgang. Es können auch andere Zählweisen entwickelt werden - wenn sie nur das Ziel haben, die vom Autor/der Autorin beabsichtigten Segmentierungen abzubilden.


  1. Bei gegebenen Verbalsätzen: Eine ÄE hat nur ein finites, d.h. konjugiertes Verb. (Im Hebräischen wird die Verbindung w=/wa= + konjugierte Verbform als sicheres Signal der Satzeröffnung genommen.) - Das Kriterium gilt folglich für morphologisch faßbare konjugierte Verbformen. Letztere werden nicht - wie es oft geschieht - austauschbar mit dem semantischen Terminus "Prädikat" belegt. Zur Position der ÄE ist damit noch nichts gesagt.
  2. Immer wenn - nun semantisch gedacht - eine "Prädikation" anzunehmen ist (eine Subjekt-Prädikat-, also im Kern eine zweipolige Struktur, s.u. Kriterium 13), wird eine eigene ÄE angenommen. In vielen Sprachen kann eine einen selbständigen Sinn ergebende Äußerung=Prädikation (= Satz) nominal, verblos vorliegen. Vgl. Reporterdeutsch: "der Ball von Müller zu Beckenbauer, ...", oder als Ausruf: "drei Körbe auf meinem Kopf!"
  3. Nach einer Redeeinleitung: eine neue ÄE beginnt. Die Formen des Übergangs von besprechender zu direkter Rede können sehr verschieden sein. u.U. ist der Übergang überhaupt nicht markiert, aber klar aus dem Kontext erschließbar (vorher dritte Person, jetzt erste oder zweite; Sprecherwechsel). Satzzeichen liefern Steuerungsignale (die gibt es nur nicht in allen Schriften). Ausformulierte Redeeinleitung ("er sprach:"). Oft treffen mehrere solcher Indizien zusammen.
  4. Relativsätze werden abgetrennt. Im Fall einer Einbettung die Einzelelemente durchzählen in der geschilderten Weise. Keine Sondernotation! Also: "Der Hund, der grau war, ist tot." = a:Der Hund b:der grau war c:ist tot. Nicht: a:Der Hund b1:(oder a1:)der grau war a: ist tot. - Begründung: (i) Segmentierungen werden auf der Basis linearer Textwahrnehmung allein bestimmt (also nicht aufgrund der Erkenntnis von Einbettungen). (ii) Ist (i) eingehalten, so bereitet es später bei der Analyse kein Problem, die vielfältigen Verschachtelungen (eben nicht nur bei Relativsätzen) in Texten herauszuarbeiten.
  5. Konjunktionale Nebensätze (logische Konjunktionen: "daß, damit, weil, obwohl, wenn" usw.) werden abgetrennt - seien sie nominal oder verbal. [Beachte Kriterium (9)] Vor die Konjunktion können noch koordinierende Wörter treten ("und weil..., oder daß...").
  6. Verblose ÄEen mit benennbarer eigener kommunikativer Funktion (z.B. als kurze Antwort auf eine Frage) werden abgetrennt.
    Neben dem Normalfall (das Verb als oberster Knoten) sind noch andere Satz-Typen möglich, die verblose Konstruktionen betreffen. Je nachdem, welchem Knoten der höchste Rang zukommt, wird unterschieden nach
    Substantiv-Satz: Eine Frau fürs Leben. - Glückwunsch!
    Adjektiv-Satz: Für immer dein. - Ehrlich?
    Adverbial-Satz: Fort mit ihnen! - Leider!
    (nach Weber, Dependenzgrammatik, 1992, 22)

  7. Erkennbar parallelisierte Gedanken (z.B. in Poesie) werden abgetrennt; vgl. Parallelismus membrorum ("Fallen auch tausend zu deiner Rechten / Zehntausend zu deiner Linken"). "Parallelisierte Gedanken" sind mehr als nur die beschreibende Erweiterung etwa eines Nomens (s.u. Regel 10)! - Die Leserichtung (vorn => hinten) ist einzuhalten.
    Liest man bis Gen 50,20c käme man nicht auf den Gedanken, 20b+c zu trennen (Infinitive werden nicht abgetrennt). Erst nach der Lektüre von 20d entsteht rückwirkend der Wunsch, die Parallelität von 20c/20d herauszustellen. Ein derartiges Argumentieren entgegen der Leserichtung sollte aber nicht Standard sein, sondern auf wenige Fälle beschränkt bleiben.

  8. Infinitiv-Konstruktionen ("um zu..." u.ä.) werden nicht abgetrennt, weil bei ebenfalls vorhandenem konjugiertem Verb der vom Autor gewollte Satzakzent auf diesem liegt und nicht gleich stark auf dem Infinitiv.
    Die neuen Rechtschreibregeln besagen, daß (erweiterte) Infinitive nicht mehr durch Komma abgetrennt werden. So gesehen ist unser Kriterium (8) - zuerst 1981 publiziert - dem Gang der Dinge um 1 1/2 Jahrzehnte voraus... - Erst recht zieht nicht die Argumentation, solche Infinitive könne man durch Nebensatz ersetzen, also hätten sie satzhaften Charakter, seien also abzutrennen: dabei wird eine zu erklärende Figur (Infinitiv) durch eine andere Figur (Nebensatz) beschrieben. Wenn beides äquivalent sein soll, bleibt unerläutert, wieso es die Verschiedenheit der beiden Figuren überhaupt gibt. Stattdessen ist die kommunikative Leistung der einen Figur zu analysieren - ohne das Ausweichen auf eine andere.

  9. Setzung eines neuen Themas: es wird (oft aphrastisch) eine inhaltliche Wendemarke im Text, auf die erst anschließend wieder ein vollständiger Satz folgt, gesetzt ("aber bezüglich des Mose, | so wissen wir ..."). Es können aber auch einzelne Glieder eines Satzes zur Betonung nicht-satzhaft vorangestellt werden ("Der Xaver, | der ist ein Schuft"). casus-pendens-Thematik. Weiteres Stichwort: Diskurs-Marker.
    z.B. weil kann so verwendet sein, daß die semantisch-kausale Verwendung/Bedeutung nicht im Vordergrund steht (allenfalls mitschwingt), stattdessen - pragmatisch - die Organisation des Diskurses wichtig ist. "Es markiert wichtige Übergangsstellen zwischen verschiedenen Diskurseinheiten...: (i) Einleitung von Zusatzinformationen [z.B. Gen 50,19c], (ii) Einleitung einer narrativen Sequenz, (iii) Einleitung eines thematischen Wechsels und (iv) konversationelles Fortsetzungssignal": C. GOHL; S. GÜNTHNER, Grammatikalisierung von weil als Diskursmarker in der gesprochenen Sprache: ZS 18/1 (1999) 39-75, S. 41f. Bei Funktion (i) leitet der Diskurs-Marker zu einer Explikation über, Funktion (ii) stellt die Weiche zu einer zum Verständnis anscheinend nötigen Zusatz-story, Funktion (iii) bereitet auf eine unmittelbar bevorstehende Umthematisierung vor, Funktion (iv) besagt: "Ich will das Wort behalten". In der Praxis werden sich die hier differenzierten Funktionen oft mischen. Derartige, in solchen Fällen nur scheinbaren Konjunktionen, gehören nicht auf die Ebene der semantisch-fiktionalen Textinhalte (=Wortsinn), sondern sie regeln das Zusammenspiel der Kommunikationspartner. Folglich ist dann die vermeintliche Konjunktion einer Interjektion äquivalent.
    Anderes Beispiel: E. GÜLICH sollte für ihre Diss. Adverbien untersuchen und stieß in einem Korpus auf nicht viele Belege, stattdessen auf "alors", "puis", "enfin", "bien", "ensuite" usw., d.h. Elemente, die oft vor einem Satz oder einer Äusserung standen, selbst keinen Satz darstellten, vielmehr Fragmente darstellten. Der Begriff "Satz" schien ungeeignet. Wir reden von "marqueurs discursifs". Üblicherweise als "Interjection" bezeichnet. Allerdings gibt es auch verbale Realisierungen: "tiens / tenez", "tu sais / vous savez" usw. - (Man könnte bayrisch: "A geh!" hinzufügen). Solche in gesprochener Sprache verstärkt auftretenden Elemente scheinen u.a. die Rolle der Interpunktion aus der geschriebenen Sprache zu übernehmen.
    nach: M Drescher, B. Frank-Job (eds.), Les marqeurs discursifs dans les langues romanes. Ffm 2006. S.12f.16.
    Für voilà stellen im gleichen Band Bruxelles/Traverso dreierlei Gebrauch fest: (i) Hinweisfunktion, Einverständnissignal, Gliederung, (ii) in monologischem Gebrauch nur Strukturierungsfunktion, (iii) Orientierung nach vorn oder zurück: "Les participants consacrent un certain temps de la réunion à la réalisation de la transition, temps qui leur permet de préparer l'introduction de l'activité suivante, mais leur laisse ausso l'opportunité de revenir en arrière pour introduire une expansion ou un ajot" (89).

  10. Vokativ (u.U. eingebettet - s.o. (3)), Aufmerksamkeit-erregende Partikeln, Interjektionen haben aufgrund ihrer eigenständigen, nämlich die Kommunikation steuernden/sichernden Funktion als eigene ÄE zu gelten.
  11. Jedes Glied der Prädikation kann zusätzlich beschrieben werden (vgl. Genitivverbindung, Apposition u.ä.; hier zusammengenommen unter: Adjunktion). "Zusatzbeschreibung" hat Affinität zu unmittelbarem Anschluß bzw. Kontaktstellung. Ist diese Verbindung von beschriebenem (=Signifikat) und beschreibendem (=Signifikant) Element aufgesprengt, so wächst die Wahrscheinlichkeit, daß der Autor die Zusatzbeschreibung als neue ÄE versteht. Dieses Kriterium läßt sich weiter präzisieren. Es sind folgende Fälle denkbar, wenn eine koordinierende Wortform vorliegt: "Zusatzbeschreibung" kann - außer durch Koordination (4 Formen: "und; oder; aber nicht; weder - noch") - auch erfolgen durch Deskription und Explikation. Deskriptive Erweiterungen ("Reis aus China") folgen dem prädikativen Vorbild und dürften wohl immer Kontaktstellung zum Beschriebenen fordern; dagegen ist bei Explikation größere Variation möglich: explizite Explikationsanzeiger ("der neue Bundeskanzler, also Schröder"), Asyndese ("der neue Bundeskanzler Schröder") wie auch die Möglichkeit zur Fernstellung bekannt ("der Bundeskanzler wurde gewählt, G. Schröder"). - Die Beantwortung der Frage, ob die Explikation im letzten Fall noch in der betreffenden ÄE liegt, oder schon eine neue ÄE darstellt, hängt von der Gewichtung ab, ob die Explikation etwa im Kontext weitere Folgen hat (z.B. eine Themasetzung darstellt - vgl. oben Regel (9)) und/oder ob die Fernstellung auffallend groß ist (d.h. mehrere Satzglieder, also nicht lediglich Adjunktionen) umfaßt.
  12. Bei Texten, die eine verbürgte optische Gliederung (z.B. Abschnitte, bewußter Zeilenwechsel) aufweisen (in der Regel nicht bei antiken Handschriften), wird auch diese als vom Autor gewollte Textsegmentierung berücksichtigt:
    Optische Gliederungen bzw. Gliederungszeichen (z.B. Petucha und Setuma im Hebräischen), die lediglich auf nachträgliche Herausgeber des Textes zurückgehen, zählen nicht zu diesem Kriterium.
    Neuer optischer Abschnitt = neue ÄE. Das gilt auch dann, wenn nur von den mitgeteilten Inhalten her sich eine ÄE-Grenze nicht aufdrängen würde. Vgl. auch die Zeilengliederung moderner Gedichte bzw. das Stilmittel "Enjambement". - Analoges gilt für die Satzzeichen: Schwache Trenner (Komma) können nicht als Kriterium genommen werden, sehr wohl jedoch :;.?!" u.ä. Bei Anführungszeichen beachten, ob sie den Wechsel von Handlungs- zur Redeebene anzeigen (und zurück). In diesem Fall: abtrennen! Oder dienen sie nur der "Hervorhebung" - wie in diesem Fall: nicht abtrennen!
  13. Während eine Prädikation - also bei einer phrastischen ÄE - in ihrer Basis immer als Verbindung zwischen zwei selbstständigen Bedeutungen zu sehen ist, bietet eine aphrastische ÄE immer nur ein nominales Element ohne Relation zu einer zweiten selbstständigen Bedeutung. (Andere Relationen, die sich in weiterem Kontext von satzhaften ÄEen finden, sind möglich. z.B. eine "Kausal"-Verknüpfung: "denn unser Bruder" (Gen 37,27d).) Dieses eine Element kann in sich sehr komplex sein. (Emphatisch verstärkt (Gen 37,13f), durch Adjunktionen unterschiedlichster Art erweitert (Gen 37,25g; 41,3c.10c; 42,15c)). Liegen somit irgendwo zwei derartige Sprachelemente vor, die - außerhalb der Prädikatsthematik - nicht in gewohnter Weise aufeinander bezogen werden können, so handelt es sich um zwei aphrastische ÄEen. Das Problem taucht z.B. bei doppelten Vokativen auf: "JAKOB, JAKOB!" (vgl. Gen 46,2cd), wo das zweite Element eben nicht eine Adjunktion zum ersten ist, sondern eine gleichwertige Wiederholung. Anders bei Vokativ mit Adjunktion: "a:Aber, b:Herr Vorsitzender, c:ich behaupte..."
  14. Signal: Wortwiederholung bei Näherbeschreibungen. Bisweilen liefert ein Autor eine Präzisierung und beginnt diese mit dem selben Wort wie das, was er beschreiben will. z. B. ..."ein überflüssiges Gefühl, ein Gefühl, über das Herr zu bleiben ..." (Nietzsche). Die Wiederaufnahme zeigt zweierlei an: (1) Unzweideutig wird angezeigt, dass auf das vorangehende Vorkommen Bezug genommen wird: genau dazu folgt nun eine weitere Info. (2) Weil das gleiche Bezugswort genommen wird, scheint es unter ÄE-Gesichtspunkten die gleiche Wertigkeit zu besitzen wie das Erstvorkommen. Der Autor setzt nochmals und neu an. Das spricht für eine neue ÄE.
  15. Wird via "und"-Anschluss (allgemeiner: Koordination) ein weiteres Prädikatsnomen angefügt (ohne erneutes Hilfszeitwort), so wird abgetrennt. z. B. "Das wäre aber äußerst peinlich | und verdächtig" (Kafka).
Diese Kriterien beanspruchen nicht vollständig zu sein. Auch haben nicht alle das gleiche Gewicht. In der Regel ergänzen sich mehrere Kriterien und führen zu einer Entscheidung. Unsicherheiten ergeben sich öfters bei der Frage der Parallelisierung und der Zusatzbeschreibung. Für die jeweiligen Sprachen lassen sich recht viele dieser Kriterien im Programm erfassen, so daß viele Standardsituationen automatisch analysiert werden. Diese Grob-Analyse verlangt aber eine Prüfung und Ergänzung um die Analyse der Fälle, die differenzierter zu beurteilen sind.
Zum Prädikationsverständnis: [1.Aktant=Inhalt a]=>[Prädikat=Relationstyp]=>[Inhalt b], das heißt bei dem Satz: "Ich ging": [1.Aktant=ich]=>[Prädikat=dynamisch-initiativ]=> [«GEHEN»]. - Verben mit obligatem 2. oder gar noch 3.Aktanten sind entsprechend mehrstellig. Es sollte hierbei jedoch nicht einfach hochgezählt werden (also ein traditionell als "transitiv" bezeichnetes Prädikat nun: 3-stellig, eines auch mit "indirektem Objekt" womöglich als 4-stellig). Denn die Valenzen der "Basis der Prädikation" sind den weiteren Aktanten hierarchisch vorgeordnet. - Orts- und Zeitangaben werden außerhalb dieser Relationen (=Valenzen) geführt.

Für eine automatische Textsegmentierung (Parsing) heißt das: durch Berücksichtigung der "starken" Satzzeichen, Definition der Gruppe von Konjunktionen (beiordnend, unterordnend - einschließlich ihrer Kombinierbarkeit), Interjektionen, Einbeziehung der optischen Gliederung u.ä. läßt sich ein syntaktisch (im trad. Sinn) unanalysierter Text bereits in hohem Maß und roh segmentieren. Es muß dann aber für die Erfassung der semantischen und pragmatischen Feinheiten eine Kontrolle und Korrektur durch einen kompetenten Sprachbenutzer erfolgen.

Letzteren Aspekt übersieht: SCHMITZ, KD, Automatische Segmentierung natürlichsprachiger Sätze. Sprache und Computer 3. Hildesheim 1986.
 
 
 
 
letzte Aktualisierung: 14. September 2010