(Ausdrucks-) Syntax

 

Die "Syntax", die hier als erster Schritt im Rahmen der Folge Syntax - Semantik - Pragmatik verstanden wird, hat einen völlig anderen, d.h. sehr viel engeren und präziseren Zuschnitt, als das "Syntax"-Verständnis in Schulgrammatiken ("Satzlehre") oder auch im Bereich der Chomsky-Tradition, wo jeweils Ausdrucks- und Bedeutungsanalysen vermischt werden und zudem Textanalyse nicht vorgesehen ist. Vgl. die Erläuterungen in einzelnen Publikationen.

Nebeneffekt der Neuorientierung: Es wird auf natürliche Sprachen das gleiche Syntax-Verständnis angewendet, wie es im Rahmen der Informatik im Fall von Programmiersprachen benutzt wird.

Das Ausdrucksrepertoire einer Sprache kann automatisch vom Computer in vier verschiedenen Feldern distributionell untersucht werden, und zwar inhaltsfrei:

  1. Morphologie, Strukturierung des Repertoires an Ausdrücken einer Sprache
  2. ad a:


  3. Wortschatz eines Textes

    innerhalb eines gegebenen Textes die Wortformen-Distribution

  4. ad b: Textvergleich aufgrund von Wortdistribution


  5. Verhältnis: Einzeltext - Textkorpus

    aus einem gegebenen Text heraus die Suche im umgebenden Korpus nach geprägter Sprache (stehende Wendungen, Formeln, Anspielungen usw.). Am besten - vgl. Beitrag PACH - der Einzeltext wird insgesamt als Suchtext (=Suchkriterium) definiert: das Programm sucht nach den dort gegebenen Wortverbindungen im angegebenen Textkorpus. Ein unterer Schwellenwert wird eingegeben (z.B. mindestens 3 Wortformen hinter einander), nach oben ist die Länge der Wortformen-Kette offen, die in identischer oder ähnlicher - z.B. auch permutierter - Form im Korpus gefunden wird.

  6. ad c:

  7. Verhältnis Einzelsprache x : Einzelsprache y

    Man kann den Lempel/Ziv-Algorithmus, der bei Kompressionen eingesetzt wird (gzip, compress, zip, Stacker, WinZip), auch dazu verwenden, Verwandtschaft und Differenz zwischen Einzelsprachen darzustellen. Auch die Ermittlung von Autoren aufgrund des Vergleichs der Zusammensetzung und Verbindung der verwendeten Wörter ist möglich. (Referat Markus Stengel)

  8. ad d:

Zu den einzelnen Bereichen gibt es inzwischen ausführliche theoretische und praktische Erfahrungen, lauffähige Programme.

 
 
Startseite  |  letzte Aktualisierung: 14. September 2010