textei.net — Hilfe

Zurück zur Hilfe-Hauptseite.

Die Textsprache

Wir führen die Textsprache ein, eine formale Sprache zur Abfrage von Texten. Sie ist auch die Sprache der hiesigen Text-Engine, so dass jede Seite, in der man einen Auszug anfordern kann, auch einen beliebigen Ausdruck in der Textsprache annimmt. Außerdem lässt sich die Text-Engine über das WWW mit der Textsprache programmatisch abfragen.


Grundlagen

Das Wort

Ein Wort der Textsprache besteht aus einer Reihe von Buchstaben und anderen Zeichen (ausgenommen: Leer-, Interpunktions- und Gleichheitszeichen). Es gibt verschiedene Wortarten je nach Art der Angabe (siehe unten).
Beispiele (5 Wörter): Taube, Nicht-Wissen, intuitiv*, 1:3# und no.

Der Satz

Der einfache Satz der Textsprache besteht aus einer Angabe in der Form: <Angabetyp> = <Wort1> <Wort2> … <Wortn>. Die Leerzeichen trennen die Wörter. Die Wörter müssen dem Angabetyp entsprechen. Die gültigen Angabetypen, die auch die Bedeutung des Satzes bestimmen, werden unten im Einzelnen spezifiziert. Zwischen dem Angabetyp und den Wörtern sind Leerzeichen nicht zwingend.
Beispiele (3 einfache Sätze): wordform = Taube, uti = 1:3# und wordform=intuitiv* discursiv*.

Der zusammengesetzte Satz der Textsprache besteht aus mehreren einfachen Sätzen, die durch Leerzeichen getrennt werden. Wenn mehrere Angaben sich widersprechen, indem sie für denselben Angabetyp verschiedene Werte vorschreiben, wird nur die letzte Berücksichtigt.
Beispiel (1 zusammengesetzter Satz): wordform = Hume uti = 5:11#.
Beispiel (falsch): wordform = Hume wordform = Leibniz (nur „Leibniz” wird berücksichtigt).
Beispiel (richtig): wordform = Hume Leibniz.

Der Textauszug

Ein Satz der Textsprache bedeutet einen Textauszug. Ein jeder Satz der Textsprache bestimmt eine Ansicht eines Textes, die aus ausgewählten Sätzen des Textes besteht, während der Rest ausgelassen wird. Der Textauszug kann benutzt werden, um Fragen hinsichtlich des Textes zu beantworten, und auch um Thesen über den Text zu begründen.

Der Textauszug wird inhaltlich durch die Angaben bestimmt. Es folgt die Beschreibung der einzelnen Angabetypen.


Grundangaben

Der Text (text)

Mit der Angabe text = <Bezeichnung> wird der Text bestimmt, aus dem der Auszug gezogen werden soll. Zurzeit besteht das Korpus allein aus der Kritik der reinen Vernunft und ist die einzig gültige Angabe text = kant/krv (wahlweise kant.krv).

Wortform (wordform)

Mit einer Angabe wordform = <Wortform> werden die Sätze des Textes ausgewählt, in denen das angegebene Wort genau in dieser Form vorkommt. Die Wortformen werden wie in der unterliegenden Textausgabe geschrieben, wobei Groß- und Kleinschreibung relevant ist, und können das Zeichen * als Platzhalter für beliebige Buchstaben enthalten. Beispiele: 1. Um nach dem Wort Philosoph in beiden Formen (Philosoph, Philosophen) zu suchen, kann man die Angabe wordform = Philosoph Philosophen benutzen. 2. Die Angabe wordform = Philosoph* trifft auf alle Vorkommen von „Philosoph” und alle Wörter, die mit Philosoph- anfangen, wie „Philosophen” und „Philosophie”, zu. In dem Textauszug werden alle Treffer graphisch hervorgehoben.

Wenn diese Angabe am Anfang des Satzes vorkommt, lässt sie sich einfach als <Wortform> ausdrücken. (Dies vereinfacht die Ausdrücke, die ja häufig Wortformen enthalten, und ermöglicht sogar einfache Abfragen ohne etwas von der Textsprache zu wissen.)
Beispiel (richtig): wordform = Hume uti = 5:11#.
Beispiel (richtig): Hume uti = 5:11#.
Beispiel (falsch): uti = 5:11# Hume.

Operation (op)

Wenn mehrere Wortformen angegeben werden, wird mit einer Angabe op = <Operation> bestimmt, welche Sätze ausgewählt werden. Mit op = and (oder auch, wenn keine Operation angegeben wird) werden nur die Sätze ausgewählt, in denen alle Wörter vorkommen, mit op = or die Sätze, die eins oder mehr der Wörter enthalten.

Textbereich (uti)

Mit einer Angabe uti = <UTI> werden bestimmte Textbereiche ausgewählt. Beispiel: Die ganze Einleitung der KrV erhalten Sie mit der Angabe uti = 5:11#. Wenn mehrere Bereiche angegeben werden (wie in uti = 6#2.2 10#2.3) werden sie alle ausgewählt. Eine vollständige Beschreibung der Uniformen Textstelle-Identifizierung (UTI) befindet sich hier.

Wenn man keinen Textbereich angibt, so muss man unbedingt Wortformen angeben und wird der ganze Text danach durchsucht. Wenn man einen Textbereich aber keine Wortformen angibt, wird der Textbereich ohne Hervorhebungen ausgegeben. Wenn man beide angibt, werden die Wortformen nur innerhalb des Textbereiches gesucht und nur die Sätze ausgegeben, in denen die Wortformen vorkommen.


Andere Angaben

Die folgenden Angaben sind vor allem dann nützlich, wenn Sie die Text-Engine von Ihrer Website aus abrufen, weil sie mehr Kontrolle über die Ausgabe bieten.

Überschriften unterdrücken (titles)

Die Angabe titles = no hat zur Folge, dass im Auszug keine Überschriften ausgegeben werden.

Werkbezeichnung (workname)

Mit der Angabe workname = <Bezeichnung> lässt sich eine beliebige Bezeichnung vor der Stellenangabe einfügen. So führt zum Beispiel uti = 7#3.11 workname = KrV dazu, dass am Rande statt nur „7#3” „KrV 7#3” steht.

Erster Satz (first)

Wenn ein Auszug eine bestimmte Satzanzahl übersteigt, wird er nicht vollständig auf einmal ausgegeben, sondern in mehreren Seiten. Die Angabe first = <N> führt dazu, dass der Auszug ab den N-ten Satz ausgegeben wird.

Satzanzahl (limit)

Die vorherbestimmte Anzahl von 50 Sätzen, die in einer Seite maximal gezeigt werden, kann man mit der Angabe limit = <N> verkleinern (sie zu vergrößern, ist nicht zulässig).

Nächste Satzanzahl (next)

Die Angabe next = <N> ermöglicht eine andere Satzanzahl für die erste Seite als für die darauf folgenden Seiten. So ist beispielsweise limit=3 next=50 nützlich, wenn man zunächst nur die ersten 3 Sätze zeigen, danach aber die normale Seitengröße bekommen möchte. Außerdem lässt sich verhindern, dass ein Link „mehr…” zu den nächsten Seiten gezeigt wird, indem man next=0 angibt.


Zugang zur Textsprache

Man hat Zugang zur Textsprache auf jeder Seite, auf der man einen Textauszug abrufen kann. Statt Wörter kann man grundsätzlich einen Satz in der Textsprache eingeben.

Dies hat zur Folge, dass man überall alle Möglichkeiten der Textsprache einsetzen kann, auch wenn dies aus der Benutzeroberfläche nicht ersichtlich ist. So sieht man etwa auf der Seite zum Zitieren, dass man zwischen der Suche nach „allen” und „einigen” Wörtern auswählen kann. Man kann aber auch dort die Suche auf einige Sätze oder Absätze begrenzen, indem man eine Angabe „uti = <UTI>” (z. B. Hume uti=5:11#) macht.

Wenn Sie eine eigene Website betreiben, können Sie auch gern Ihren Besuchern Zugang zur Text-Engine verschaffen. Hier finden Sie die Beschreibung aller Schnittstellen zur Text-Engine.

Zurück zur Hilfe-Hauptseite.