4) BibleWorks 8: Korpuslinguistik und BW8

bibleworks8Diese Serie ist eine ausführliche Auseinandersetzung mit BibleWorks 8 (BW8). Neben der Rezension von Prof. Dr. Thomas Hieke, einer Rezension von Hans-Georg Wünch zu BW7 (in JETh 21 (2007), S. 219-221), der Rezension von Prof. Dr. Boris Repschinkski SJ und einem Vergleich zwischen SESB und BW8 existiert nämlich m. W. keine eingehende Würdigung von BW8 im deutschsprachigen Raum.

< 3) BW8: eine Predigt mit BW8 vorbereiten              5) BW8: Umwelt AT u. NT und BW8 >

Die computerunterstützte Korpuslinguistik ist ein aufstrebender Zweig innerhalb der Sprachwissenschaften (vgl. wikipedia). Mit Hilfe quantitativer und qualitativer Abfragen werden Textkorpora (Textsammlungen, die schnell mehrere Millionen an Wörtern enthalten) auf bestimmte Phänomene untersucht und daraus Rückschlüsse für die eigene Fragestellung gezogen. Der Vorteil eines solchen Unterfangens ist die induktive Vorgehensweise.
Inwieweit kann BW8 eine solchen Ansatz unterstützen? BW8 bietet hier – allgemein gesprochen – 2 Möglichkeiten. Zum einen die morphologisch vorbereiteten Textkorpora und den Keyword in Context (KWIC).

a) Bevor ein Korpus untersucht werden kann, muss er vorher vorbereitet, d. h. annotiert werden. Hier hat BW8 einen Vorsprung, weil viele zur Verfügung stehende Korpora bereits entsprechend aufbereitet sind.
Beispiel (aus dem Hilfetext):

agapate = agapaw@vdpa2p
hgaphsen = agapaw@viaa3s
In den sog. morphologischen Versionen ist jedes einzelne Wort (Token) annotiert, d. h. hinter dem @-Zeichen folgt die konkrete grammatikalische Bestimmung des Wortes. In diesem Fall „v“ für Verb, „i“ bzw. „d“ für Indikativ bzw. Imperativ usw. Dadurch steht mir die Möglichkeit zur Verfügung, exakte grammatikalische Abfragen zu machen.
Momentan bietet BW8 für folgende Textkorpora eine morphologische Version an:

Greek

BGM BibleWorks LXX/BNT (NA 27) Morphology

BYM Robinson-Pierpont Morphology

BYZ Robinson-Pierpont Majority Text (2005)
GNM AGNT2 Friberg GNT Morphology

PHM Works of Philo Morphology
SCM Scrivener 1894 NT Morphology
STM Stephanus 1550 Morphology
TIM Tischendorf NT (8th ed.) Morphology
WHM Westcott and Hort NT Morphology
Hebrew/Aramaic

CGM Targum Cairo Geniza (Morphology)

FTM FragTargums, TgSheniSuppEsther, TgTosefProphets Morphology
NFM Targum Neofiti Morphology

NMM Targum NeofMarginalia Morphology

PJM Targum PseudoJonathan Morphology
TAM Targumim Morphology (Mostly Onkelos and Jonathan)  (updated 2005)

WTM Westminster Hebrew OT Morphology (Version 4.10)

Anhand statistischer Berechnungen kann der Nutzer Hypothesen bilden (siehe dazu), ob ein bestimmter Terminus signifikant häufig in einem Korpus erscheint, ob bestimmte grammatikalische Formen überwiegen usw.

b) Keyword in Context (KWIC)

KWIC erlaubt auch nicht annotierte Textkorpora auf sprachlich-syntaktische Phänomene zu untersuchen.Wenn ich z. B. die Kookkurenzen rund um den Begriff ἔργον im Johannesevangelium untersuchen möchte, ergibt sich folgende Übersicht.
In der Tabelle erkenne ich, welche Worte mit ἔργον kookkurieren. Hieraus lassen sich verschiedene Schlüsse ableiten, z. B. das πιστεύετε 5x in der Nähe des zu untersuchten Begriffs erscheint. Indem ich πιστεύετε auswähle, zeigt mir BW8 die syntaktische Stellung von Substantiv und Verb und ich kann hier diverse Beobachtungen ableiten.
Eine solche Untersuchung ist deshalb wichtig, weil häufig der Kontext die Semantik eines Wortes mitprägt und es daher bei semantischen Analysen auf die usuellen Wortverbindungen ankommt (vgl. z. B. „Werke des Gesetzes“ bei Paulus).

Eine Ergänzung zur Analyse von Texten kann auch noch die Funktion Phrase Matching Tool bieten. Indem der Nutzer von einem konkteten Vers ausgehend Tools / Analyzing the Text / Phrase Matching Tool aufruft, erhält er mögliche Wiederholungen ähnlicher Phrasen in anderen Stellen. Großartig!

Kommentar verfassen