Bedienungsanleitung

- Zum Starten bitte die ausführbare .exe Datei im Ordner bin ausführen.


Nach Programmstart öffnet sich das Hauptfenster des Programms. Dieses gliedert sich in drei Teile: Menüleiste, Suchleiste und Viewport:


Im Menü kann man Textdateien öffnen, das Programm beenden, die Ansicht wechseln, nach Wörtern im Suchergebnis suchen oder Darstellungsparameter verändern. Unter dem Menü befindet sich die Suchleiste. Hier werden primäre Suchbegriffe eingegeben, durch Klick auf den "Suchen"-Button wird schließlich gesucht. Darunter befindet sich der Viewport - eine große Fläche zur Darstellung des Suchergebnisses.


Workflow:

Nach Programmstart ist zunächst kein Datensatz geladen. Klicken Sie auf Datei und danach auf Öffnen, um einen Textdatensatz zu laden. Hierbei sind beliebige plaintext-Files zulässig. Je nach Größe der Datei kann das Laden einige Sekunden dauern.

Anmerkung: Unser Programm interpretiert das Leerzeichen (blank space) sowie Zeilenumbrüche (return) als Trennzeichen zwischen den Wörtern.

Nach dem Laden einer Textdatei wird eine Liste der häufigsten Wörter im Text angezeigt. Jedoch werden hier einige unwesentliche Wörter, sogenannte stopwords, wie etwa and, or, I, you, etc. ignoriert. Dies soll dazu dienen, um einen ersten rudimentären Blick auf den Text zu erhalten. Das Verhältnis der Schriftgrößen der Wörter zueinander entspricht dem Verhältnis der Häufigkeiten im Text. Die folgende Abbildung zeigt die Top-Words-Liste nach Laden der Bibel:




Nun kann man bereits nach Wörtern suchen. Man gibt dazu in die Suchleiste einfach ein Wort oder eine Wortfolge, getrennt durch Leerzeichen ein. Nach jedem Druck auf die Leertaste wird der Word Tree für die bisher eingegebene Wortfolge aufgebaut und angezeigt. Nach dem letzten Wort kann man entweder ein erneutes Leerzeichen schreiben, oder durch Druck auf die Entertaste oder Klick auf den Suchen-Button den Baum aufbauen lassen.

Der Word Tree:


Die obenstehende Abbildung zeigt einen Word Tree, der zum primären Suchbegriff "Mary" alle Vorkommnisse in der King James Bibel gemeinsam mit den jeweils darauffolgenden Begriffen anzeigt. Die Kanten im Graph erhöhen die Lesbarkeit der Textstellen. Der Baum verzweigt ausgehend vom primären Suchbegriff so lange, bis jeder Satz eindeutig identifizierbar ist. Alle weiteren, zur Unterscheidung nicht mehr notwendigen Wörter bis zum Satzende werden grau (weniger auffällig) dargestellt. Die Schriftgröße eines einzelnen Wortes w gibt Aufschluss über die relative Häufigkeit der Wortfolge {Wurzel,...,w} im Vergleich zu den anderen Wörtern derselben Ebene. Aus der obigen Darstellung wäre bspw. ersichtlich, dass "Mary Magdalene" wesentlich häufiger vorkommt als etwa "Mary was". Generell werden die Wörter in tieferen Ebenen kleiner dargestellt. Dies dient der Steigerung der Übersicht, verhindert aber den direkten Vergleich der Häufigkeit von Wörtern unterschiedlicher Ebenen miteinander. Möchte man gerne eine direkte Abbildung der absoluten Häufigkeit der Wortfolge {Wurzel,...,w} auf die Schriftgröße haben, so kann man unter Optionen/Häufigkeitscodierung die Darstellungsart auch auf relativ zur Gesamtheit anstelle von relativ zur Ebene setzen. Darunter leidet aber meist die Lesbarkeit größerer Bäume.

Die Anordnung der Kindknoten eines Wortes im Baum enstpricht defaultmäßig der Anordnung des ersten Auftretens der Wortfolge {Wurzel,...,w}. Alternativ dazu kann man die Kindknoten auch alphabetisch oder nach Häufigkeit sortiert anzeigen lassen. Dazu dient das Auswahlfeld Sortierung im Optionen-Menü. Im obigen Beispiel "Mary" wurde die Reihung nach Häufigkeit durchgeführt. Im Folgenden zeigen wir exemplarisch, wie die drei verschiedenen Anordnungsmodi sich auf die Darstellung auswirken:


Nach erstem Vorkommnis

Alphabetisch gereiht

Nach Häufigkeit im Text


Außerdem kann man im Optionsmenü noch die Schriftart der Darstellung festlegen und die Länge der Bezierkurven zwischen den Verzweigungswörtern verändern:




Navigation im Baum:

Da ein Word-Tree mitunter recht groß und etwas unübersichtlich sein kann, stellen wir verschiedene Werkzeuge zur Navigation im Baum zur Verfügung. Mithilfe des Mausrads kann man hinaus- und hineinzoomen, um mehr Übersicht zu erhalten oder um Details genauer zu betrachten. Der Viewport lässt sich außerdem durch gedrückt-Halten der rechten Maustaste und gleichzeitigem Verschieben der Maus horizontal und vertikal bewegen.

Stellt man fest, dass nur ein Teilbaum des erhaltenen Suchbaums von Interesse ist, so kann man die Ansicht auf jenen Teilbaum reduzieren, indem man mit der linken Maustaste auf die Wurzel dieses Teilbaums klickt. Ein Beispiel: Man sucht nach "Mary" und erhält einen großen Baum, stellt aber fest, dass einen besonders die Ergebnisse zu "Mary Magdalene" interessieren. Also klickt man auf "Magdalene" und reduziert somit die Darstellung auf den relevanten Teilbaum. Möchte man jedoch danach wieder zum ursprünglichen Baum zurückkehren, genügt ein Linksklick auf die Wurzel "Mary", und der übergeordnete, größere Baum wird dargestellt. Die Übergänge zwischen den einzelnen Baumdarstellungen werden flüssig dargestellt, damit man den Fokus nicht verliert.

Stößt man während dem Betrachten eines Baums auf ein besonders interessantes Wort, kann man mittels Strg+Linksklick auf dieses Wort sofort den Word Tree zu diesem Wort darstellen.

Große Bäume:

Gibt es sehr viele Vorkommnisse eines gesuchten Wortes in einem Text, wie etwa "bread" in der Bibel, kann der resultierende Baum etwas unübersichtlich werden. Dazu wurde im Originalpaper vorgeschlagen, auf Wunsch des Benutzers einen Großteil der Knoten des Baum zu entfernen und nur jene zu behalten, die mindestens einen gewissen Prozentsatz der Vorkommnisse enthalten. Im folgenden Beispiel wurden aus dem Baum für "bread" alle Knoten entfernt, die weniger als 5 Prozent der Vorkommnisse eines Elternknoten beinhalten:


Baum für "bread"

Auf die wichtigesten Knoten (>=5%) reduziert

Sehr große Bäume:

Gibt es extrem viele Vorkommnisse eines gesuchten Wortes in einem Text, wie etwa LORD in der Bibel, so wird der riesige Baum meist komplett unlesbar. Auch wird die Performance bei der Darstellung meist derart schlechter, sodass Zoomen und Verschieben zwar möglich sind, aber mühsam sein können. Passt man die Länge der Bezierkurven an, erkennt man jedoch zumindest die Struktur des Baums halbwegs gut:



Suchen im Ergebnisbaum:

Als eigene Erweiterung haben wir implementiert, dass innerhalb eines Suchbaumes nach sekundären Suchwörtern gesucht werden kann. Möchte man also beispielsweise alle Stellen in der Bibel finden, an denen Jesus und Johannes gleichzeitig vorkommen, so kann man im Baum zu "Jesus" nach dem Sekundärbegriff "John" suchen. Das Programm hebt dann alle gemeinsamen Vorkommnisse farblich hervor. Außerdem kann man von einem gemeinsamen Vorkommnis zum nächsten bzw. vorigen springen (Tasten F3, F4 bzw. über das Menü Suchen). Hierzu sei aber erwähnt, dass bei einer Suche um Jesus-Baum nur jene gemeinsamen Vorkommnisse gefunden werden, bei denen das Wort John nach dem Wort Jesus vorkommt. Möchte man also wirklich alle gemeinsamen Vorkommnisse erfassen, muss man zusätzlich auch im John-Baum nach Jesus suchen.