Nichtkartographische Visualisierung:
Allgemeine Informationen
Dot plot
(horizontal and vertical) - Punktediagramm (horizontal und vertikal)
Scatter plot - "Streu"-Graphen
Scatter plot
matrix - Matrix aus "Streu"-Graphen
Parallel coordinates
plot - Diagramm mit parallelen Koordinaten
Classifier
(horizontal and vertical) - Klassifizierer (horizontal und vertikal)
Markierungen
Das Diagramm reagiert auf Mausoperationen. Sobald die Maus auf eine
Linie oder einen Punkt zeigt, werden sie markiert. Daraus ergibt sich die
Möglichkeit, die Werte des zugehörigen Objekts einzuschätzen und
seine Attribute mit den Attributen aller Objekte zu vergleichen.
Das Klicken
auf eine Linie oder einen Punkt bewirkt eine dauerhafte Markierung (bis sie
explizit aufgehoben wird). Somit können ausgewählte Objekte mit
anderen Objekten verglichen werden. Zusätzlich kann man nun auf andere
Objekte zeigen, welche dann vorübergehend markiert werden. Die zu
vergleichenden Objekte können dann leicht unterschieden werden, da sich die
vorübergehende und die dauerhafte Markierung in der Farbe unterscheidet
(schwarz und weiß).
In Descartes sind alle Diagramme miteinander
verbunden, so daß eine Markierung in einer Darstellung gleichzeitig in
allen Darstellungen erfolgt. Somit können die Objekte von allen
Perspektiven aus untersucht werden.
Das Untersuchen von Daten beinhaltet
des öfteren die Aufgabe des Vergleichens von Attributwerten
ausgewählter Objekte, sowie von den Werteintervallen einiger Attribute.
Solche Aufgaben werden relevant, wenn die zu untersuchenden Attribute auch
vergleichbar sind, d.h. wenn sie im selben Maßstab angegeben sind, oder
semantisch verbunden sind. Beispiele solcher Daten sind Flächendeckende-,
oder Flächennutzungsstatistiken, Aufteilung der Bevölkerung in
Altersgruppen, Beschäftigung, oder Familienstand, Geburten-, oder
Sterberaten, etc.
Das System erlaubt einfaches Wechseln zwischen den
verschiedenen Skalierungsarten der parallelen Koordinaten.
Mehr Informationen der Entscheidungshilfe werden auf dieser Seite gegeben.
Dot plot (horizontal and vertical)
Eine Art Attribute darzustellen ist mit Hilfe von "dot plots" (Punktgraphen), entweder horizontal (Abb. 1), oder vertikal (Abb. 2). Der Graph ist ein Balken mit äquidistanten Linien, welche den Balken in 10 Abschnitte unterteilen. Jeder Wert wird durch einen kleinen Kreis abgebildet. An jedem Ende des Graphen werden die jeweiligen Extremwerte in schwarzen Zahlen angegeben. Die dreieckigen Begrenzer an den Enden des Balkens erlauben den anzeigenden Wertebereich auszuwählen. Dieser Bereich kann aufgrund einer Art Vergrößerung näher betrachtet werden, welches ein paar Transformationen beinhaltet. Die Werte außerhalb dieses Intervalls werden auf dem Graphen nicht mehr angezeigt. Die Punkte sind dann nicht mehr so geballt und die Verteilung kann deutlicher erkannt werden. Es wird einfacher sich auf die zu untersuchenden Werte zu konzentrieren (siehe Abb. 1). Nur die horizontale Darstellung zeigt die Grenzen des Intervalls an (unter dem Graphen in blauen Zahlen).
Abb. 1
Portugal - Horizontaler Punktgraph -
%_of_Pop_by_age_>=65
Abb. 2
Portugal - Vertikaler Punktgraph -
%_of_Pop_by_age_>=65
Der "scatter plot" ("Scatter"-Graph) hat eine 10x10 Rasterung. Die Position eines Punktes
kann mit den X und Y Koordinaten der Rasterung angegeben werden. Somit nehmen X
und Y Werte zwischen 1 und 10 an.
Mehrere Punkte können durch
Mausziehen auf einmal markiert werden. Falls ein paar Punkte dadurch nicht
erfaßt worden sind, können sie mit einem Mausklick der Markierung noch
hinzugefügt werden, oder so auch wieder entfernt werden. Die Markierung
aller Punkte kann mit einem Klick auf eine objektfreie Fläche aufgehoben
werden.
Abb. 3
Portugal - Scatter plot
Diese Matrix ist eine quadratische Matrix, mit den Namen der Attribute auf der Diagonalen und "Scatter"-Graphen überall sonst. Die Achsen der Graphen werden durch die Einträge der Diagonalen gegeben. Zum Beispiel Abbildung 4: die Achsen des Graphen an der Position (Zeile 2, Spalte 1) sind durch "% of Pop by age 15-24" auf der horizontalen und "total employed in Industrie 1991" auf der diagonalen gegeben. Die Graphen können wie ein normaler "Scatter"-Graph manipuliert werden.
Abb. 4
Portugal - Scatter plot matrix
Die Achsen eines Graphen mit parallelen Koordinaten können entweder
horizontal oder vertikal ausgerichtet sein. Die Orientierung hat keinen
Einfluß auf die Interpretation und die Nutzung des Diagramms. In dieser
Implementation sind die Achsen horizontal und untereinander plaziert.
In
der Standardform des Graphen (mit der Ausrichung:
"Individual Min and Max") entspricht die Position am weitesten links dem
Minimum des jeweiligen Attributes, und die am weitesten rechts dem Maximum.
Diese Positionen auf den Achsen sind untereinander in Linie gebracht (Abb.
5).
Abb. 5
Europa - "Parallel coordinates
plot"- Individual Min and Max - Altersgruppen
Für die Aufgabe des Vergleichs der Werte und des Wertebereichs ist die Standardform des Diagramms unpassend. Die Achsen sollten so skaliert sein, daß die gleichen Positionen auf den Achsen gleiche Werte repräsentieren. Solch eine Skalierung ist in Abb. 6 abgebildet. Das Diagramm zeigt die gleichen Daten, wie in Abb. 5: Prozentualer Anteil der Bevölkerung Europas in 3 Altersgruppen (0-14 Jahre, 15-64 Jahre und mehr als 65 Jahre). Man kann deutlich erkennen, daß der Anteil der 15-64 jährigen in allen Ländern am größten ist. Solch ein extremer Fall wurde ausgewählt, um den Unterschied der vorgeschlagenen Skalierungen zum "Standard" zu demonstrieren.
Abb. 6
Europa - "Parallel coordinates
plot"- Common Min and Max - Altersgruppen
Ein wichtiger Punkt in der Erforschungsanalysis ist die Untersuchung der
Beziehungen von Attributen. Dies involviert den Vergleich von
Werteveränderungen verschiedener Attribute und die Suche nach Beziehungen
zwischen den Attributen. Ein Graph mit parallelen Koorinaten unterstützt diese
Aufgabe. Auf diese Weise sind die Attribute benachbarte Linien, welche fast
parallel verlaufen, positiv korreliert. Falls fast alle Linien entweder eine
nordost-südwest oder eine nordwest-südost Orientierung haben, sind
die Attribute negativ korreliert. Offensichtlich kann man die Reihenfolge der
Attributachsen verändern um solche korrelierten Attribute zu finden. Es
könnte auch nützlich sein die Achsen zu vertauschen.
Eine weitere
Möglichkeit Objekte miteinander zu vergleichen geschieht durch "Selected
object(s)" (ausgewählte Objekte) (Abb. 7). Hier werden die Linien der
ausgewählten Objekte zentriert und die Achsenskalierungen angepaßt. Wenn
mehrere Objekte ausgewählt worden sind, berechnet Descartes den
Durchschnitt und verwendet diesen.
Abb. 7
Europa - "Parallel coordinates
plot" - Selected object(s) - Altersgruppen
Jedoch kann die kanonische Form des Graphen
unpassend sein, wenn die Daten Ausreißer hat, d.h. Werte, die von den
anderen, gebündelten Werten weit entfernt sind. Das Vorhandensein von
Ausreißern erschwert die Aufgabe, in Beziehung stehende Attribute zu
finden, sowie Objekte zu vergleichen. In solch einem Fall können zwei
Methoden angewendet werden: 1.) Normierung durch "median and quartiles"; und
2.) Normierung durch "mean and standard deviation".
Eine weiter Variante der
Achsenskalierung wird in Abb. 8 gezeigt. Die Achsen sind so angeordnet,
daß die Mittelwerte und der erste und zweite "quartile" aller Attribute
auf der selben vertikalen Linie liegen. Die Positionen der restlichen Werte
werden durch linearer Interpolation gefunden.
Abb. 8
Europa - "Parallel coordinates
plot" - Medians and Quartiles - Altersgruppen
In Abb. 9 sind die Positionen am weitesten links und am weitesten rechts auf den Achsen sind übereinander gereiht, welches manchmal den Vergleich einiger Attribute erleichtert.
Abb. 9
Europa - "Parallel coordinates
plot" - Min-Max, Medians and Quartiles - Altersgruppen
Auf ähnlicher Weise wird in der zweiten Variante die Werte X , X-õ und X+õ für die Achsenskalierung benutzt (hier sind X das arithmetische Mittel und õ die Standardabweichung). Diese Variante wird in Abb. 10 gezeigt. Nebst der Neutralisation der Ausreißer, sind beide Variationen der Skalierungen für die Untersuchung genereller Charakteristika der Werteveränderungen zu gebrauchen.
Abb. 10
Europa - "Parallel coordinates
plot" - Means and Std. deviations - Altersgruppen
Abbildung 11 zeigt ein unpassendes Beispiel für Standardverteilung...
Abb. 11
Europa - "Parallel coordinates
plot" - Standard deviation - Altersgruppen
Classifier (horizontal and vertical)
Klassifizierer werden in einem separaten Fenster geöffnet, in dem entweder ein horizontaler oder vertikaler Balken abgebildet ist. Diese nichtkartographische Visualisierungsmethode wird genauso verwendet wie die Klassifizierungsmethode, welche hier beschrieben wird.