x-y-z-Achse und vielleicht noch Farbe der Punkte; bei vier Dimensionen ist üblicher Weise Schluss mit der Visualisierung. Es fällt uns schwer, mehr als vier Informationen auf einem Punkt gleichzeitig wahrzunehmen.
Es gibt dabei eine sehr einfache Lösung:
Parallelkoordinaten (parallel coordinates).
Statt den Raum mit kartesischen Koordinaten aufzuziehen – d. h. mit unabhängigen Achsen, die sich im Ursprung des Koordinatensystems treffen – betrachtet man die Dimensionen zunächst einzeln: Jede Dimension wird auf einer Achse eigenen abgetragen, diese Achsen werden parallel Angeordnet.
Der Punkt – im kartesischen Koordinatensystem ja ein Punkt, wie man das Wort in der Alltagssprache verwendet – wird im Parallelkoordinatensystem dargestellt als Verbindungslinie seiner Koordinaten auf den Achsen.
Einer der größten Vorteile der Parallelkoordinaten liegt in der schnellen Aufdeckung von Korrelationen: Zusammenhängende Variablen führen zu mehr oder weniger parallelem Verlauf der Linien, die die Punkte darstellen.
Ein weiterer Vorteil liegt in der einfachen Analyse von Ausreissern: einfach der Linie folgen, die in einer Dimension weit außen liegt.
Hier ein Beispiel:
Drei Punkte und vier Dimensionen. Punkt 1 hat die Koordinaten (20,27,80,20).
Hier ein Anwendungsbeispiel:
Dargestellt ist eine Stichprobe von Neuwagen – Verbrauch, Leistung, Anzahl der Zylinder, Masse, Beschleunigung und Baujahr sind die jeweiligen Dimensionen. Dunkel eingefärbt sind die Autos mit vier Zylindern: es wird sofort deutlich, welche Variablen eine hohe Korrelation aufweisen – der “Strang” läuft mehr oder weniger parallel – oder welche nicht zusammenhängen – die Linien laufen kreuz und quer.
Als Softwarepaket bietet – wie so oft – xgobi eine gute Umsetzung der Parallelkoordinaten zur statistischen Analyse: Link zu xgobi
Kommentare (1)