Tabellenkalkulation: Grafiken erstellen

Angeblich sagt ein Bild mehr als tausend Worte. Für mit einer Tabellenkalkulation erstellte Diagramme gilt das normalerweise nicht. Eine schlichte Tabelle ist oft wesentlich aussagekräftiger als ein Tortendiagramm.

Auswahl der zugrunde liegenden Daten

Berechnen Sie Daten, die Sie darstellen möchten oder normalisieren Sie Daten, bevor Sie ein Diagramm erstellen. Beispiel: Bei einem Umsatz in Millionenhöhe sollten Sie Beträge nicht in Euro, sondern in Tausend Euro darstellen.

Falls Sie große Datenmengen auswerten müssen, fassen Sie diese Werte vorher zusammen, zum Beispiel mit einer Pivot-Tabelle oder arbeiten Sie mit Stichproben. Beim Punktdiagramm ist bei Excel bei etwa 32000 Punkten Schluss, bei OpenOffice schon deutlich früher. Einige Diagrammtypen, die Sie beim wissenschaftlichen Arbeiten brauchen – zum Beispiel Histogramme – werden von Tabellenkalkulationen gar nicht oder nicht richtig unterstützt. Verwenden Sie in solchen Fällen die Tabellenkalkulation zur Datenaufbereitung und ein Programm wie R zur Diagramm-Erstellung. Wenn Sie viel mit Diagrammen arbeiten oder Diagramme erstellen müssen, die beeindruckend aussehen, lohnt sich die Einarbeitung in Excel~2010. Informieren Sie sich auch über Sparklines und bedingte Formatierung. Excel besitzt hier Alleinstellungsmerkmale.

So erleichtern Sie sich die Arbeit: Die Daten liegen in einem rechteckigen Bereich vor. In diesem Bereich gibt es nichts, was nicht zur Grafik gehört. Beschriftungen bringen Sie links und oberhalb dieses Bereiches an. Diesen Bereich markieren Sie (mit den Beschriftungen), bevor Sie den Grafik-Assistenten aufrufen. Müssen Sie doch Teile des Bereiches aus der Grafik heraus halten, dann verwenden Sie beim Markieren die Strg-Taste. Nachträgliche Änderungen des Datenbereichs gehen meistens schief.

Auswahl des Grafiktyps

Kreis
zeigt Anteile an einer Gesamtheit. Eignet sich nicht, wenn die Anteile annähernd gleich groß sind. Liegt mehr als eine Handvoll Werte vor, dann sollten die kleinsten zu einem Sammelposten zusammen gefasst werden. Absolute Zahlen müssen entweder eingeblendet oder in Tabellenform getrennt von der Grafik abgebildet werden.
Typische Beispiele: Abstimmungsergebnisse, Anteil von Kostenarten an Gesamtkosten
Ring
stellt mehrere Kreise zusammen. Typisches Beispiel: Verteilung von Kostenarten über mehrere Jahre. Es ist oft besser, mehrere Kreise nebeneinander zu stellen, anstatt ein Ringdiagramm zu verwenden.
Balken, Säule
zum Vergleich mehrerer voneinander unabhängiger Zahlen. Säulendiagramme sind Balkendiagramme, bei denen die Balken vertikal verlaufen. Horizontale Balken sind sinnvoll, wenn Sie die Balken direkt beschriften möchten.
Linie
wird ähnlich wie ein Balkendiagramm eingesetzt, ist aber besser, wenn die Daten kontinuierlich ineinander übergehen. Beispiel: Der Verlauf eines Wechselkurses ist als Linie/Fläche sinnvoller darzustellen als als Balken. Diese Diagramme sollten Sie nur verwenden, wenn die X-Achse numerisch ist und gleichmäßige Abstände zwischen den Einträgen aufweist.
Fläche
ein Flächendiagramm eignet sich besonders für kumulierte Werte. Beispiel: Es wird über einen längeren Zeitraum Geld angespart, das Diagramm zeigt die gesamte Ansparsumme zu bestimmten Zeitpunkten.
Netz
für multidimensionale Vergleiche. Die Daten müssen vorher normalisiert werden. Beispiel: Vergleich von mehreren Bewerbern und einem Stellenprofil.
Blase und Kurs
nur für speziell aufbereitete Daten.
X-Y
zum Zeichnen von Funktionsgraphen oder für den schnellen Überblick, ob es zwischen mehreren Datenreihen Zusammenhänge geben könnte.

Es gibt Daten, für die Sie sowohl ein Liniendiagramm als auch ein X-Y-Diagramm erstellen könnten. Der wichtigste Unterschied ist dann: Wenn die X-Werte nicht in gleichmäßigen Abständen vorliegen, sollten Sie ein X-Y-Diagramm verwenden.

Lassen Sie die Finger von 3D-Diagrammen, sie stellen Daten verfälscht dar. Wenn es nur um die Optik geht, können Sie mit Excel Diagramme im 3D-Look erstellen, die diese Verfälschungen nicht produzieren.

Galerie der Fehler

Im folgenden einige typische Fehler. Manches taucht nur bei Schülern auf, anderes findet man auch gelegentlich in Tageszeitungen.

Diese Daten liegen den ersten Beispielen zugrunde:

JahrStromHeizungEnergiekosten
2005404 8301234
2006355 8661221
2007480 9301410
413 8751288

Säulendiagramme

Einzelergebnisse und Summen zusammen

Die folgenden Fehler entstehen, wenn Sie die Datenreihen nicht richtig auswählen oder wenn Sie die Absicht haben, zusätzlich zu Einzelwerten auch noch Mittelwerte und Summen unterzubringen.

Säulendiagramm, Summe bei den Einzelposten

Was stimmt hier nicht? Summe und Einzelwerte sollten nicht zusammen abgebildet werden. So sieht es aus, als würden die Energiekosten zusätzlich zu Strom und Heizung anfallen. Abgesehen davon ist die Entwicklung der jeweiligen Preise interessanter als das Verhältnis der Kategorien zueinander.

Säulendiagramm, gestapelt

Korrekt ist ein gestapeltes Säulendiagramm, bei dem sich die Summe aus der Höhe der Stapel ablesen lässt. Nachteil: Nur die untersten Einzelwerte und die Summen lassen sich einfach vergleichen.

Säulendiagramm mit überlagerter Linie

Der Diagrammtyp Säulen und Linien gibt die Möglichkeit, Summen oder Mittelwerte als Linien in ein Säulendiagramm einzuzeichnen. So werden die verschiedenen Datenarten sauber getrennt.

Einzelergebnisse und Mittelwerte zusammen

Säulendiagramm mit Mittelwerten als Säule

Einzelne Werte mit dem Mittelwert, dem erwarteten Wert oder einem Basiswert zu vergleichen ist sinnvoll, den Mittelwert oder Basiswert wie einen Einzelwert einzuzeichnen, ist es nicht.

Säulendiagramm mit Mittelwerten als Säule

Eine Möglichkeit besteht darin, den Mittelwert oder Basiswert als – möglichst gestrichelte – Linie einzuzeichnen. Das wurde hier von Hand erledigt. Nachteil: Wenn sich die Daten ändern, muss wieder von Hand nachgearbeitet werden.

Säulen, die nicht von null nach oben wachsen

Säulendiagramme, bei denen Werte sowohl unterhalb als auch oberhalb der X-Achse liegen, sehen seltsam aus. Sie sind zwar mathematisch korrekt, aber sie fühlen sich nicht so an. Ein Liniendiagramm ist eine gute Alternative.

Säulendiagramm mit Mittelwerten als Säule

Hier die zugrunde gelegten Daten:

JahrErlös
20053000
20061000
2007-2000
20081500
Säulendiagramm mit Mittelwerten als Säule

Falscher Diagrammtyp

Linien oder XY-Diagramme

Ein Klassiker ist die Verwendung eines Kreisdiagramms für Daten, die zusammen keine Gesamtheit ergeben, aber es gibt viele weitere Fehlermöglichkeiten.

Liniendiagramm zwischen unzusammenhängenden Daten

Nur zusammenhängende Daten sollten mit einer Linie verbunden werden. Eine Verbindung zwischen kategorialen Daten wie Strom und Heizung ist falsch.

korrektes Liniendiagramm

Für das nächste Diagramm wurde die Arbeitslosenrate in Deutschland nach einer Liste der Weltbank zusammen gestellt. Es wurden nur die Extremwerte der Kurve notiert. Ausgelassen sind zum Beispiel 2006 mit 10,3% und 2007 mit 8,6%. Die erste Grafik verwendet ein Liniendiagramm, die zweite ein XY-Diagramm. Beachten Sie die Abstände der Werte auf der X-Achse! Das erste Diagramm gibt die Kurve verzerrt wieder.

Liniendiagramm mit ungleichen Abständen
JahrArbeitslosenrate
19915,6%
19948,4%
19958,1%
19979,8%
20007,7%
20017,8%
200511,1%
20087,5%
20097,7%
Diese Daten als XY-Diagramm

Torten

Torte mit Daten, die keine Gesamtheit ergeben

Torten oder Kreisdiagramme sind für die Darstellung von Teilen einer Gesamtheit vorgesehen. Verwenden Sie sie nicht für andere Zwecke! Im Beispiel handelt es sich um Ausschnitte aus einer längeren Zeitreihe. Diese in ein Kreisdiagramm zu packen ist völlig sinnlos.

Hier die Daten für das nächste Beispiel:

Produktabcde
Umsatzanteil34%33% 11%12%10%
Torte mit ähnlich großen Werten

Theoretisch ist ein Kreisdiagramm geeignet, es handelt sich schließlich um Anteile, praktisch lässt sich nicht ablesen, in welchem Verhältnis die Teile a und b einerseits und c%ndash;e andererseits zueinander stehen.

Für das folgende Beispiel wurden monatliche Sparbeiträge verwendet. Der Beitrag betrug normalerweise 10 (Euro), im Juli und August 9 und im November und Dezember 11. Es handelt sich um Anteile an einer Gesamtheit, aber zum einen sind die Zahlen recht ähnlich, zum zweiten haben wir zu viele Kategorien.

Torte mit zu vielen Segmenten

Schauen wir uns jetzt an, wieviel insgesamt gespart wurde, das heißt, ab wann zum Beispiel 50~Euro zusammen gekommen sind.

kumulierte Zahlen nebeneinander

Hier ist ein Flächendiagramm die beste Wahl. Ein Liniendiagramm oder ein gestapeltes Säulendiagramm eignet sich auch, andere Diagramm-Arten jedoch nicht.

kumulierte Zahlen als Flächendiagramm

Verfälschungen

Bisher war es nur peinlich, jetzt kommen wir in einen Bereich, in dem Betrug im Spiel sein kann.

Säulen, die nicht bei null beginnen

JahrLohnkosten
200590000
200689000
200791000

Wenn eine Achse mit kontinuierlichen Daten nicht bei Null beginnt, wirken die Unterschiede überhöht. Sinnvoll sind solche Diagramme nur in speziellen Fällen. Verwenden Sie dann nach Möglichkeit Liniendiagramme statt Säulendiagrammen. Bei Säulen erwartet der Leser einen Anfang bei null.

Wieviel Lohnerhöhung?

Welche Aussage passt besser zu den Zahlen? Die aus dem ersten oder die aus dem zweiten Diagramm?

Ach so.

Noch ein Beispiel (das ebenfalls nicht funkioniert)

Gestapelte Balken, verfälschende Skala

Links sind die Anteile verzerrt, aber bei korrekter Darstellung (rechts) gehen Dienstleistung und Herstellung fast verloren, da sehr große Unterschiede zwischen den Zahlen bestehen.

Gestapelte Balken, korrekt aber bei diesen Daten sinnlos

3D-Diagramme

3D-Grafiken lassen sich nicht vernünftig ablesen. Bei mehreren Datenreihen werden hintere Werte verdeckt, falls sie kleiner sind als vordere.

Wenn 3D-Grafiken perspektivisch korrekt gezeichnet sind, lassen sich die Zahlen nicht mehr richtig ablesen. Diesem Diagramm liegen die Lohnkosten – siehe vorletztes Beispiel – zugrunde. Es ist nicht mehr zu sehen, dass ein Wert deutlich über 90000 liegt.

3D-Balken. Lesen Sie die Zahlen mal richtig ab!

Kegel und Pyramiden lassen sich noch wesentlich schlechter vergleichen als Balken. Da man nicht nur die Höhe, sondern auch das Volumen vergleicht, wirken große Zahlen kleiner als sie sind.

3D-Kegel. Hier brauchen Sie gar nicht erst versuchen, die Zahlen zu
	  lesen.

Nochmals die Balken, diesmal mit einer Skala, die nicht bei Null beginnt. Korrektes Ablesen ist trotzdem nicht möglich, zudem sind die Unterschiede weit überhöht dargestellt.

3D-Balken. Lesen Sie die Zahlen mal richtig ab!

Bei Kegeln ist eine Skala, die nicht bei Null beginnt, total verwirrend.

3D-Kegel. Hier brauchen Sie gar nicht erst versuchen, die Zahlen zu en.

So sieht eine negative 3D-Säule aus. Die Daten wurden weiter oben bereits vorgestellt.

3D-Balken mit Negativwerten. Alles klar?

Design-Regeln

Zum Schluss

Das Internet ist voll von Infografiken, die als Anregung für ausgefallene – und hoffentlich sinnvolle – Diagramme verwendet werden können. Drei Weblinks: visual.ly und informationisbeautiful.net für Grafiken, und Guardian Datablog für Grafiken mit Hintergrundinformation.

Und noch ein Weblink mit Kritiken an schlecht gemachten Grafiken: Junkcharts.

Für Grundlageninformationen und ansprechende Beispiele zur korrekten Darstellung von Informationen ist Edward Tufte ein maßgebliche Autorität – wenn auch nicht unumstritten. Seine Bücher sind auch in Deutschland erhältlich, allerdings nur auf englisch und nicht zum Schnäppchenpreis.

Lustige Diagramme (so etwas gibt es) finden Sie bei Graphittiblog.de.