"Meine wichtigsten Datenvisualisierungstools: Papier und Farbstifte"

Ein Interview mit Alexander Schacht

_XXX0631

Dr. Alexander Schacht arbeitet seit 25 Jahren mit Daten. Nach einem Studium der Mathematik und Berufsanfängen in der mathematischen Statistik ist er heute in der Pharmaindustrie bei der Firma Veramed tätig. Er arbeitet mit klinischen Daten und unterstützt Firmen darin, evidenzbasierte Entscheidungen zu treffen. Seinen Podcast „The effective statistician“ gründete Alexander, weil er anderen Statistikern helfen möchte, im Beruf wirksamer zu arbeiten.

Warum es wichtig ist, Gestaltungsprinzipien zu verstehen, und wie man gemeinsam mit Auftraggebern seine Datenvisualisierungen verbessert erklärt er im Interview mit Anita Meyer-Eppler und Evelyn Funk.

Evelyn Funk: Vielen Dank, dass Du dir für ein Interview mit uns die Zeit nimmst! Wir sprechen heute über Datenvisualisierung – was ist Dein Blick darauf?

Alexander Schacht: Man kann Datenvisualisierung in den Bereich explorativer und erklärender Datenvisualisierung unterscheiden. Beide Bereiche sind relevant für mich, deswegen ist Visualisierung über die letzten Jahre zu einem meiner Steckenpferde geworden.

Evelyn: Explorative und erklärende Datenvisualisierung – kannst Du uns den Unterschied erklären?

"Das ist die Macht guter Datenvisualisierung. Sie erklärt Daten auf eine einfache Art und Weise, sodass sie auch die Menschen verstehen können, die nicht so datenaffin sind."

Alexander Schacht

Alexander: Wenn man große Datenmengen gut verstehen will, kommt man um explorative Datenanalyse nicht herum. Dieser visuelle Teil ist einfach unglaublich hilfreich. Visuell erkennen wir Muster viel schneller, als wir sie kognitiv verarbeiten können – man nennt das „preattentive attributes“. Wir Menschen brauchen unheimlich lange, um in einer Tabelle Werte abzugleichen – beim visuellen Abgleich sind wir aber schnell und sehen beispielsweise direkt, welche Säule größer ist als eine andere. Auch die erklärende Datenanalyse kommt nicht ohne gute Visualisierungen gut aus.  Das ist einer der Gründe, warum aktuell in der Pandemie so viel mit Datenvisualisierung gearbeitet wurde. Wenn wir an „flatten the curve“ denken – eigentlich eine simple Datenvisualisierung, die aber über die Zeit immer weiter verbessert wurde und die Welt dazu gebracht hat, wirklich wichtige politische Entscheidungen zu treffen. Das ist die Macht guter Datenvisualisierung. Sie erklärt Daten auf eine einfache Art und Weise, sodass sie auch die Menschen verstehen können, die nicht so datenaffin sind.

Evelyn: Bisher kommunizieren Evaluator*innen Daten eher sparsam, Evaluationsberichte sind oft textlastig. Wie können sich tendenziell konservative Politikfelder auf neue Formen der Visualisierung einlassen? Und wo können wir uns inspirieren lassen?

Alexander: Man kann sich Felder wie den Datenjournalismus anschauen, die schon weit voraus sind. Die Financial Times oder die BBC haben gute Experten für Datenvisualisierung. Da kann man sich vieles anschauen und adaptieren. Der Kernpunkt der Frage ist aber mehr das Veränderungsmanagement – wie kriege ich Leute dazu, etwas Neues zu machen. Als erstes muss klar sein, dass das wirklich Zeit braucht. Man muss aber auch klarhaben, welchen zusätzlichen Nutzen neue Darstellungsformen bringen. Wenn man diesen Nutzen verstanden hat, dann muss man sich überlegen, welche Leute am ehesten bereit sind, so etwas mitzugehen. Was dann häufig hilft ist, die traditionelle Form der Darstellung und die neue Form nebeneinander zu zeigen. Daran kann man den Nutzen demonstrieren. Wenn man dann die ersten Erfolge hat und diese kommuniziert, wird gesehen wie es funktionieren kann, und darüber kommen dann weitere Anfragen von den sogenannten early adopters. Und dann kommt es irgendwann zum tipping point, wo immer mehr Menschen auf den Zug aufspringen. Das alles dauert, und braucht viel Überzeugungsarbeit, und man muss sehr viele Beispiele zeigen.

Anita Meyer-Eppler: Bei quantitativen Daten gibt es mittlerweile viele Ansatzpunkte für gute Datenvisualisierung – was sind denn Deine Tipps für die Visualisierung von Stimmen aus qualitativen Daten?

Alexander: Unabhängig von der Art der verwendeten Daten gibt es dahinterliegende und allgemeingültige Paradigmen für die Datenvisualisierung, die muss man konsequent anwenden. Beispielsweise die Farbentheorie: Es gibt Erkenntnisse darüber, wie ich Farben optimal zur Hervorhebung verwende, um Unterscheidungen herauszuarbeiten. Das kann ich mit einer WordCloud genauso machen, wie mit einem Balkendiagramm. Ein anderes Beispiel ist das Gestaltprinzip, das zusammengehört, wo eine Verbindung ist. Das gilt sowohl für ein Liniendiagramm, als auch im qualitativen Bereich für ein Dendogramm. Oder nehmen wir die Nähe vs. Entfernung von Elementen zueinander. Stellen wir uns vor, da sind acht Quadrate: Vier oben in einer Reihe, dann ist dann ein größerer Spalt, und darunter noch einmal vier in einer Reihe. Dann sehen wir automatisch nicht acht Quadrate, sondern zwei Gruppen von jeweils vier Quadraten. Das müssen wir nicht weiter erklären, das sieht jeder sofort. Solche Gesetzmäßigkeiten kann man sich auch bei qualitativen Daten zunutze machen.

Eine Frage der Wahrnehmung: Wir sehen acht Quadrate...

...oder, wenn wir ein bisschen Abstand schaffen, zwei Gruppen mit je vier Quadraten! (Gestaltpsychologie: Das Gesetz der Nähe)

8 Quadrate
zwei mal vier Quadrate

Anita: Viele Evaluatoren haben in ihrem sozialwissenschaftlichen Studium gelernt, wie man Datenvisualisierungen im akademischen Kontext richtig aufbereitet. Wie kann ich denn vorgehen, wenn ich mir neue Fähigkeiten in der Datenvisualisierung für die Praxis aneignen will? Welche Tools sollte ich lernen?

Alexander: Ich würde wirklich als Erstes versuchen, die grundlegenden Prinzipien der Datenvisualisierung zu verstehen. Es macht wenig Sinn, sich ein Auto kaufen, wenn man keine Karte lesen kann. Man weiß sonst einfach nicht, wo man mit dem Auto hinfahren will. Deswegen sollte man sich erstmal die Theorie aneignen. Aber was wirklich in der Datenvisualisierung passiert, versteht man erst, wenn man sie selbst am konkreten Fall durchspielt.  Wenn ich mit einer Datenvisualisierung starte, nehme ich als erstes Tool Papier und Farbstifte. Ich möchte erstmal wissen, wie meine Darstellung optimalerweise aussehen soll. Wenn ich gleich in ein Tool springe, dann werde ich durch dieses Tool, und was ich in diesem Tool kann, eingeschränkt. Bei einem Papier kann ich auch viel mehr Darstellungsformen ausprobieren und habe am Ende keine Probleme damit, Entwürfe wegzuwerfen. Beim Aneignen von Tools würde ich schon versuchen, mir 1-2 Tools zu nehmen und die möglichst gut zu verstehen. Es hilft relativ wenig, viele Tools oberflächlich zu können. Es macht mehr Sinn, sich ein bis zwei gute Tools zu nehmen und da richtig einzusteigen. Bei Tools würde ich schauen – gibt es eine große Community rund um dieses Tool, so dass ich einfach viele Beispiele finde? Beispiel Tableau – die investieren extrem viel in die Community.

Anita: Fürs Lernen ist ja auch das Feedback von anderen sehr wichtig – für Freiberufler in der Evaluation ist das manchmal schwer zu realisieren. Wie kann ich also als Dienstleister meine Auftraggeber einbinden, um aus deren Feedback zu lernen?

Alexander: Es ist sehr wichtig, die Erwartungen von Anfang an richtig zu setzen. Wenn die Leute die Erwartung haben, dass nach einer Beauftragung sehr spezifischen Lieferungen erfolgen, dann wird das vermutlich nicht funktionieren. Datenvisualisierung ist immer ein iterativer Prozess. Das muss man am Anfang bereits klar machen: „Wir werden anfangen mit Bleistift und Papier, und zwar aus dem und dem Grund. Und erst wenn wir etwas gefunden haben, was Sinn macht, kommt das Fine Tuning.“

Anita: Wovon hängt es aus Deiner Erfahrung ab, eine gute Datenvisualisierung für einen Auftrag abzuliefern?

Alexander: Datenvisualisierung ist ja ein Kommunikationswerkzeug. Aus meiner Erfahrung hängt es von drei Faktoren ab, ob es gelingt, eine gute Visualisierung zu entwickeln. Erstens – man muss verstehen, wer die Zielgruppe ist. Man muss die Visualisierung mit der Zielgruppe testen oder entwickeln. Das kann man nicht selbst. Auch die absoluten DataViz Gurus wissen, dass sie es nicht alleine können, weil sie nicht zur Zielgruppe gehören. Das zweite ist, die Botschaft genau zu kennen, die rübergebracht werden soll. Mein Learning ist, dass die Botschaft am Anfang meist noch nicht klar, noch nicht kernig ist. Erst im Laufe des Prozesses wird diese klarer und „crisp“. Das dritte ist, die Form zu kennen, in der das nachher kommuniziert wird. Es macht einen Unterschied, ob es abgedruckt wird oder eine Live-Präsentation ist. Grafiken aus einer Live-Präsentation lassen sich so oft nicht abdrucken, weil die Erläuterung fehlt. Umgekehrt ist es beispielsweise ein klassischer Fehler,  Abbildungen aus einem gedruckten Report in eine Präsentation zu nehmen – da haben die Leute eben keine 5-10 Minuten Zeit, sich das anzuschauen. Das ist einfach nicht geeignet.

Evelyn: Als Evaluatorin arbeite ich im Rahmen eines bestimmten Kostenrahmens. Darum interessiert mich: Wie kann ich Datenvisualisierungen möglichst effizient erstellen?

Alexander: Mehr Zeit am Anfang reinstecken, in die ersten Schritte, die Erarbeitung, wie genau es aussehen soll. Wenn an dieser Stelle etwas schiefläuft, und man schon angefangen hat, etwas zu programmieren oder in einem Tool umzusetzen, dann kann man das im Zeitplan nicht mehr reinholen. Der Kostenrahmen hilft auch bei der Fokussierung – dann werden es eben nicht 20 Datenvisualisierungen, sondern nur eine. Dann wird es halt im Rahmen des gegebenen Budgets nicht das 3-D Netz mit Animation und Interaktion, sondern es wird die Word Cloud. Das kann man ja auch so kommunizieren.

Download

Beispiel für eine Wordcloud der DeGEval-Standards in ihrer Kurzfassung

Evelyn: Ähnlich wie in Deinem Job in der Pharmaindustrie treiben auch Evaluator*innen evidenzbasierte Entscheidungen. Wie setzt Du Storytelling dafür richtig ein?

Alexander: Ich fange immer mit dem großen und ganzen an – den Gesamtergebnissen  für die gesamte untersuchte Population. Nach diesen Kernaussagen erst nehme ich mir weitere andere Ergebnisse vor. Je seniorer die Zuhörerschaft, umso wichtiger ist diese Vorgehensweise. Wenn ich mit anderen Data Scientists rede, kann ich hingegen auch akademisch aufbereiten und mehr über die Methode sprechen, wie ich zu den Ergebnissen gekommen bin.

Anita: Wie hat sich der Anspruch an Datenvisualisierung in den letzten Jahren aus Deiner Sicht geändert? Wo sind noch Herausforderungen?

Alexander: Es hat sich wirklich unglaublich viel getan. Das sieht man an den Magazinen, gerade jetzt in der Pandemie. Der Endkonsument ist es heute viel mehr gewohnt, Grafiken zu sehen. Vor zwanzig Jahren hätte man nie Scatter Plots oder Kurvendiagramme abgedruckt. Heute gibt es mehr Offenheit, Komplexität auch zu drucken. Gerade im online-Bereich wird sehr viel mit Interaktivität gearbeitet, so dass sich die Leute die Daten selbst anschauen können. Die ganzen Dashboards, die es jetzt für die Pandemie gibt, sind ein gutes Beispiel. Man kann nach seinem Landkreis filtern, oder auf Personengruppen nach Alter und Geschlecht. Das gab es früher einfach nicht.  Einer der schwierigsten Bereiche in der Interaktivität ist allerdings, dass es auch komplexer und unübersichtlicher wird. Da muss man eine Balance finden. Sollen Daten möglichst zugänglich für jeden sein, dann muss man die Komplexität runterschrauben. Sehr viel Freiheit, sich interaktive Daten selbst anzuschauen, wird dazu führen, dass manche Menschen überfordert sind.

Anita: Du hast in Deinem Podcast einer Checkliste zur Datenvisualisierung zwei volle Folgen gewidmet. Sind solche Checklisten auch für Anfänger ein guter Einstieg?

Alexander: Ich habe die Novartis Graphic Principles, die die Vorgehensweise bei der Visualisierung von Daten Schritt für Schritt erläutern, für mich ausgedruckt. Es ist unglaublich hilfreich, das ausgedruckt zu sehen. Insofern ja, es macht Sinn, sich mit diesen Hilfsmitteln auseinanderzusetzen. Allerdings ist Datenvisualisierung in der Realität kein linearer Prozess, sondern wie gesagt ein iterativer Prozess – das muss einem bei der Arbeit mit diesen Checklisten bewusst sein.

Novartis Cheat Sheet

Ein hilfreiches Tool im Visualisierungsprozess: Die Novartis Graphic Principles

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht.

Scroll to Top