Daten- und Informationsvisualisierung für Big Data

Das Thema „Big Data„, und damit die Verarbeitung großer Datenmengen tritt immer stärker in den Vordergrund. Damit übernehmen auch die User Interfaces eine immer wichtigere Rolle ein.

Wie ich in einem früheren Artikel bereits geschrieben habe, widmet sich das Arbeitsgebiet der „Daten- und Informationsvisualisierung“ der Frage, wie diese Benutzeroberflächen so gestaltet werden, daß die dem Nutzer die Arbeit mit Daten erleichtert. Hierzu habe ich heute wieder einige Materialien zum Einstieg zusammengestellt.

Öffnen Sie den Artikel im Internet. Wie immer finden Sie dort ganz am Ende eine Referenz auf diese weiterführenden Artikel.

Wie Zahlen Manager in die Irre führen

In ihrem Artikel „Wie Zahlen Manager in die Irre führen“ liefert der Harvard Business Manager indirekt viele Informationen über den Nutzen von guten Dashboards:

„Die wichtigste Veränderung, der sich Unternehmen im 21. Jahrhundert stellen müssen, besteht möglicherweise darin, die Komplexität der weichen Zahlen zu durchblicken. Diese Daten sind zwar qualitativer Natur und weniger leicht fassbar, doch sie sind entscheidend, wenn es darum geht, die richtigen Schlüsse zu ziehen.“

Demnach sind neben den numerischen Daten unstrukturierte Informationen wichtig, die in Zahlen verborgen sein können, und damit das Verständnis, das man von den Daten hat.

Die Weltbank schreibt in „Open Data for economic growth: the latest evidence“ über einen Teilbereich, in dem große Datenmengen entstehen, und klärt auf, wie groß die Bedeutung dieser Daten für das Wirtschaftswachstum ist (was hier gilt wird ebenfalls in anderen Bereichen gelten):

„One of the key policy drivers for Open Data has been to drive economic growth and business innovation. …. There’s a range of studies that suggest that the potential prize from Open Data could be enormous -i…. All these support the conclusion that the economic potential is at least significant – although with a range from “significant” to “extremely significant”…
…. It’s also becoming clear that if countries want to maximise their gain from Open Data the role of government needs to go beyond simply publishing some data on a website. Governments need to be:
* Suppliers – of the data that business need
* Leaders – making sure that municipalities, state owned enterprises and public services operated by the private sector also release important data
* Catalysts – nurturing a thriving ecosystem of data users, coders and application developers and incubating new, data-driven businesses
* Users – using Open Data themselves to overcome the barriers to using data within government and innovating new ways to use the data they collect to improve public services and government efficiency.“

Daraus wird klar, daß in Zukunft weniger die eigentliche Information, sondern die intelligente Auswertung durch Menschen zum eigentlich begrenzende Faktor wird.

Damit wird der Nutzen erklärbar, den gute Benutzeroberflächen und Datenvisualisierungstechniken liefern – über die reine Bedienbarkeit einer Software hinaus.

Gute Lernquellen

Über den Artikel How to make beautiful data visualizations in Python with matplotlib finden Sie eine Zusammenstellung von verschiedenen Studien, Beispielen und Ideen rund um das Thema Datenvisualisierung.

Wenn Sie die Seite öffnen, und sich dort die einzelnen Artikel näher ansehen, werden Ihnen sicher die vielen konkreten Beispiele für komplexe Nutzerinterfaces ins Auge fallen, mit denen letztendlich gelingt, unendlich große Datenmengen zu einer Fragestellung auf einer Seite darzustellen.

Hinter einer solchen Verdichtung steht ein Prinzip.

Die Seite 35 books on Data Visualization gibt einen relativ kompletten Überblick über die Fachliteratur, welche die Gesetzmäßigkeiten der Datenvisualisierung erforscht und daraus die Darstellungsprinzipien ableitet.

Auf den vorderen Plätzen finden sich hierbei die Standardwerke von Edward Tufte, der zu den ganz Großen auf dem Gebiet der Datenvisualisierung zählt.

Sie finden dort allerdings auch Literatur über angrenzende Gebiete, wie der Auslegung von Datendashboards, die im Computerumfeld benutzt werden, um Nutzern wichtige Informationen auf einem einzigen Bildschirm zu erschliessen.

Es gibt neben der Fachliteratur im Internet viele offene oder proprietäre Kurse. Die Website www.lynda.com kostet zwar Geld, ist in Fachkreisen aber wegen der hohen Qualität der Kurse beliebt. Der Kurs von Bill Shander mit dem Titel Data Visualization Fundamentals macht in dem Zusammenhang mit der Datenvisualisierung einen sehr guten Eindruck.

Fazit

Die Datenmengen wachsen weltweit in rasanter Geschwindigkeit an, u.a. weil ein großer ökonomischer Nutzen aus diesen großen Datenmengen entsteht.

Da letztendlich die Informationsverarbeitskapazität des Menschen der begrenzende Faktor ist, gewinnen die Techniken der Datenvisualisierung zunehmend an Bedeutung in der Softwarentwicklung. Neben Literatur gibt es eine Vielzahl von guten Kursen online.

Um in das Thema einzusteigen, empfehle ich Ihnen, diese Fachliteratur/Kurse. Anschliessend können Sie dann damit beginnen, eigene (prototypische) User Interfaces umzusetzen, um einen praktischen Überblick zu erhalten.

Weiterführende Informationen

Das Original dieses Artikels ist auf Der Produktmanager erschienen (©Andreas Rudolph). Folgeartikel zum Thema gibt es über die (→Mailingliste), oder indem Sie →mir auf Twitter folgen.

In der Online Version des Artikels finden Sie hier die versprochenen weiterführenden Links:

Comments are closed.