Was ist Big Data?

Ab wann sind Daten groß genug um Big genannt zu werden? Und ist Big nicht ein wenig relativ und willkürlich?

Zuerst einmal stellt sich die Frage, was Daten überhaupt sind. Schon hier wird es schwammig, denn eine allgemein gültige Definition gibt es nicht. Aber für unsere Zwecke reicht es, wenn wir uns darauf einigen, dass Daten Angaben oder (Zahlen-)Werte sind, die durch Messung oder Beobachtung gewonnen werden. Um die Frage nach Big Data zu beantworten, schadet es nicht ein wenig auszuholen. Weiterlesen »

Von Fußballfeldern, Badewannen, Millionen und Milliarden

… oder: warum wir zum Messen verschiedene Skalen verwenden (sollen)

„Bayerns Bauern [haben] in diesem Jahr Blühflächen in der Größenordnung von rund 12.000 Fußballfeldern geschaffen“ und „Wenn der Ostsee gefüllt ist, fasst er so viel Wasser wie etwa zwei Milliarden Badewannen“ sind zwei der unzähligen Schlagzeilen, in denen diese beiden „Maßeinheiten“ herhalten müssen. Doch warum werden Flächen überhaupt in Fußballfelder umgerechnet und Volumen (oder Volumina) in Badewannen?

Weiterlesen »

(Berufs-) Standards für Datenvisualisierung?

Seit meinem ersten Blogbeitrag hier ist doch schon eine geraume Zeit ins Land gezogen. Leider vor allem auch seit dem Letzen. Letzteres soll sich wieder ändern. Und beides ist Grund genug um sich kurz der Entwicklung und vor allem Professionalisierung der Datenvisualisierung zu widmen. Inzwischen ist die Datenvisualisierung doch um ein Eck bekannter und präsenter. Doch wie steht es um Berufsstandards in der nicht mehr ganz so jungen Disziplin? Weiterlesen »

Foto von: @SpringerMa, NISWien'14

Eindrücke vom News Impact Summit (#NISWien)

Am Dienstag (21.Oktober 2014) fand der ganztägige „News Impact Summit Vienna“ statt – der erste seiner Art. Organisiert wurde er von European Journalism Center und gesponsert von Google, (lokale) Partner waren derStandard.at, FJUM, Hacks/Hackers Vienna und das International Press Institute. Interessant für mich machte dieses Treffen vor allem der Untertitel „Data and Social Media: The New Road to Digital Investigation“. In der Hoffnung auf viel Datenjournalismus begab ich mich also ins Le Méridien in Wien.

Gleich vorweg muss positiv angemerkt werden, dass die Teilnahme an der Veranstaltung kostenfrei war. Erkauft wurde dieser Vorteil naturgemäß durch Sponsoring. Und wenn der Sponsor Google heißt, dann stößt dies nicht unbedingt auf uneingeschränkte Sympathie. Vor allem nicht, wenn es sich um ein Medienevent handelt, und Medien eigentlich das Banner der Informationsfreiheit vor sich tragen wollen/sollen.

Hier also meine subjektive Sicht auf die Veranstaltung. Weiterlesen »

Excel und die Daten(visualisierung)

Jede kennt Excel. Es führt praktisch kein Weg daran vorbei. Für Leute die beginnen sich mit Daten auseinanderzusetzten, sind Tabellenkalkulationsprogramme in der Regel der erste Schritt. Natürlich gibt es eine Vielzahl an Tabellenkalkulationsprogrammen (hier ein kleine Übersicht), aber durch Windows’ Verbreitung ist hier Excel der Platzhirsch und de-facto-Standard. Dass es für Excel auch viele gute Gründe gibt sei unbestritten. Excel kann nämlich sehr viel. Viel mehr als der Laie vermuten würde. Und auch erfahrene Nutzerinnen lernen regelmäßig was neues.

Aber Excel hat auch eine große Schwachstelle: die Datenvisualisierung. Und das in zweifacher Hinsicht.

Weiterlesen »

Daten, Visualisierungen und Journalismus

Offensichtlich ist hier noch nicht viel los. Aber das soll ja noch werden.

Auf datengeschichten kommen Geschichten rund ums Thema Daten. Der Fokus ist dabei nicht streng auf ein Thema beschränkt, sondern umfasst ein breites Spektrum. Es kann Datenjournalismum (DDJ) selbst das Thema sein, aber es können genau so gut Artikel über Tools und Techniken auf dem Gebiet sein.

Dem breite Thema (Daten- und Informations-) Visualisierung soll ebenfalls Rechnung getragen werden. Ob das in Form von Best- oder Worst-Case Grafiken ist die besprochen werden, oder mit Artikeln zu interessanten Visualisierungsansätzen ist ebenfalls nicht eingeschränkt.

Und klarerweise geht es auch nicht über Daten zu Reden, ohne ab und zu Statistik, Mathematik oder (Programmier-) Code ins Spiel zu bringen.

Ich hoffe, dass du bald wieder vorbei schaust und regelmäßig interessantes auf der Seite findest.

Bis bald,
Štefan

ps: Über Feedback und Anregungen von dir freue ich mich natürlich!