Was ist Big Data?

Ab wann sind Daten groß genug um Big genannt zu werden? Und ist Big nicht ein wenig relativ und willkürlich?

Zuerst einmal stellt sich die Frage, was Daten überhaupt sind. Schon hier wird es schwammig, denn eine allgemein gültige Definition gibt es nicht. Aber für unsere Zwecke reicht es, wenn wir uns darauf einigen, dass Daten Angaben oder (Zahlen-)Werte sind, die durch Messung oder Beobachtung gewonnen werden. Um die Frage nach Big Data zu beantworten, schadet es nicht ein wenig auszuholen. Weiterlesen

Von Fußballfeldern, Badewannen, Millionen und Milliarden

… oder: warum wir zum Messen verschiedene Skalen verwenden (sollen)

„Bayerns Bauern [haben] in diesem Jahr Blühflächen in der Größenordnung von rund 12.000 Fußballfeldern geschaffen“ und „Wenn der Ostsee gefüllt ist, fasst er so viel Wasser wie etwa zwei Milliarden Badewannen“ sind zwei der unzähligen Schlagzeilen, in denen diese beiden „Maßeinheiten“ herhalten müssen. Doch warum werden Flächen überhaupt in Fußballfelder umgerechnet und Volumen (oder Volumina) in Badewannen?

Weiterlesen

Warum der Durchschnitt manchmal nicht hilft

… oder warum es besser sein kann, den Median zu verwenden.

Wenn Daten in Form von Erhebungen, Umfragen oder Stichproben gesammelt werden und darüber berichtet wird, dann ist der Durchschnitt in der Regel nur ein Eck entfernt. Wie sonst soll aus einer (riesigen) Gruppe Information für ein einzelnes Mitglied gezogen werden? Zum Beispiel beim Einkommen, oder bei der Körpergröße? Was ist jedoch die Aussage des Durchschnittes? Oder anders gefragt, kann mit dem Durchschnitt auch eine vernünftige Aussage für einen Großteil der betrachteten Gruppe getroffen werden? Weiterlesen

(Berufs-) Standards für Datenvisualisierung?

Seit meinem ersten Blogbeitrag hier ist doch schon eine geraume Zeit ins Land gezogen. Leider vor allem auch seit dem Letzen. Letzteres soll sich wieder ändern. Und beides ist Grund genug um sich kurz der Entwicklung und vor allem Professionalisierung der Datenvisualisierung zu widmen. Inzwischen ist die Datenvisualisierung doch um ein Eck bekannter und präsenter. Doch wie steht es um Berufsstandards in der nicht mehr ganz so jungen Disziplin? Weiterlesen

Foto von: @SpringerMa, NISWien'14

Eindrücke vom News Impact Summit (#NISWien)

Am Dienstag (21.Oktober 2014) fand der ganztägige „News Impact Summit Vienna“ statt – der erste seiner Art. Organisiert wurde er von European Journalism Center und gesponsert von Google, (lokale) Partner waren derStandard.at, FJUM, Hacks/Hackers Vienna und das International Press Institute. Interessant für mich machte dieses Treffen vor allem der Untertitel „Data and Social Media: The New Road to Digital Investigation“. In der Hoffnung auf viel Datenjournalismus begab ich mich also ins Le Méridien in Wien.

Gleich vorweg muss positiv angemerkt werden, dass die Teilnahme an der Veranstaltung kostenfrei war. Erkauft wurde dieser Vorteil naturgemäß durch Sponsoring. Und wenn der Sponsor Google heißt, dann stößt dies nicht unbedingt auf uneingeschränkte Sympathie. Vor allem nicht, wenn es sich um ein Medienevent handelt, und Medien eigentlich das Banner der Informationsfreiheit vor sich tragen wollen/sollen.

Hier also meine subjektive Sicht auf die Veranstaltung. Weiterlesen

Daten im österreichischen Tagesjournalismus

Dass Datenjournalismus ein recht junges Feld ist, ist bekannt. Dass er im deutschsprachigem Raum noch nicht so weit ist, wie teilweise im anglo-amerikanischen Raum, ebenso. Grund genug für eine (nicht repräsentative) stichprobenartige Erhebung.

Das Setting: Analyse von datenjournalistischen Beiträgen in den Tageszeitungen Österreichs. Das Ergebnis: lau. Oder weniger. Aber der Reihe nach.

Weiterlesen

3D ist (nicht) schlecht

Als Nachtrag zum letzten Post, in dem das Thema „3D-Visualisierungen“ angerissen wurde, heute ein paar Gedanken. Im Grunde geht es ja bei der Informationsvisualisierung darum Information zu visualisieren. No na! 😉 Und das geschieht in der Regel nicht aus Jux und Tollerei, sondern mit dem Ziel diese Infomation zu vermitteln. Womit wir bei der spannenden Frage nach dem (geplanten) Publikum, bzw. der Empfängerin der Information, also der Zielgruppe, sind.

Diese zu erreichen ist bekannterweise ein Kunst und es würde Bücher füllen die Bildsprache und das Symbolverständnis unterschiedlicher sozialen Gruppen, Kulturen oder Epochen zu erörtern. Jedenfalls soll die (Informations-) Visualisierung die angestrebte Zielgruppe erreichen und fesseln so, dass möglichst viele Im Zielpublikum die „Story konsumieren“. Vor allem soll dabei der richtige Aspekt der Information transportiert werden. Das zu erreichen kann ab & zu auch bedeuten Regeln oder Normen zu brechen. Weiterlesen