Wenn das Navigationssystem vor einem Stau warnt und die Suchmaschine die Ausbreitung einer Krankheitswelle vorhersagt, dann steckt dahinter ein komplizierter Algorithmus, der große Datenmengen analysiert. Woher die Daten kommen, wie sie genutzt werden und welche vor und Nachteile sich daraus ergeben, erfährt man in diesem Artikel.
Hinter dem Begriff Big Data verbirgt sich, grob gefasst, die statistische Analyse extrem großer Datenmengen mittels computerbasierter Methoden. Leistungsfähige Großrechner und Datenspeicher erlauben der Wissenschaft, der Wirtschaft und der öffentlichen Verwaltung, aus einer Fülle von Einzelinformationen Aussagen über Zustände und Entwicklungen zu treffen. Die gewonnenen Erkenntnisse können als Grundlage für Entscheidungen dienen.
Die Datenquellen für Big Data sind sehr vielfältig. Das Internet dient dabei selbst als eine der Quellen, die ausgewertet werden können. Wer im Internet unterwegs ist, hinterlässt Spuren, nämlich Datenspuren. Beispiele dafür sind: Anfragen an eine Suchmaschine, Informationen zu den aufgerufenen Seiten, Nutzung von Apps, Informationen aus den Sensoren eines Smartphones. Der Trend, möglichst viele elektronische Geräte mit dem Internet zu verbinden, fördert Möglichkeiten zur massenhaften Erzeugung von verwertbaren Daten als Rohstoff für Big Data.
Wo spielt Big Data eine Rolle?
Die neuen Analysemethoden können überall dort zum Einsatz kommen, wo eine Vielzahl von unterschiedlichen, völlig ungeordneten Daten anfallen. In der Medizin können zum Beispiel komplexe Berechnungen zur Struktur von DNA vorgenommen werden. Die Klimaforschung kann Daten aus der weltweiten Wetterbeobachtung sammeln, um damit Aussagen zu künftigen Entwicklungen zu treffen. Informationen aus der Beobachtung des Marktes helfen Unternehmen dabei, Entscheidungen zum Beispiel über neue Produkte, Produktionsmengen und Preise zu fällen. Die öffentliche Verwaltung profitiert für die Verkehrsplanung von der genauen Analyse der Verkehrsströme in den Städten oder auf den Autobahnen. Insbesondere die Einträge oder Nutzungsdaten von Suchmaschinen oder sozialen Netzwerken können Auskünfte zu Krankheitswellen oder zu bestimmten Bewegungen an den Finanzmärkten geben.
Smarte, vernetzte Geräte und spezielle Sensoren sammeln viele Daten über ihre Umwelt. Nicht immer, aber sehr häufig sind darunter Daten, die einer bestimmten Person unmittelbar zugeordnet werden können. Die automatisierte Auswertung zum Beispiel von Suchmaschinenanfragen, Einträgen in sozialen Netzwerken oder im Adressbuch eines Smartphones sowie der Nutzungsdauer einer App stellen erhebliche Eingriffe in die Privatsphäre dar. Um aussagekräftig zu sein, benötigt Big Data aber möglichst viele Daten, die unkompliziert beschafft werden müssen.
Big Data und Datenschutz
Wer Big-Data-Methoden anwenden will, profitiert entweder von Gesetzen, die eine Auswertung bestimmter personenbezogener Daten per se erlauben, oder nutzt die Möglichkeit, Daten zu anonymisieren. Dabei werden Informationen so aufgezeichnet, dass sie keiner bestimmten Person mehr zugeordnet werden können. Sobald aber keine Anonymisierung vorgenommen wird, müssen Betroffene für die Nutzung ihrer Daten eine ausdrückliche Einwilligung geben.
Quelle Text und Grafik: Gollner, Christian; Steinhöfel, Barbara: Blick in die Zukunft des Internets. In: Silver Surfer – Sicher online im Alter. Lernbuch für aktive Internetnutzer. 3. Auflage 2015.