Expedition ins Datenland

Daten sind das Öl des 21. Jahrhunderts. Von vielen lange Zeit unbemerkt haben sich die großen Konzerne und Geheimdienste längst ihre Claims abgesteckt. Das Feld, auf dem sie alle ihre Daten fördern, ist unsere Privatsphäre. Grund genug also, einmal genau hinzuschauen.

 

Foto: r2hox, Flickr (CC BY-SA 2.0)

Foto: r2hox, Flickr (CC BY-SA 2.0)

Das will ich in den kommenden Monaten tun. Wer erhebt eigentlich Daten und warum? Eine Frage, der schon mein Bündnisgrüner Kollege Malte Spitz nachgegangen ist. Vom Reisebüro bis zum Bankschalter hat er die Datenströme gecheckt – immer mit dem Hinweis auf § 34 Bundesdatenschutzgesetz, der die „Auskunft an den Betroffenen“ regelt. Etwas schwieriger gestaltete sich für ihn die Frage nach den Daten, die sein Telekommunikationsanbieter im Rahmen der Vorratsdatenspeicherung damals noch sechs Monate lang für die Behörden aufbewahrte. Nach langem Hin und Her hatte er sie schließlich und Zeit Online visualisierte daraufhin sein Leben in Daten.

Kein Zweifel: Seit Edward Snowden wissen wir, dass Geheimdienste jederzeit alles mitnehmen, was sie an Daten bekommen können. Hinter diesen Vorhang zu blicken, gleicht einer Sisyphosaufgabe und ich maße mir deshalb nicht an, als Landespolitiker mehr erreichen zu können als die Kolleginnen und Kollegen auf Bundes- oder Europaebene. Damit will ich das Thema nicht abtun, sondern im Gegenteil Kapazitäten gewinnen, um vor allem bei den hiesigen Firmen einmal genauer hinzuschauen. Dabei möchte ich eines vorweg klarstellen: Big Data ist nicht per se böse! Im Gegenteil eröffnet es uns unendlich viele Möglichkeiten, die ich künftig ebenso gerne beleuchten möchte.

Big Data hat aktuell drei Dimensionen – die drei V:

Volume (dt. Masse)

Schon jetzt ist klar: Die tägliche Datenmenge, die rund um den Erdball erhoben und verarbeitet wird, steigt unaufhaltsam an. Das liegt im Wesen der Digitalisierung. Jeder Prozess, der neu hinzu kommt, generiert Daten. Wozu man sie brauchen kann – einzeln oder kombiniert mit Zweit- und Drittdaten – sei dabei erst einmal dahin gestellt. Ganz aktuell präsentieren die Elektronikkonzerne auf der CES in Las Vegas einen breiten Strauß von technischen Anwendungen, die alle eines gemeinsam haben: Sie verbinden sich mit dem Internet und senden unablässig Daten. Das „Internet der Dinge“ wird in den kommenden Jahren jede Datendimension sprengen, die wir uns heute nur vorstellen können.

Velocity (dt. Geschwindigkeit)

So schnell wie die Datenmengen steigt auch die Rechenleistung, die dafür nötig ist, diese Daten auch auszuwerten. Das funktioniert nicht manuell, sondern anhand von Algorithmen, die leisten, wozu kein menschlicher Geist im Stande wäre. Allerdings um den Preis, dass aufgrund der immer komplexer werdenden Variablen am Ende niemand so genau weiß, wie der Algorithmus denn zu seinem Ergebnis gekommen ist. Ein Umstand, der beispielsweise bei der Auswertung von Geheimdienstdaten so enden kann, dass Ihnen die Einreise in die USA verwehrt wird. Dafür reicht eventuell schon die geografische Wohnortnähe zu einem mutmaßlichen Terroristen, das individuelle Surfverhalten im Internet und die vermeintlich falsche Glaubensrichtung.

Variety (dt. Vielfalt)

Das Fitnessarmband, das zusammen mit meinem Facebookprofil und der auf meiner Gesundheitskarte hinterlegten Krankengeschichte ausreicht, um bei meiner Krankenversicherung einen Bonus oder Malus auszulösen. Erst die Vielfalt der Datenquellen, die immer weiter wächst, macht Big Data oder vielmehr dessen Auswertung so interessant für die Wirtschaft. Und die Menge dieser Datenquellen bzw. die Zahl der Sensoren wächst unaufhörlich (s. Anmerkungen oben zum Internet der Dinge).

Um einen Überblick darüber zu bekommen, welche Arten von Daten es gibt, unterscheide ich zunächst zwischen nicht-personenbezogenen Daten, wie sie zum Beispiel bei der Temperaturmessung oder der geografischen Vermessung einer Landschaft anfallen. Um hier gleich einen Einwand vorweg zu nehmen: Auch diese nicht-personenbezogenen Daten können in Verbindung mit anderen Datensätzen und Personen zu einem Datenpaket werden, das höchst individuelle Rückschlüsse auf den Menschen zulässt. Allerdings passiert dies erst in einem zweiten (Auswertungs-)Schritt. Die Ursprungsdaten sind geniun nicht-personenbezogener Natur.

Personenbezogene Daten hingegen haben immer einen subjektiven Ursprung – sei es als Folge aktiven Handelns (Fitness-Tracking, Facebook-Nutzung) oder durch das unbemerkte „Abfischen“ persönlicher Daten.

Woher die Daten stammen

Bislang ist es auf der privatwirtschaftlichen Seite so, dass die freiwillige Abgabe von Daten immer auch einen Mehrwert für die Person nach sich zieht. Dieser ist mal mehr und mal weniger offensichtlich. Wenn ich Schülergruppen im Landtag danach frage, wie viel sie denn für die Nutzung von Facebook zahlen, schütteln die allermeisten mit dem Kopf und fragen sich, ob „der alte Sack da vorne“ sich übers Ohr hat hauen lassen, schließlich sei ihr Facebook kostenlos. Hier spiegelt sich einerseits das Unwissen über Art und Umfang der von dem sozialen Netzwerk gewinnbringend weiterverarbeiteten persönlichen Daten wider. Andererseits lässt sich nur schwer ein Preis für die eigenen Daten definieren. Für welche Summe bin ich bereit, bewusst mein Persönlichstes zu verkaufen?

Aufklärung auf der einen Seite und klare gesetzliche Regelungen auf der anderen Seite scheinen mir schon jetzt die wichtigsten Eckpfeiler zu sein, wenn wir Big Data oder vielmehr die daran interessierten Institutionen und Unternehmen in Zukunft beherrschbar machen wollen. Verzichten will wohl niemand mehr auf die Vorzüge von Big Data, wie sie unter anderem in Googles treffsicherer Suche oder TomToms erstklassiger Stauumfahrung zu finden sind. Einen gläsernen Patienten, der aufgrund seiner Vorerkrankungen keine Versicherung mehr findet, oder einen Staat, der aufgrund meiner selbst gewählten „Smart Home“-Lösung bis ins zutiefst Private schauen kann, möchte dagegen niemand.

Die Datenschutzgesetze des Bundes und der Länder sind hier – neben dem längst überfälligen EU-Datenschutzrecht – eine juristische Leitplanke, die noch aus der Zeit stammt, als die Deutsche Bundespost BTX verkaufte. Hieran will ich ebenfalls arbeiten und den Hütern des Datenschutzes im Bund und Land einen Besuch abstatten. Nordrhein-Westfalen, soviel kann ich jetzt schon sagen, ist darüber hinaus schon heute ein Ort, an dem verschiedenste Akteure an der Nutzbarmachung von Big Data arbeiten. Einige Beispiele werde ich demnächst hier vorstellen. Denn auch das gehört zur Wahrheit: Big Data kann und wird uns das Leben auch erleichtern!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.