26.03.2013 – Kategorie: IT
Big Data: Interview mit dem Münchner Kreis
digitalbusiness CLOUD: Noch vor kurzem haben wir Fluch und Segen der so genannten Business Intelligence diskutiert, die Unternehmen durch systematische Datenanalyse bessere strategische Entscheidungen erlauben soll. Wodurch unterscheidet sich Big Data von Business Intelligence?
Prof. Arnold Picot: Der Übergang von klassischer Business Intelligence zu moderner Big Data ist gradueller Natur. Business Intelligence bezog sich in der Regel auf strukturierte, in Datenbanken organisierte Daten, die unter bestimmten Gesichtspunkten ausgewertet werden. Mit dem vermehrten Aufkommen von Data-Warehouse-Ansätzen näherte sich Business Intelligence bereits Big Data an, denn in einem Data Warehouse können auch heterogene Daten aus unterschiedlichen internen und externen Quellen für die Analyse verfügbar gemacht werden. Von Big Data spricht man dann, wenn es sich um Datenmengen im Bereich von Tera- oder Petabyte handelt, die aus vielfältigen Quellen stammen und in ihrer Struktur sehr unterschiedlich sind. Dies gilt beispielsweise bei Transaktionsdaten, Geo- oder audiovisuellen Daten. Außerdem fallen diese Datenmengen zu einem erheblichen Teil hoch dynamisch und praktisch permanent an und sie werden mit besonderen Analysewerkzeugen und Algorithmen typischerweise in Echtzeit analysiert.
digitalbusiness CLOUD: Wenn Daten heute aus immer neuen Quellen wie Social Media, Sensortechnik und Logfiles sprudeln, was bedeutet das dann für einen verantwortungsvollen Umgang mit ihnen?
Dr. Alexander Duisberg: Aus rechtlicher Sicht gibt es vor allem zwei Dimensionen, die diese Verantwortung begründen: Soweit es um personenbezogene Daten geht, spielt der Datenschutz eine erhebliche Rolle. Und zwar national wie international. Die verantwortliche Stelle ist diejenige, die die Daten erstmalig erhebt. Sie muss auf die Einhaltung des Datenschutzes bei Erhebung, Nutzung und Weitergabe von Daten achten. Bei mehreren verantwortlichen Stellen kann es schnell zu internationalen Gemengelagen kommen, die oft nur schwer in den Griff zu bekommen sind. Aber man darf Big Data aus rechtlicher Sicht nicht auf den Datenschutz beschränken. In vielen, wenn nicht sogar den meisten Fällen ist der Personenbezug einzelner Datensätze nämlich überhaupt nicht gegeben. Die zweite Dimension betrifft die Kernfrage, wem die Daten eigentlich gehören. Hier gibt es – im Datenschutz und außerhalb – das bislang viel zu wenig beachtete Recht des Datenbankherstellers, das einer uneingeschränkten Nutzung durch Dritte entgegenstehen kann. Big Data und Open Data sind nicht ohne Weiteres dasselbe und auch Open Data kann bestimmten Nutzungsbeschränkungen unterliegen.
digitalbusiness CLOUD: Blicken wir doch einmal fünf Jahre in die Zukunft: welche erfolgversprechenden Big-Data-Geschäftsmodelle sehen Sie?
Prof. Arnold Picot: Zunächst ist zu konstatieren, dass es bereits heute erfolgreiche kommerzielle Anwendungen von Big Data gibt. Denken Sie an die Online-Auswertung von Kundenverhaltensdaten im Internet. Die Verhaltensmuster werden mit riesigen Mengen anderer Fälle in Blitzgeschwindigkeit verglichen und daraus beispielsweise Vorschläge für weitere Angebote und Platzierungen für Werbebotschaften abgeleitet, die sofort, quasi in Echtzeit, umgesetzt werden. Ein anderes aktuelles Beispiel sind Verkehrs- und Navigationssysteme, die die Bewegungs- und Ortsdaten von Hunderttausenden Fahrzeugen permanent auswerten und daraus Stauinformationen und Routenempfehlungen ableiten. In fünf Jahren wird es natürlich viele neue Anwendungsfelder geben, weil die Technologien der Datengewinnung und -analyse ständig leistungsfähiger werden. Geschäftsmodelle können sich dabei auf die Sammlung und Bereitstellung bestimmter Datenkategorien, auf die Entwicklung und den Einsatz spezifischer Analysewerkzeuge und auf die Integration von anspruchsvollen Datenauswertungen in kundenbezogene Lösungen beziehen, um Mehrwerte zu erzielen. In der künftigen Energieversorgung liegen hier erhebliche Anwendungspotenziale genauso wie beispielsweise in der Gesundheitsbranche, der Logistik oder der Informationsrecherche und Medienanalyse.
digitalbusiness CLOUD: Ist Big Data ein Konzept, das den Verantwortlichen in der praktischen Umsetzung großes Kopfzerbrechen bereitet?
Markus Raatz: Natürlich, das ist nicht so einfach. Die Technologie hinter Big Data ist wie vieles aus dem Open-Source-Bereich nicht leicht zu installieren und zu konfigurieren. Die Hardware kann, weil die Last auf mehrere, einfache Computer verteilt wird, gut mit der Datenmenge skalieren, aber irgendjemand muss sie dennoch kaufen und warten! Deshalb sagen viele Unternehmen: Big Data betreiben wir in der Cloud. Dahinter steht der Self-Service-Gedanke. Wer Big Data benötigt, kann die Dienste ohne großes Fachwissen selbst konfigurieren, und wie das Ganze technisch implementiert und verwaltet wird, kann ihm dabei beinahe egal sein.
digitalbusiness CLOUD: Mit welchen Konsequenzen müssen öffentliche Institutionen und Unternehmen rechnen, die Datensicherheit und Datenschutz in ihren Big-Data-Strategien auf die leichte Schulter nehmen?
Dr. Alexander Duisberg: Die Wahrung von Datenschutz und Datensicherheit genießt in der Praxis inzwischen sehr hohe Aufmerksamkeit. Öffentliche Institutionen und Unternehmen können es sich überhaupt nicht mehr leisten, diese Fragen auf die leichte Schulter zu nehmen. Die Datenschutzbehörden haben in Deutschland und in der EU deutlich gemacht, dass sie Datenschutzverstöße in Zukunft mit empfindlichen Geldbußen ahnden werden. Die neue EU-Datenschutzgrundverordnung wird, wenn sie in zwei bis drei Jahren erlassen wird, dabei einen ganz neuen Rahmen schaffen, der sich am Unternehmensumsatz orientiert. Zudem setzt sich aber auch ein Industriestandard durch, bei dem gerade im Bereich der Datensicherheit hohe Anforderungen – einschließlich des Nachweises entsprechender Zertifizierungen – gang und gäbe werden.
digitalbusiness CLOUD: Wie wird mit dem Sicherheitsthema in der Praxis umgegangen?
Markus Raatz: Da heißt es ganz sensibel sein. Big-Data-Projekte, die personenbezogene Daten speichern müssen, kommen in der Cloud weniger in Frage. Realistischerweise muss man aber sagen, dass die Gefahr kaum besteht. Beispielsweise sind etwa achtzig Prozent aller derzeitigen Hadoop-Projekte nur Worthäufigkeitsanalysen, also Wordcounts. Viele probieren da etwas aus, aber nur wenige haben wirklich spezifische Auswertungsanforderungen. Wenn aber ein Unternehmen sich entscheidet, etwa die riesigen Zugriffsprotokolle auf ihre Website mit Hadoop auszuwerten und dieses System im eigenen Rechenzentrum betreibt, kann man dort – über die Speicherung der IP-Adresse oder durch Cookies – natürlich einen Bezug zur Person herstellen. Das hat allerdings nicht in erster Linie mit Big Data zu tun. Vielmehr ist es ein umstrittenes Feld, das schon vorher bestanden hat.
digitalbusiness CLOUD: Viele – wenn nicht die meisten – Daten, die für Big Data interessant sind, stammen aus internationalen Quellen oder werden von externen Dienstleistern gewonnen, analysiert und verwertet. Was bedeutet dies für die Entwicklung der Big-Data-Märkte?
Prof. Arnold Picot: Die Märkte und Möglichkeiten entwickeln sich so schnell, dass auch für Anbieter aus Europa und Deutschland noch genügend Chancen bleiben, wenn sie es entschlossen und weitsichtig angehen. Big-Data-Lösungen drängen in besonderem Maße nach Skalierung. Die Systeme haben erhebliche Entwicklungs- und zum Teil auch Betriebskosten. Sie verlangen nach einer möglichst breiten Daten- wie auch Anwenderbasis. Daher muss so rasch wie möglich internationalisiert, möglichst globalisiert werden, um Qualität und Effizienz zu steigern und die Marktführerschaft zu erlangen. Das gelingt nicht allein durch internes Wachstum oder Zukauf, sondern vor allem auch durch internationale Kooperationen mit Daten- und Diensteanbietern. Innovationen bei den Data Analytics und bei der Datengewinnung eröffnen neue unternehmerische Spielräume, die die Geschäftsentwicklung auf internationaler Ebene begünstigen.
Dr. Alexander Duisberg: Es erschließt sich in der Tat ein enormes Potenzial, mit global aufgesetzten Datenbanken und aus frei zugänglichen Quellen Innovationen voranzutreiben. Die Chancen, die sich gerade durch den erweiterten Zugang zu Quellen öffentlicher Einrichtungen erschließen, werden dabei insgesamt noch viel zu wenig genutzt. Hier kann man den öffentlichen Institutionen nur Mut zusprechen, deutlich in Richtung größerer Datenfreigaben zu gehen. Unternehmen und Innovatoren können sich bereits jetzt an öffentliche Institutionen wenden und sich dazu auf das Informationsweiterverwendungsgesetz berufen. Aber die Herausgabekriterien sind zu erweitern und zu verbessern, einschließlich der Regelung eines Herausgabeanspruchs. Auf der EU-Ebene ist dies erkannt. Die 2003 erlassene, so genannte PSI-Richtlinie über die Weiterverwendung von Informationen des öffentlichen Sektors wird zurzeit überarbeitet, gerade auch, um einen Innovationsschub für Big Data zu ermöglichen. Alles spricht dafür, dass diejenigen Mitgliedstaaten, die ihre Datenquellen schneller, unbürokratisch, kostengünstig und innovationsorientiert öffnen, dabei früher die Früchte von IKT-basierter Forschung und unternehmerischer Innovation ernten werden.
digitalbusiness CLOUD: Es scheint, als spiele Big Data heute gerade für Zwecke des Online-Marketings eine immer größere Rolle. Welche Trends gibt es hier?
Markus Raatz: Mir kommt es so vor, als sei Web-Marketing der einzige Bereich, in dem Big-Data-Technologien wirklich unumstrittenen Nutzen bringen, auch ökonomisch. Seien wir mal ehrlich: Spieltrieb und Wissensdrang vieler IT-Abteilungen sind sicherlich der Haupt-Beweggrund, dort einmal ein Projekt zu starten. Aber kaum jemand erkennt das Potenzial und den Nutzen davon, dass man große Mengen unstrukturierter Daten schnell auswerten kann, eben das, was Big Data am wirklich besten beherrscht. Als Ergebnis denkt mancher Kunde darüber nach, ob er das alles wirklich auch selbst machen muss. Es machen ja schon die Facebooks, die Amazons, die Yahoos dieser Welt. Oft ist es einfacher, sein Internetmarketing gleich komplett als Dienstleistung einzukaufen, was allerdings einen spannenden neuen Markt darstellt.
digitalbusiness CLOUD: Eine wichtige Frage wurde in der letzten Gesprächsrunde des MÜNCHNER KREISES viel diskutiert: Gibt es aus Ihrer Sicht Verständnis und Akzeptanz in der Bevölkerung für die neuen Möglichkeiten, aus Big Data neues Wissen zu schaffen?
Prof. Arnold Picot: Das hängt sehr stark von dem Nutzen ab, den die breitere Öffentlichkeit bestimmten Big-Data-Diensten beimisst und von der Verantwortung und Transparenz, mit der solche Dienste, sofern sie personenbezogene Aspekte berühren, erbracht werden. Oftmals liegt der Vorteil des durch Big Data erzielbaren Informationsmehrwerts auf der Hand. Die erwähnte Qualitätsverbesserung von Navigationsinformationen durch Big Data dürfte ebenso Akzeptanz finden, wie die auf Big-Data-Analysen aufbauende Interpretation von Resultaten aus bildgebenden Verfahren in der Medizin, bei der Vergleiche mit tausenden ähnlicher Befunde und Krankenakten angestellt werden. Big-Data-Anwendungen im E-Commerce können den Menschen ebenfalls Nutzen bringen, weil sie rascher und qualitätsvoller diejenigen Sach- und Dienstleistungen aufzufinden helfen, die den eigenen Präferenzen entsprechen. Allerdings bedarf es, soweit personenbezogene Daten im Spiel sind, der expliziten Einwilligung der Betroffenen, der transparenten Darstellung der Verarbeitungs- und Speicherungsformen sowie der einfachen Möglichkeit des Rückrufs einer gegebenen Zustimmung. Unter solchen Bedingungen dürfte der Nutzen derartiger Anwendungen die wahrgenommenen Risiken überwiegen, die Sorge vor übermäßiger Überwachung sinkt, so dass eine nachhaltige Akzeptanz die Folge sein kann.
digitalbusiness CLOUD: Meine Herren, wir danken Ihnen für das Gespräch. (ak)
Das Interview führte Till Breitung.
Teilen Sie die Meldung „Big Data: Interview mit dem Münchner Kreis“ mit Ihren Kontakten:
Zugehörige Themen:
Business Intelligence (BI), Data Warehouse, IT-Security | IT-Sicherheit | Cybersecurity