09.05.2022 – Kategorie: Digitalisierung

Datenmanagement: Daten integriert statt isoliert

DatenmanagementQuelle: Mongkolchon - stock.adobe.com

Dass Daten und Analysen Innovationstreiber sind und nicht mehr nur einen Hygienefaktor darstellen, haben viele Unternehmen erkannt. Um Potenziale zu heben, müssen Daten zielführend integriert werden. Komplexe Systemlandschaften und isolierte Datenbestände erschweren dies. Technologien für die erfolgreiche Umsetzung von datengetriebenem Management müssen richtig eingesetzt werden.

Datenmanagement in der Praxis: Prozessdaten spiegeln die Wertschöpfung von Unternehmen wider. Die Daten bilden die Grundlage für die Analyse und Optimierung von Geschäftsprozessen. Die effiziente Abwicklung von Geschäftsprozessen bildet dabei einen wesentlichen Faktor der Wettbewerbsfähigkeit von Unternehmen. Neben der inter­nen Sicht bieten Daten von Geschäftspartnern z.B. in Form von Aufträgen eine Möglichkeit etwaige Trends erkennen (z.B. Verschiebung in der Nachfrage) und so bereits früh reagieren können.

Datenmanagement: Die richtige Integration

Für aussagekräftige Analysen ist die Integration unterschiedlicher Daten erforderlich. Zumeist setzen Unternehmen eine Vielzahl von Systemen (z.B. ERP, CRM, MES) ein, welche jeweils eine eigene Datenhaltung aufweisen. Die Integration der Insellösungen stellt dabei eine Voraussetzung für die ganzheitliche Perspektive und datengetriebenes Management dar.

Die Vielzahl hierzu verfügbarer Lösungen kann Anwender häufig mit der Auswahl der für sie geeigneten Lösungen überfordern. Dieser Beitrag bietet einen Überblick über verfügbare Systemklassen und gibt Empfehlungen für Anwender.

Technologien

Grundsätzlich kann zwischen drei Systemkategorien unterschieden werden:

Erstens stellt das Data Warehouse (DWH) ein speziell für analytische Bedarfe optimiertes Datenbanksystem dar. Die abfrageoptimierte Organisation der Daten ermöglicht die performante und flexible Nutzung in nachgelagerten Analysen. Beispielsweise können entsprechende Data Cubes (Datenwürfel) vorberechnet werden. So kann zum Bespiel ein Händler mit vielen Filialen Auswertungen über Produktgruppen (Dimension 1) und Standorte (Dimension 2) vorbereiten und anschließend schnelle Ergebnisse erhalten. Ein Data Lake (DL) bietet im Unterschied dazu die Möglichkeit zur unstrukturierten Ablage großer Datenmengen. Die Ablage erfolgt meist umfassend und ohne Filterung. Umfangreiche Datenmengen erfordern günstige Speichermöglichkeiten.

Um die jeweiligen Vorteile zu nutzen, kombinieren Unternehmen unterschiedliche Konzepte.

Schließlich können sogenannte Data Platforms verschiedene Datenbanksysteme und zugehörige Tools für den analytischen Gebrauch vorhalten. Neben Data Warehouse und Data Lake Komponenten können so ergänzende Tools im Angebotsumfang enthalten sein (bspw. ETL-Tools).

Welche Lösung brauche ich für mein Datenmanagement?

Die Auswahl einer geeigneten oder mehrerer kombinierter Lösungen für Datenmanagement hängt von unterschiedlichen Faktoren ab. Für die Auswahl sollten unternehmensspezifische Anforderungen der Datenquellen und deren Datenbestände (1), Anforderungen an die analyseorientierte Speicherung (2) und Anforderungen der Konsumenten(-Systeme) (3) beachtet werden .

1. Anforderungen an Daten und Datenquellen

Die Struktur der Daten beeinflusst die geeignete Ablage der Daten. Strukturierte Daten welche als normalisierte, meist relationale, Daten (z.B. aus ERP, CRM-Systemen) vorliegen, können in einem entsprechend strukturorientierten Data Warehouse abgebildet werden. Nicht oder nur teilweise strukturierte Daten (z.B. Bilddaten, Click-Streams) eigenen sich ohne Vorverarbeitung für die Ablage in einem Data Lake als un­abhängige Dokumente. Das Volumen unterscheidet ebenfalls die geeignete Ablage. Strukturierte Daten, welche zumeist niedrige bis mittlere Umfänge einnehmen, eigenen sich für die Ablage im DWH. Bei großvolumigen Daten, welche sich zumeist aus geringer Vorverarbeitung und Selektion ergeben, eigenen sich für ein DL und nach Verarbeitung ggf. für ein DWH. Zur Performancesteigerung ist der Einsatz von Data Engines denkbar.

Hinsichtlich der Anzahl an Quellsystemen unterscheidet sich der Bedarf an Automatisierung und Ver­arbeitungsschritten. DWHs eigenen sich als einzelne Lösung bei hohen Anforderungen an Struktur und Datenqualität sowie geringer Anzahl Quellsysteme. Data Engines bei Performancebedarfen und hohem Automatisierungsbedarf ggf. in Kombination mit weiteren Data Platform-Ansätzen. Bei umfangreichen Transformationen ist zumeist ein dediziertes ETL-Tool notwendig.

2. Anforderungen an analyseorientierte Speicherung

In Abhängigkeit der Affinität eigenen sich unterschiedliche Lösungen. Bei geringer Erfahrung bieten sich schlanke Architekturen und Ablageverfahren nahe dem Quellformat an (z.B. DWH anstatt DL). Prozesse können mittels Automatisierung standardisiert werden. Bei hoher Affinität bieten z.B. eine kombinierte Architektur aus DWH und DL eingesetzt werden, die eine Vorhaltung der Daten in unterschiedlichen Qualitäts- und Verarbeitungsstufen ermöglicht.

Hinsichtlich der Ablage der Daten sind Cloud von On-Premises Lösungen zu differenzieren. Bei Cloud-Lösung stehen, insbesondere für variable Bedarfe, Ressourcen flexibel zur Verfügung.

3. Anforderungen an Datenkonsumption

Abschließend ist die geplante Verwendung der Daten für die Verwendung endscheidend. Werden insbesondere Business Analytics Anwendungsfälle (z.B. BI, Dashboards, Reports) gewünscht, so eigenen sich strukturierte Ablageformate im DWH für die Weiterverwendung. Ist die Erkennung komplexer Zusammenhänge in großen Datenmengen und Ablage von Rohdaten vorgesehen, so eigenen sich ein Data Lake als Grundlage für statistische Analysen.

Datenmanagement: Zusammenfassung

Für eine zielführende Analytics Infrastruktur und die Auswahl der Lösungen müssen Anwender über die Anforderungen und Verwendung der Daten im Klaren sein. Die Anforderungen und Einflussfaktoren können entsprechend dem Schema dieses Beitrags zur Konzeption und Entwicklung einer geeigneten Infrastruktur genutzt werden.

Bei der Auswahl von Lösungen für Datenmanagement sollten auch zukünftige Szenarien und geplante Entwicklungen berücksichtigt werden. Anwender sollten auf modulare, erweiterbare Lösungen achten, damit auch mittelfristige Anforderungen abgebildet werden können.

Die Autoren: Dr. Benedict Bender (l.) forscht an der Universität Potsdam zu digitalen Plattformen, Geschäftsmodelle, ERP sowie Management Analytics. Tim Körppen ist wissenschaftliche Hilfskraft am Lehrstuhl für Wirtschaftsinformatik, insb. Prozesse und Systeme an der Universität Potsdam.

Lesen Sie auch: IT-Infrastruktur: Wie IT-Verantwortliche flexible Arbeitsmodelle umsetzen können


Teilen Sie die Meldung „Datenmanagement: Daten integriert statt isoliert“ mit Ihren Kontakten:


Scroll to Top