Einleitung

In der heutigen datengetriebenen Welt sind Data Warehouses unverzichtbare Instrumente für Unternehmen, die ihre Geschäftsentscheidungen auf fundierten Datenanalysen basieren möchten. In diesem Blog-Post werden wir den klassischen Aufbau eines Data Warehouses, die LSA-Referenzarchitektur und ihre agile Erweiterung untersuchen.

klassischer Aufbau eine Data Warehouses

Data Warehouses dienen Unternehmen als zentrale Speicherorte, um Daten zu sammeln, zu speichern und zu analysieren. Diese Strukturen sind entscheidend, um fundierte Entscheidungen zu treffen, neue Erkenntnisse zu gewinnen und Geschäftsprozesse zu optimieren.

Wikipedia

Es gibt verschiedene Architekturen für Data Warehouses. Eine der am weitesten verbreiteten ist der klassische Aufbau aus drei Schichten:

  • ETL-Schicht: Die ETL-Schicht ist für den Import und die Verarbeitung der Daten aus den Quellsystemen verantwortlich. Sie extrahiert die Daten aus den Quellsystemen, transformiert sie in ein einheitliches Format und lädt sie in das Data Warehouse.
  • Data Warehouse-Schicht: Die Data Warehouse-Schicht ist für die Speicherung detaillierter Daten verantwortlich. Detaillierte Daten sind Daten, die in ihrer ursprünglichen Form gespeichert wurden. Data Warehouses enthalten in der Regel sowohl aggregierte als auch detaillierte Daten.
  • Data Mart-Schicht: Die Data Mart-Schicht ist für die Speicherung aggregierter Daten verantwortlich. Aggregierte Daten sind Daten, die zusammengefasst wurden, um eine bessere Übersicht zu bieten. Data Marts werden häufig für spezifische Geschäftsbereiche oder Anwendungsfälle erstellt.

Vorteile des klassischen Aufbaus

Der klassische Aufbau bietet eine Reihe von Vorteilen, darunter:

  • Transparenz: Der klassische Aufbau bietet eine klare Trennung zwischen den verschiedenen Schichten. Dies kann die Transparenz und die Zusammenarbeit verbessern.
  • Skalierbarkeit: Der klassische Aufbau ist skalierbar, um den wachsenden Anforderungen an Datenvolumen und Datenanalyse-Leistung gerecht zu werden.
  • Effizienz: Der klassische Aufbau kann die Speicherplatznutzung und die Abfrageleistung verbessern.

Nachteile des klassischen Aufbaus

Der klassische Aufbau hat auch einige Nachteile, darunter:

  • Komplexität: Der klassische Aufbau kann komplex sein, insbesondere für große Unternehmen mit einer großen Anzahl von Quellsystemen.
  • Kosten: Der klassische Aufbau kann teuer sein, insbesondere wenn eine große Anzahl von Datenquellen integriert werden müssen.
  • Flexibilität: Der klassische Aufbau ist nicht immer flexibel genug, um sich an die sich ändernden Anforderungen von Unternehmen anzupassen.

Der klassische Aufbau ist eine solide Grundlage für den Aufbau von Data Warehouses. Er bietet eine Reihe von Vorteilen, darunter Transparenz, Skalierbarkeit und Effizienz. Allerdings kann der klassische Aufbau auch komplex, teuer und nicht immer flexibel genug sein. Unternehmen sollten daher die individuellen Anforderungen sorgfältig abwägen, bevor sie sich für einen bestimmten Aufbau entscheiden.

klassische LSA Referenzarchitektur

Nachdem wir den klassischen Aufbau eines Data Warehouses betrachtet haben, wenden wir uns nun einer spezifischen Architektur zu, die von SAP empfohlen wird: der klassischen LSA Referenzarchitektur.

Die klassische LSA Referenzarchitektur ist eine Architektur, die von SAP für den Aufbau von SAP Business Warehouse (BW) Systemen empfohlen wird. Sie wurde entwickelt, um eine hohe Performance und Skalierbarkeit zu gewährleisten.

Ziele der LSA-Referenzarchitektur

  • Transparenz: Die LSA-Referenzarchitektur soll die Systemarchitektur vereinfachen und die Komplexität reduzieren, indem Objekte und Dienste in Schichten modelliert werden.
  • Skalierbarkeit: Die LSA-Referenzarchitektur soll die Flexibilität verbessern und die Ressourcennutzung optimieren, indem Skalierbarkeitsaspekte berücksichtigt werden.

Architektur der LSA-Referenzarchitektur

entnommen aus ERP4Students SAP_BW4H II-1 basierend auf Schüler und Staade 2010

Die LSA-Referenzarchitektur besteht aus zwei Hauptschichten:

  • Enterprise Data Warehouse (EDW)-Schicht: Die EDW-Schicht ist der zentrale Datenspeicher für alle Daten des Unternehmens. Sie besteht aus den folgenden Teilschichten:
    • Data Integration Layer (DIL): Der DIL ist für den Import und die Verarbeitung der Daten aus den Quellsystemen verantwortlich.
    • Data Warehouse Layer (DWH): Der DWH ist für die Speicherung der detaillierten Daten verantwortlich.
  • Architected Data Mart (ADM)-Schicht: Die ADM-Schicht ist für die Speicherung aggregierter Daten verantwortlich. Sie besteht aus den folgenden Teilschichten:
    • Business Data Warehouse (BDW): Das BDW ist für die Speicherung aggregierter Daten für spezifische Geschäftsbereiche verantwortlich.
    • Reporting Data Warehouse (RDW): Das RDW ist für die Speicherung aggregierter Daten für Berichtszwecke verantwortlich.

Schichten im Detail

(1) Data Acquisition Layer

Die Data Acquisition Layer (Datenerfassungsschicht) ist für den Import und die Verarbeitung der Daten aus den Quellsystemen verantwortlich. Sie sammelt die Daten aus den verschiedenen Datenquellen des Unternehmens, z. B. aus ERP-Systemen, CRM-Systemen, Finanzsystemen und operativen Systemen.

Die Data Acquisition Layer kann verschiedene Technologien verwenden, um die Daten zu importieren, z. B. ETL-Tools, SLT (SAP HANA Load Tool) oder SAP Data Services.

(2) Quality (or) Harmonization Layer

Die Quality (or) Harmonization Layer (Qualitäts- oder Harmonisierungsschicht) ist für die Qualitätssicherung und Harmonisierung der Daten verantwortlich. Sie überprüft die Daten auf Vollständigkeit, Konsistenz und Richtigkeit und sorgt dafür, dass die Daten in einem einheitlichen Format gespeichert werden.

Die Quality (or) Harmonization Layer kann verschiedene Technologien verwenden, um die Daten zu prüfen, z. B. Data Quality Tools, Data Profiler oder SAP Data Quality Management.

(3) Corporate Memory

Die Corporate Memory (Konzerngedächtnis) ist eine zentrale Wissensdatenbank, in der das Unternehmen seine wichtigsten Daten und Informationen speichert. Sie enthält Informationen aus verschiedenen Bereichen, z. B. aus Produkten und Dienstleistungen, Kunden und Lieferanten, Prozessen und Strategien.

Die Corporate Memory wird von verschiedenen Anwendungen im Unternehmen verwendet, z. B. von Reporting-Tools, Analysetools und Planungstools.

(4) Propagation Layer

Die Propogation Layer (Verbreitungsschicht) ist für die Verteilung der Daten an die verschiedenen Benutzer und Anwendungen verantwortlich. Sie stellt die Daten in einem formatierten Format bereit, das von den verschiedenen Anwendungen verwendet werden kann.

Die Propogation Layer kann verschiedene Technologien verwenden, um die Daten zu verteilen, z. B. SAP BW-ODS-Objekte, SAP BW-InfoCubes oder SAP BI-Server.

(5) Business Transformation Layer

Die Business transformation Layer (Geschäftstransformationsschicht) ist für die Transformation der Daten für spezifische Geschäftszwecke verantwortlich. Sie wendet geschäftliche Regeln an, um die Daten für die Analyse und Reporting zubereiten.

Die Business transformation Layer kann verschiedene Technologien verwenden, um die Daten zu transformieren, z. B. SAP BW-Transformationen, SAP BW-ABAP-Code oder SAP BI-Analysetools.

(6) Reporting Layer

Die Reporting Layer (Berichtsschicht) ist für die Bereitstellung von Daten für Berichtszwecke verantwortlich. Sie erstellt Berichte, die die Daten für die Geschäftsbewertung und Entscheidungsfindung visualisieren.

Die Reporting Layer kann verschiedene Technologien verwenden, um Berichte zu erstellen, z. B. SAP BW-Reporting-Tools, SAP BI-Frontend-Tools oder SAP Lumira.

(7) Operational Data Store Layer

Die Operational Data Store Layer (operatives Data Warehouse) ist für die Speicherung operativer Daten verantwortlich. Sie speichert Daten, die für die operativen Anwendungen des Unternehmens benötigt werden, z. B. für die Lagerverwaltung, die Finanzbuchhaltung oder den Kundenservice.

Die Operational Data Store Layer kann verschiedene Technologien verwenden, um Daten zu speichern, z. B. SAP HANA, SAP HANA XS oder SAP BusinessObjects Warehouse.

Vergleich der klassischen LSA-Referenzarchitektur und dem DWH

Die ETL-Schicht des klassischen Aufbaus entspricht dem Data Integration Layer (DIL) der LSA-Referenzarchitektur. Der DIL ist verantwortlich für den Import und die Verarbeitung der Daten aus den Quellsystemen.

Die Data Mart-Schicht des klassischen Aufbaus entspricht der Architected Data Mart (ADM)-Schicht der LSA-Referenzarchitektur. Die ADM-Schicht ist für die Speicherung aggregierter Daten verantwortlich.

Die Data Warehouse-Schicht des klassischen Aufbaus entspricht der Enterprise Data Warehouse (EDW)-Schicht der LSA-Referenzarchitektur. Die EDW-Schicht ist der zentrale Datenspeicher für alle Daten des Unternehmens.

Der Hauptunterschied zwischen dem klassischen Aufbau und der LSA-Referenzarchitektur ist, dass die LSA-Referenzarchitektur eine zusätzliche Schicht enthält, die Enterprise Data Warehouse (EDW)-Schicht. Die EDW-Schicht ist der zentrale Datenspeicher für alle Daten des Unternehmens. Dies bietet eine Reihe von Vorteilen, darunter:

  • Transparenz: Die EDW-Schicht ermöglicht es Unternehmen, ihre Daten in einem zentralen Ort zu speichern und zu verwalten. Dies kann die Transparenz und die Zusammenarbeit verbessern.
  • Skalierbarkeit: Die EDW-Schicht ist skalierbar, um den wachsenden Anforderungen an Datenvolumen und Datenanalyse-Leistung gerecht zu werden.
  • Effizienz: Die EDW-Schicht kann die Speicherplatznutzung und die Abfrageleistung verbessern.

Vor- und Nachteile der klassischen LSA-Referenzarchitektur

Hier sind einige der Vorteile der klassischen LSA Referenzarchitektur:

  • Hohe Performance
  • Skalierbarkeit
  • Flexibilität

Hier sind einige der Nachteile der klassischen LSA Referenzarchitektur:

  • Komplexität
  • Kosten

Die klassische LSA Referenzarchitektur ist eine bewährte Architektur, die von SAP empfohlen wird. Sie bietet eine hohe Performance und Skalierbarkeit, aber sie ist auch komplex und teuer.

Links & Videos

LSA für SAP BW/4HANA (LSA++)

Während die klassische LSA-Referenzarchitektur bereits beeindruckende Funktionen bietet, geht die LSA++ einen Schritt weiter und bietet Unternehmen die Möglichkeit, ihre Data Warehouse-Architekturen flexibel an sich ändernde Anforderungen anzupassen.

Hauptschichten

Die LSA++ Architektur besteht aus vier Schichten:

  • Interaktiv: Die Interaktive Schicht ist für die schnelle Abfrage von aktuellen Daten verantwortlich.
  • Integriert: Die Integrierte Schicht ist für die Speicherung von aggregierten Daten verantwortlich.
  • Nearline: Die Nearline-Schicht ist für die Speicherung von historischen Daten verantwortlich.
  • Archiviert: Die Archivierte Schicht ist für die langfristige Speicherung von historischen Daten verantwortlich.

Schichten im Detail (von unten nach oben)

  • Datenquellen: Datenquellen sind die Systeme, aus denen die Daten für die LSA++-Architektur stammen. Zu den Datenquellen gehören ERP-Systeme, CRM-Systeme, Finanzsysteme und operative Systeme. Die Daten aus den Datenquellen werden in die Interaktiv-Schicht geladen.
  • ODS: Das ODS (Operational Data Store) ist eine Zwischenschicht, in der die Daten aus den Datenquellen in ein einheitliches Format konvertiert werden. Das ODS enthält die Daten, die für die Analyse und Reporting benötigt werden.
  • Flexibles EDW Core: Der Flexibles EDW Core ist eine zentrale Datenschicht in der LSA++-Architektur, die die Daten aus der Interaktiv-Schicht und dem ODS zusammenführt. Der Flexibles EDW Core enthält die Daten, die für die Analyse und Reporting in Echtzeit und Nearline benötigt werden.
    • EDW: Das EDW (Enterprise Data Warehouse) ist die oberste Schicht des Flexibles EDW Core und enthält die Daten aus der Interaktiv-Schicht und dem ODS.
    • Architected Data Marts: Die Architected Data Marts sind eine virtuelle Ansicht der Daten aus den Data Marts in der Integriert-Schicht. Sie werden häufig für die Berichterstellung und Analyse verwendet.
    • Corporate Memory: Die Corporate Memory ist eine zentrale Wissensdatenbank in der LSA++-Architektur, die Informationen aus verschiedenen Bereichen des Unternehmens zusammenführt. Die Corporate Memory enthält Informationen aus verschiedenen Quellen, wie ERP-Systemen, CRM-Systemen, Finanzsystemen und operativen Systemen.
  • Data Marts: Data Marts sind dedizierte Datenspeicher für bestimmte Geschäftsbereiche oder Abteilungen. Die Data Marts enthalten die Daten, die für die Analyse und Reporting in diesen Bereichen benötigt werden.
  • Nearline: Die Nearline-Schicht ist eine Zwischenschicht, in der die Daten aus den operativen Systemen für die langfristige Speicherung vorbereitet werden. Die Nearline-Schicht enthält die Daten, die für die Analyse und Reporting in der Zukunft benötigt werden.
  • Archiviert: Die Archiviert-Schicht ist die oberste Schicht der LSA++-Architektur und enthält die Daten, die für die historische Analyse benötigt werden.
  • Query Schicht: Die Query Schicht ist für die Verarbeitung der Abfragen der Benutzer an die Daten in den verschiedenen Schichten der Architektur verantwortlich.
  • Reporting Schicht: Die Reporting Schicht ist für die Erstellung von Berichten aus den Daten in den verschiedenen Schichten der Architektur verantwortlich.
entnommen aus ERP4Students SAP_BW4H II-1 basierend auf SAP Online Library

SAP BW/4HANA

Die LSA++ Architektur ist nur mit SAP BW/4HANA kompatibel. SAP BW/4HANA ist die neueste Version von SAP BW und bietet eine Reihe von Funktionen, die LSA++ ermöglichen.

SAP BW/4HANA ist eine in-memory-Datenbank, die für die schnelle Verarbeitung großer Datenmengen entwickelt wurde. Sie bietet folgende Vorteile, die LSA++ ermöglichen:

  • In-memory-Verarbeitung: LSA++ kann Daten in SAP HANA in-memory speichern und verarbeiten. Dies führt zu einer deutlichen Leistungssteigerung bei Abfragen und Analysen.
  • Komprimierung: SAP HANA bietet eine Reihe von Komprimierungstechniken, die die Speicherplatznutzung von Daten reduzieren können. Dies ist für LSA++ wichtig, da es eine effiziente Datenspeicherung benötigt.
  • Denormalisierung: SAP HANA bietet eine Reihe von Denormalisierungstechniken, die die Daten in einer Weise speichern können, die für Abfragen effizienter ist. Dies ist für LSA++ wichtig, da es eine intelligentere Datenspeicherung benötigt.
  • Aggregation: SAP HANA bietet eine Reihe von Aggregationstechniken, die die Daten auf aggregierte Weise speichern können, um die Abfrageleistung zu verbessern. Dies ist für LSA++ wichtig, da es eine intelligentere Datenspeicherung benötigt.

SAP BW/4HANA wird benötigt, um die Vorteile der LSA++ Architektur zu nutzen. Ohne SAP BW/4HANA wäre die LSA++ Architektur nicht möglich.

Die LSA++ Architektur nutzt die Funktionen und Vorteile von SAP HANA, um eine skalierbare und flexible Data Warehouse-Architektur zu bieten, die gleichzeitig effizienter, einfacher und kostengünstiger ist als die klassische LSA Architektur.

Unternehmen, die LSA++ nutzen möchten, müssen daher SAP BW/4HANA einsetzen.

Unterscheidung zwischen LSA und LSA++

Die LSA++-Architektur ist eine Weiterentwicklung der klassischen LSA-Architektur. Sie bietet eine Reihe von Verbesserungen, wie z. B.:

  • Effizientere Datenintegration: Die LSA++-Architektur nutzt ETL-Tools, um die Daten aus den verschiedenen Quellen in ein einheitliches Format zu konvertieren. Dies führt zu einer effizienteren Datenintegration und verbessert die Qualität der Daten.
  • Flexiblere Datenbereitstellung: Die LSA++-Architektur bietet eine flexible Datenbereitstellung, die auf die jeweiligen Anforderungen des Unternehmens zugeschnitten werden kann. Dies wird durch die Verwendung von Data Marts und der Architected Data Mart Sicht erreicht.
  • Verbesserte Datenanalyse: Die LSA++-Architektur bietet eine verbesserte Datenanalyse, die durch die Verwendung von Data Marts und der Architected Data Mart Sicht ermöglicht wird. Data Marts bieten eine fokussierte Ansicht der Daten, die für die Analyse in bestimmten Geschäftsbereichen oder Abteilungen benötigt werden. Die Architected Data Mart Sicht ermöglicht es Benutzern, die Daten aus verschiedenen Data Marts in einer einzigen Ansicht zu kombinieren.

In Bezug auf die einzelnen Schichten der LSA++-Architektur können die folgenden Beziehungen zum klassischen LSA hergestellt werden:

  • Datenquellen: Die Datenquellen sind in beiden Architekturen dieselben.
  • ODS: Das ODS ist in beiden Architekturen eine Zwischenschicht, in der die Daten aus den Datenquellen in ein einheitliches Format konvertiert werden.
  • Flexibles EDW Core: Das Flexibles EDW Core ist eine neue Schicht in der LSA++-Architektur. Es ist eine zentrale Datenschicht, die die Daten aus der Interaktiv-Schicht und dem ODS zusammenführt.
  • EDW: Das EDW ist in beiden Architekturen die oberste Schicht und enthält die Daten aus der Interaktiv-Schicht und dem ODS.
  • Architected Data Marts: Die Architected Data Marts sind eine neue Schicht in der LSA++-Architektur. Sie sind eine virtuelle Ansicht der Daten aus den Data Marts in der Integriert-Schicht.
  • Corporate Memory: Die Corporate Memory ist eine neue Schicht in der LSA++-Architektur. Sie ist eine zentrale Wissensdatenbank, die Informationen aus verschiedenen Bereichen des Unternehmens zusammenführt.
  • Data Marts: Data Marts sind in beiden Architekturen dedizierte Datenspeicher für bestimmte Geschäftsbereiche oder Abteilungen.
  • Query Schicht: Die Query Schicht ist in beiden Architekturen für die Verarbeitung der Abfragen der Benutzer an die Daten in den verschiedenen Schichten verantwortlich.
  • Reporting Schicht: Die Reporting Schicht ist in beiden Architekturen für die Erstellung von Berichten aus den Daten in den verschiedenen Schichten verantwortlich.
LSA++-ArchitekturKlassische LSA
DatenquellenDatenquellen
ODSODS
Flexibles EDW Core
EDWEDW
Architected Data Marts
Corporate Memory
Data MartsData Marts
Query SchichtQuery Schicht
Reporting SchichtReporting Schicht
selbst erstellt

Links & Videos

agile Erweiterung der LSA++

Die agile Erweiterung der LSA++ geht einen Schritt weiter und ermöglicht es Unternehmen, ihre Data Warehouse-Architekturen an sich ändernde Anforderungen anzupassen. Dazu bietet die agile Erweiterung der LSA++ eine Reihe von Funktionen, wie z. B.:

  • Dezentralisierung: Die Daten können in dezentralen Data Marts gespeichert werden, die näher an den Benutzern liegen. Dies kann die Performance verbessern und die Kosten für die Datenbereitstellung senken.
  • Virtualisierung: Die Daten können in virtuellen Data Marts bereitgestellt werden, die die Daten aus verschiedenen Quellen zusammenführen. Dies kann die Flexibilität der Datenbereitstellung verbessern.
  • Automatisierung: Die Datenintegration und Datenbereitstellung können automatisiert werden, um den Aufwand für die Wartung der Data Warehouse-Architektur zu reduzieren.

Die agile Erweiterung der LSA++ bietet eine Reihe von Vorteilen gegenüber der klassischen LSA++-Architektur:

  • Flexibilität: Die agile Erweiterung der LSA++ bietet Unternehmen mehr Flexibilität bei der Anpassung ihrer Data Warehouse-Architekturen an sich ändernde Anforderungen.
  • Effizienz: Die Dezentralisierung und Virtualisierung der Daten kann die Performance und die Kosten für die Datenbereitstellung verbessern.
  • Automatisierung: Die Automatisierung der Datenintegration und Datenbereitstellung kann den Aufwand für die Wartung der Data Warehouse-Architektur reduzieren.

Die agile Erweiterung der LSA++ hat jedoch auch einige Nachteile:

  • Komplexität: Die agile Erweiterung der LSA++ ist komplexer als die klassische LSA++-Architektur. Dies kann zu einem höheren Schulungs- und Wartungsaufwand führen.
  • Hohe Kosten: Die agile Erweiterung der LSA++ kann teurer sein als die klassische LSA++-Architektur, da sie zusätzliche Hardware und Software erfordert.

Die Entscheidung, ob die agile Erweiterung der LSA++ verwendet werden soll, hängt von den jeweiligen Anforderungen des Unternehmens ab. Wenn ein Unternehmen eine flexible und effiziente Data Warehouse-Architektur benötigt, ist die agile Erweiterung der LSA++ eine gute Wahl. Wenn ein Unternehmen jedoch eine einfache und kostengünstige Lösung benötigt, ist die klassische LSA++-Architektur eine gute Alternative.

Fazit

Data Warehouses sind entscheidend für Unternehmen, die ihre Daten effektiv nutzen möchten. Während der klassische Aufbau eine solide Grundlage bietet, bieten die LSA- und LSA++-Architekturen zusätzliche Flexibilität und Funktionen, die besonders für große Unternehmen von Vorteil sein können. Die Wahl der richtigen Architektur hängt von den spezifischen Anforderungen und Ressourcen eines Unternehmens ab. Es ist wichtig, die Vor- und Nachteile jeder Option sorgfältig abzuwägen, um die beste Entscheidung für das eigene Unternehmen zu treffen.