Headerbild zu Data Vault

Data Vault als Modellierungsansatz von Data Warehouse

Profitieren Sie von Data Vault als Modellierungstechnik für Data Warehouses, das für ein schnelles Verständnis der Daten, mehr Flexibilität, Historisierung und parallele Datenladeprozesse sorgt.

Herausforderungen klassischer Data Warehouses

Im Data Warehouse-Umfeld gibt es zwei bekannte Modellierungsansätze nach Kimball und Inmon, die seit unzähligen Jahren verwendet werden, wenn es um die Speicherung von Daten geht. Diese müssen sich jedoch immer mehr den wachsenden Herausforderungen stellen:

Neue Anforderungen

Anforderungen an Technologien, Konzepten und Best Practices im Arbeitsumfeld haben sich stetig weiterentwickelt.

Größere Datenmengen

Oftmals stellen größere Datenmengen und die geforderte Flexibilität an die heutigen Systeme große Probleme für diese Ansätze dar.

Wachsende IT-Kosten

Einer der wesentlichen Vorteile dieses Modellierungsansatzes liegt in der Flexibilität gegenüber Änderungen, was sich natürlich auch bei den Kosten bemerkbar macht.

Es ist daher fraglich, ob diese Ansätze bei allen modernen Fragestellungen und Anforderungen der heutigen Zeit noch angemessen sind. Aus dieser Überlegung heraus entstand der Data Vault-Modellierungsansatz.

Was ist Data Vault?

Data Vault ist eine Modellierungstechnik, die insbesondere für agile Data Warehouses geeignet ist. Sie bietet eine hohe Flexibilität bei Erweiterungen, eine vollständige Historisierung der Daten und erlaubt eine Parallelisierung der Datenladeprozesse.

Dieser hybride Ansatz vereint alle Vorteile der dritten Normalform mit dem Sternschema. Gerade in der heutigen Zeit müssen Unternehmen in immer kürzeren Zyklen ihre Geschäfte transformieren und diese Transformationen im Data Warehouse abbilden. Data Vault unterstützt genau diese Anforderungen, ohne die Komplexität des Data Warehouses im Laufe der Zeit wesentlich zu erhöhen. Anders als bei Kimball und Inmon entfallen dadurch die immer stärker wachsenden IT Kosten für die umfangreichen Implementierungs- und Testzyklen sowie eine lange Liste von möglichen Abhängigkeiten.

Vorgehensweise bei Data Vault

Die Datenintegrationsarchitektur des Data Vault-Ansatzes verfügt über robuste Standards und Definitionsmethoden, die Informationen zusammenführen, um sie sinnvoll zu nutzen. Das Modell besteht aus drei grundlegenden Tabellentypen:

Schaubild zur Veranschaulichung der Datenintegrationsarchitektur des Data Vault Ansatzes
  • Hub (blau)
    Enthält eine Liste eindeutiger Geschäftsschlüssel, wie z.B. Kundennummern

  • Link (orange)
    Stellt Beziehungen zwischen den Geschäftsschlüsseln her. Links werden häufig verwendet, um Änderungen in der Datengranularität zu behandeln und die Auswirkungen des Hinzufügens eines neuen Geschäftsschlüssels zu einem verknüpften Hub zu reduzieren.

  • Satellit (türkis)
    Enthält beschreibende Attribute, die sich im Laufe der Zeit ändern können. Wo Hubs und Links die Struktur des Datenmodells bilden, enthalten die Satelliten zeitliche und beschreibende Attribute einschließlich Metadaten, die sie mit ihrem übergeordneten Hub oder den Link-Tabellen verknüpfen. 

Vorteile von Data Vault

Auf Grund der Struktur und den definierten Standards ergeben sich viele Vorteile für den Data Vault-Ansatz:

  • Massive Reduzierung von Entwicklungszeit bei der Implementierung von Business-Anforderungen
  • Früherer Return of Investment (ROI)
  • Skalierbares Data Warehouse
  • Nachvollziehbarkeit aller Daten bis zum Quellsystem
  • Near-Real-Time Beladung (neben klassischem Batch Lauf)
  • Big Data Processing (>Terabytes)
  • Iterative, agile Entwicklungszyklen mit inkrementellem Ausbau des DWHs
  • Wenige, automatisierbare ETL Patterns

Nehmen Sie jetzt Kontakt zu uns auf!

Gerne beraten wir Sie in einem unverbindlichen Gespräch und zeigen Ihnen die Potenziale und Möglichkeiten von Data Vault auf. Hinterlassen Sie einfach Ihre Kontaktdaten und wir melden uns dann schnellstmöglich bei Ihnen.

* Pflichtfelder

Wir verwenden die von Ihnen an uns gesendeten Angaben nur, um auf Ihren Wunsch hin mit Ihnen Kontakt im Zusammenhang mit Ihrer Anfrage aufzunehmen. Alle weiteren Informationen können Sie unseren Datenschutzhinweisen entnehmen.

Bitte Captcha lösen!

captcha image
Marc Bastien
Software Architect TIMETOACT Software & Consulting GmbH
Headerbild zu Data Vault
Service

Data Vault als Modellierungsansatz von Data Warehouse

Data Vault ist eine Modellierungstechnik, die insbesondere für agile Data Warehouses geeignet ist. Sie bietet eine hohe Flexibilität bei Erweiterungen, eine vollständige Historierung der Daten und erlaubt eine Parallelisierung der Datenadeprozesse. Data Vault unterstützt ohne die Komplexität des Data Warehouses im Laufe der Zeit wesentlich zu erhöhen.

Headerbild zu Big Data, Data Lake und Data Warehouse
Service

Data Lake & Data Warehousing zur Speicherung von Big Data

Für die optimale Lösung – unter besonderer Berücksichtigung der fachlichen Anforderungen – kombinieren wir unterschiedliche Funktionalitäten.

Headerbild zu Big Data, Data Lake und Data Warehouse
Service

Data Lake & Data Warehousing zur Speicherung von Big Data

Für die optimale Lösung – unter besonderer Berücksichtigung der fachlichen Anforderungen – kombinieren wir unterschiedliche Funktionalitäten.

Header Konnzeption individueller Business Intelligence Lösungen
Service

Konzeption individueller Business Intelligence-Lösungen

Wir setzen wir auf Workshops, um sowohl die technischen als auch fachlichen Anforderungen aufzunehmen, die richtige Technologie zu finden und eine individuell auf Sie zugeschnittene Business Intelligence-Lösung zu konzipieren.

Header Konnzeption individueller Business Intelligence Lösungen
Service

Konzeption individueller Business Intelligence-Lösungen

Wir setzen wir auf Workshops, um sowohl die technischen als auch fachlichen Anforderungen aufzunehmen, die richtige Technologie zu finden und eine individuell auf Sie zugeschnittene Business Intelligence-Lösung zu konzipieren.

Navigationsbild zu Business Intelligence
Service

Analytics & Business Intelligence

Business Intelligence (BI) ist ein technologiegetriebener Prozess zur Analyse von Daten und zur Darstellung von verwertbaren Informationen. Dies bildet die Basis dafür, dass Entscheidungen auf fundierten Informationen getroffen werden können.

Navigationsbild zu Business Intelligence
Service

Analytics & Business Intelligence

Business Intelligence (BI) ist ein technologiegetriebener Prozess zur Analyse von Daten und zur Darstellung von verwertbaren Informationen. Dies bildet die Basis dafür, dass Entscheidungen auf fundierten Informationen getroffen werden können.

Boxhandschuhe als Symbol für Entscheidung zwischen Data Lake und Data Warehouse
Blog 15.02.22

Data Lake vs Data Warehouse: Welche Lösung ist die Richtige?

Geht es um die Speicherung großer Datenmengen, kommt man um die Begriffe Data Lake und Data Warehouse kaum herum. Vielen Unternehmen stellt sich früher oder später die Frage, welche der beiden Lösungen für welchen Anwendungsfall geeignet ist.

Boxhandschuhe als Symbol für Entscheidung zwischen Data Lake und Data Warehouse
Blog 15.02.22

Data Lake vs Data Warehouse: Welche Lösung ist die Richtige?

Geht es um die Speicherung großer Datenmengen, kommt man um die Begriffe Data Lake und Data Warehouse kaum herum. Vielen Unternehmen stellt sich früher oder später die Frage, welche der beiden Lösungen für welchen Anwendungsfall geeignet ist.

Boxhandschuhe als Symbol für Entscheidung zwischen Data Lake und Data Warehouse
Blog 15.02.22

Data Lake vs Data Warehouse: Welche Lösung ist die Richtige?

Geht es um die Speicherung großer Datenmengen, kommt man um die Begriffe Data Lake und Data Warehouse kaum herum. Vielen Unternehmen stellt sich früher oder später die Frage, welche der beiden Lösungen für welchen Anwendungsfall geeignet ist.

Boxhandschuhe als Symbol für Entscheidung zwischen Data Lake und Data Warehouse
Blog 15.02.22

Data Lake vs Data Warehouse: Welche Lösung ist die Richtige?

Geht es um die Speicherung großer Datenmengen, kommt man um die Begriffe Data Lake und Data Warehouse kaum herum. Vielen Unternehmen stellt sich früher oder später die Frage, welche der beiden Lösungen für welchen Anwendungsfall geeignet ist.

Boxhandschuhe als Symbol für Entscheidung zwischen Data Lake und Data Warehouse
Blog 15.02.22

Data Lake vs Data Warehouse: Welche Lösung ist die Richtige?

Geht es um die Speicherung großer Datenmengen, kommt man um die Begriffe Data Lake und Data Warehouse kaum herum. Vielen Unternehmen stellt sich früher oder später die Frage, welche der beiden Lösungen für welchen Anwendungsfall geeignet ist.

Headerbild zu Data Governance Consulting
Service

Data Governance Consulting für Datenqualität und Sicherheit

Mit unseren Data Governance Services sorgen wir für nachvollziehbare, qualitative und sichere Daten – als optimale Grundlage für Ihre datengetriebenen Entscheidungen.

Teaserbild zu Data Integration Service und Consulting
Service

Data Integration Service und Consulting für Ihr Unternehmen

Legen Sie eine optimale Basis für die Nutzung Ihrer Daten – indem Sie diese in ein einheitliches und einfach abfragbares Schema bringen.

Teaserbild zu Data Integration Service und Consulting
Service

Data Integration Service und Consulting für Ihr Unternehmen

Legen Sie eine optimale Basis für die Nutzung Ihrer Daten – indem Sie diese in ein einheitliches und einfach abfragbares Schema bringen.

Headerbild zu Data Governance Consulting
Service

Data Governance Consulting für Datenqualität und Sicherheit

Mit unseren Data Governance Services sorgen wir für nachvollziehbare, qualitative und sichere Daten – als optimale Grundlage für Ihre datengetriebenen Entscheidungen.

Headerbild IBM Cloud Pak for Data
Technologie

IBM Cloud Pak for Data

Das Cloud Pak for Data fungiert als zentrale, modulare Plattform für analytischen Anwendungsfälle. Es integriert Funktionen für die physikalische und virtuelle Integration von Daten in einen zentralen Datenpool – einen Data Lake oder ein Data Warehouse, einen umfassenden Datenkatalog und zahlreicher Möglichkeiten der (AI-) Analyse bis zur operativen Nutzung derselben.

Headerbild IBM Cloud Pak for Data
Technologie

IBM Cloud Pak for Data

Das Cloud Pak for Data fungiert als zentrale, modulare Plattform für analytischen Anwendungsfälle. Es integriert Funktionen für die physikalische und virtuelle Integration von Daten in einen zentralen Datenpool – einen Data Lake oder ein Data Warehouse, einen umfassenden Datenkatalog und zahlreicher Möglichkeiten der (AI-) Analyse bis zur operativen Nutzung derselben.

Headerbild IBM Cloud Pak for Data
Technologie

IBM Cloud Pak for Data

Das Cloud Pak for Data fungiert als zentrale, modulare Plattform für analytischen Anwendungsfälle. Es integriert Funktionen für die physikalische und virtuelle Integration von Daten in einen zentralen Datenpool – einen Data Lake oder ein Data Warehouse, einen umfassenden Datenkatalog und zahlreicher Möglichkeiten der (AI-) Analyse bis zur operativen Nutzung derselben.

Headerbild zu Dashboards und Reports
Service

Dashboards & Reports zur Visualisierung von Informationen

Die Disziplin der Business Intelligence stellt die notwenigen Mittel für den Zugriff auf Daten bereit. Darüber haben sich diverse Methoden herausgebildet, mit denen Informationen durch verschiedene Technologien an den Endnutzer transportiert werden.