DataVault

Aus MARJORIE-WIKI
Wechseln zu: Navigation, Suche

Dan Linstedt der Urheber von DataVault sagt:

„DataVault ist eine detailorientierte, historisch genaue und eindeutig nachvollziehbare Anordnung von normalisierten Tabellen.“

Dieser sieht DataVault als logische Fortsetzung der Entwicklung im Data Warehousing. DataVault ist ein Hybrid-Ansatz aus 3NF und Star-Schema und bietet neben einer impliziten Historisierung und Versionierung eine hohe Flexibilität bei Änderungen im Datenmodell. DataVault betrachtet die Modellierung aus der Sicht von Geschäftsdaten und beginnt damit Geschäftsobjekte wie Mitarbeiter, Abteilungen, Produkte, und Bestellungen zu identifizieren. Diese werden in sogenannten Hubs gespeichert. Zwischen Hubs werden die Beziehungen anders als in der 3NF-Modellierung ausschließlich durch Link-Tabellen realisiert. Alle Informationen zu den Geschäftsobjekten und den Verbindungen zwischen ihnen werden in Satellit-Tabellen gespeichert. Jeder Datensatz in allen Tabellen verfügt über ein Load_Date und eine Record_Source.

Datensätze werden laut der reinen DataVault Theorie weder geändert, noch gelöscht. Geänderte Daten werden durch einen neuen Datensatz mit einem aktuellen Load_Date eingepflegt. Gültigkeitszeiträume werden häufig mittels Valid_From und Valid_Till gespeichert. Ein Valid_From ist dann sinnvoll, wenn Daten bereits gültig sein können, bevor sie ins DWH geladen werden. Dies kann bspw. bei monatlichen Uploads der Fall sein. Das Valid_Till Datum ist für eine Markierung von ungültigen Daten notwendig, ohne dass diese aus der Historie entfernt werden.

Info Sign.svg Dieser Wikipedia-Artikel wurde, gemäß GFDL, CC-by-sa mit der kompletten History importiert.