Klassische Datawarehouses, also Daten-Lager, sind relationale Datenbanken deren Struktur auf das schnelle Abfragen von der enthaltenen Daten optimiert sind. Die Stärke von Datawarehouses liegt in der Verknüpfung der Daten untereinander. Dadurch entstehen neue Einsichten in das zugrundeliegende Geschäft. Typische Anwendungen sind die Verknüpfung von Finanzdaten mit jenen der Produktion um z.B. die Profitabilität von Produkten pro Kunde, pro Schicht, pro Losgröße etc. zu ermitteln.
Strukturell werden zumeist „Sterne“ oder „Schneeflocken“ implementiert, in deren Zentrum eine Faktentabelle steht, die von einer (Stern) oder mehreren (Schneeflocke) Schicht(en) von Dimensionstabellen umgeben sind. Eine solche Datenstruktur erzeugt Würfel in einem beliebig dimensonalen Raum. Ein Raum der Dimenson n hat n*(n-1)/2 Drehachsen. Das ist die Anzahl der Excel-Sheets die aus einem Datenwüfel gezogen werden können, so dass immer unterschiedliche Dimensionen des Würfels auf eine Achse von Excel fallen. Die Datenzellen werden dabei über alle anderen Dimensionen aggregiert, im einfachsten Fall z.B. summiert.
Ein Datawarehouse kann also Auswertungen aus den vorhandenen Daten in Sekunden ermöglichen, für die sonst sehr lange gearbeitet werden müsste – von Computern oder Menschen.
Die Kunst des Datawarehousing liegt wie so oft in der Balance zwischen Aufwand und Nutzen: Zu große Datenbanken werden langsam, brauchen starke Hardware und viel Wartung. Unterdimensionierte oder schlecht strukturierte Warehouses sind nur schlecht oder gar nicht in der Lage Fragen zu beantworten.
Wenn Sie Daten haben, aus denen Sie mehr herauslesen möchten, wenden Sie sich an mich, ich analysiere Ihre vorhandenen Daten, strukturiere sie in ein Warehouse, implementiere dessen Bewirtschaftung und unterstütze auch gerne im Betrieb oder mit Schulungen.