Bei der Arbeit mit Beispieldatenbanken für Data Warehousing, die ja jetzt auf Codeplex zum Download verfügbar sind, wird so mancher sich wundern: Struktur und Daten der Datenbank AdventureWorksDW2008 wurden gegenüber SQL 2005 (und den CTP-Versionen von SQL 2008) leicht verändert! Auf den ersten Blick ist das seltsam, denn die AdventureWorksDW-Datenbank ist im BI-Bereich so eine Art „gemeinsame Sprache“! AdventureWorks-Mitarbeiter wie Rachel Valdez und Ito Shu haben schon fast die Popularität von Maria Anders von „Alfreds Futterkiste“ in der Northwind-Beispieldatenbank. Einträge in Newsgroups und Foren haben fast keine Chance, beantwortet zu werden, wenn sich das Problem nicht von jedem auch auf AdventureWorks nachvollziehen lässt.
Aber keine Angst: viel ist auch gar nicht passiert, nur eins fiel mir so stark auf, dass ich die Finger nicht stillhalten konnte und bloggen musste: Die Zeitdimensions-Tabelle. Sie heißt nicht mehr DimTime, sondern DimDate; und ewig predige und predige ich, und endlich ist es bis nach Redmond gedrungen: der Primärschlüssel der Zeitdimension im Data Warehouse soll nicht nur ein per IDENTITY hochgezählter, bedeutungsloser Integer-Wert sein (z.B. „Anzahl Tage seit dem 1.1.2000“), sondern das echte Datum, in einem INTEGER verschlüsselt im Format JJJJMMTT. Das spart Platz, ist lesbar, leicht zu konvertieren, gut zu sortieren etc. pp. Und so ist es jetzt auch in der Beispieldatenbank, danke dafür!
Noch eine lustige Ã?nderung: in DimProduct haben wir jetzt endlich eine GermanDescription, mit so schönen Inhalten wie: „Für echte Waldprofis. Ein extrem robustes Rad, mit dem Sie auf allen Pfaden sicher unterwegs sind“. Leider gibt es aber immer noch keinen GermanProductName!
Letztendlich ist das etwas fragwürdig: Offenbar benutzen immer noch viele DWH-Designer AdventureWorksDW als Entwurfs-Vorlage, mangels bessrer Materialien. Wenn man diese Datenbank dann schon anpackt und ändert, dann hätte man natürlich auch gleich radikal alles nach best practices umgestalten können! Und viele Nutzer bedauern zu Recht: die neuesten Bewegungsdaten sind immer noch aus dem Juni 2004, also vier Jahre vor dem Erscheinen des Produkts! Das macht Beispiel-Berechnungen mit dem „aktuellem Datum“ in Berichten oder in Cubes sehr mühevoll.