Die fünf besten Tipps für einfache BI-Lösungen

In der klassischen Literatur wird Business Intelligence (BI) als eine „entscheidungsorientierte Sammlung, Aufbereitung und Darstellung geschäftsrelevanter Informationen“ beschrieben (Vgl. Holger Schrödl: Business Intelligence mit MS SQL Server 2008 – BI-Projekte erfolgreich umsetzen). Am Beispiel der Auswertung der Mitgliedsdaten der Kolpingjugend Berlin – einem katholischen Jugendverband in Deutschland – wird in diesem Blog-Beitrag die Erstellung einer möglichst einfachen BI-Lösung beschrieben. Anonymisierte Daten von 2004 bis 2013 wurden hierfür ausgewertet.

 

1. Daten in eine einheitliche Struktur bringen

 

In diesem Anwendungsbeispiel wurden Excel Dateien mit verschiedenen Spaltenbezeichnungen und Inhalten in ein einheitliches Format gebracht. Nur die für die Auswertung relevanten Spalten: Exportdatum der Daten, Mitgliedsnummer, Zugehörigkeit zur Gruppe, Geschlecht, Geburtsdatum und Beitrittsdatum sind zu verwenden. Als Ergebnis sollte eine Excel-Datei mit allen relevanten Daten vorliegen.

 

2. Schreiben Sie ihre Daten in eine Datenbank

 

Um Ihre Daten auswerten zu können, werden im nächsten Schritt die Daten aus der Excel Datei einer Datenbanktabelle hinzugefügt. Dies können Sie mit dem Microsoft SQL Management Studio – SQL Server Import and Export Wizard, einem Microsoft Integration Service Projekt oder mit von Hand erstellten INSERT- Kommandos in SQL vollziehen. Benennen Sie die Tabelle Arbeitsbereich. Transformieren Sie nun Ihre Daten. Bringen Sie alle Datumsspalten in ein einheitliches Format und machen Sie alle Spalten auswertbar. Die transformierten Daten können Sie in einer neuen Tabelle Transformation abspeichern.

 

3. Verwenden Sie nur Transaktionsfakten ohne Dimensionen

 

Mögliches ETL-Paket für Microsoft Integration Services

 

 

Die anspruchsvollste Arbeit ist das Schreiben der bereinigten Daten in die Faktentabelle. In der Faktentabelle dürfen die Datensätze zu den Mitgliedern nur einmal gespeichert werden, weil Ein- und Austritt sowie Dauer der Mitgliedschaft betrachtet werden. Im Arbeitsbereich gibt es für jedes Mitglied mehrfache Datensätze. So kann für jedes Jahr zwischen 2004 und 2013 ein Datensatz für ein Mitglied vorhanden sein.

 

Wenn ein Datensatz in einem folgenden Jahr fehlt, ist die Person entweder altersbedingt oder nicht altersbedingt ausgetreten. In der Faktentabelle werden zusätzlich zu den bisherigen Spalten das Austrittsjahr, der letzte Zeitpunkt, wo der Datensatz in den Daten enthalten war und der Austrittsgrund gespeichert. Normaler weise enthalten Dimensionen die beschreibenden Daten der Faktentabelle. Aufgrund der kleinen Datenmenge und um die Lösung einfach zu halten brauchen keine Dimensionen verwendet zu werden. Stattdessen genügt es alle Informationen in die Faktentabelle zu schreiben. Auf die Vorteile des synthetischen Schlüssels in der Faktentabelle sollten Sie hingegen nicht verzichten.

 

4. Erstellen Sie geschickte SQL Abfragen

 

Erstellen Sie Abfragen, die Verteilungen nach Geschlecht, Alter und Ortsgruppen oder Gegenüberstellung von Ein- und Austritten, Auswertung nach Austrittsgrund (altersbedingt oder nicht altersbedingt) darstellen. Die Ergebnisse können Sie per Drag & Drop nach Excel kopieren und dort jeweils in Tabellenblättern ablegen. Benennen Sie die Tabellenblätter nach der Auswertung.

 

5. Beschränken Sie sich bei der Auswertung auf das Wesentliche

 

Bei der Darstellung Ihrer Ergebnisse sollten Sie klare Aussagen mit eindeutigen Botschaften treffen. Beispiel: 38% Prozent aller Austritte zwischen 2004 und 2013 betrafen Einzelmitglieder, die keiner Ortsgruppe zugehörten. Einzelmitglieder, die nicht an Ortsgruppen gebunden sind, treten somit häufiger als andere aus.

 

Mit Excel können Sie schnell einfache Balkendiagramme erstellen, um Ihre Ergebnisse zu visualisieren. Markieren Sie hierfür ihre Datenzeilen, die Sie als Balkendiagramm darstellen möchten und wählen unter Einfügen -> Säulendiagramm auswählen ihre geeignete 2D-Säule aus.

 

 

In den beiden folgenden Grafiken sind zwei Beispiele abgebildet.

 

Auswertung nach Geschlecht und Altersgruppe der Mitglieder am Stichtag

 

 

Darstellung der Entwicklung der Mitglieder (2004 bis 2013)

 

 

Selbst einfache Prognosen können erstellt werden, wenn Sie mit den ermittelten Durchschnittswerten der Auswertung (5 Neuzugänge und 11 Austritte pro Jahr) arbeiten.

 

Darstellung einer Hochrechnung, wenn weiterhin 6 Mitglieder pro Jahr verloren gehen

 

 

Schreibe einen Kommentar