Wie Data Science den Weg für CO2-Minimierung ebnet
In der heutigen Zeit, in der erneuerbare Energien eine immer wichtigere Rolle spielen, hat unser Grünstromprojekt eine besondere Bedeutung. Ein entscheidender Nachteil regenerativer Energien ist deren unregelmäßige und schwer planbare Verfügbarkeit. Das Problem mit Grünstrom ist, dass es aktuell kaum gespeichert werden kann und eine zeitliche Verschiebung zwischen Erzeugung und Bedarf besteht.
Ziel dieses Forschungsprojekts war es, präzise Vorhersagen über die Verfügbarkeit von Grünstrom zu treffen und Verbraucher zu motivieren, diesen Strom für stromintensive Geräte zu nutzen. Es werden Vorhersagen für jedes Postleitzahlgebiet zur Verfügung gestellt für einen Vorhersagezeitraum von 48 Stunden. Diese Lösung gibt jedem Verbraucher die Möglichkeit, durch intelligente Planung seiner Einschaltzeiten seinen persönlichen CO2-Fußabdruck zu minimieren.
Damit wir einen Einblick in die verschiedenen Phasen des Projekts und die Rolle eines Data Scientist bei der Bewältigung von auftretenden Herausforderungen gewinnen können, wird Michelle Opitz von ihren Erfahrungen berichten.
Michelle: Die Herausforderung in diesem Projekt bestand darin, dass die technischen Abhängigkeiten beim Kunden anders waren als ursprünglich angenommen. Unsere anfänglichen Modelle, die auf einfachen linearen Vorhersagen basierten, haben nicht die gewünschte Leistung erbracht. Meine Aufgabe bestand darin, diese Modelle zu überarbeiten und zu optimieren, ohne dass wir dabei wesentlich an Performance verlieren – einfachere Modelle werden oft bevorzugt, weil sie schneller sind.
Kannst du uns durch die verschiedenen Phasen führen, die du durchlaufen hast?
Michelle: Natürlich. Der Prozess begann mit der Data Exploration, bei der ich mich mit statistischen Methoden und Visualisierungen den vorhandenen Daten vertraut gemacht habe. An dieser Stelle müssen Fachexperten hinzugezogen werden, um Unregelmäßigkeiten und Muster in den Daten zu bewerten und zu behandeln. Dann kam die Datenverarbeitung, bei der ich die Daten bereinigt, transformiert und für die Modellierung vorbereitet habe. Die Verarbeitung ist ein wichtiger Schritt bei der Analyse, da mit falschen und fehlenden Werten umgegangen wird. Bei der Transformation habe ich sichergestellt, dass die Daten in einem einheitlichen Format vorliegen, damit sie eine konsistente Grundlage bieten. Anschließend folgte die Modellerstellung, bei der ich zunächst den aktuellen Stand der Forschung für Kurzzeitprognosen von Zeitreihen recherchierte. Gerade der Data Science Bereich entwickelt sich sehr schnell, und es macht Sinn, sich regelmäßig mit wissenschaftlichen Papern und Blogs Up-to-Date zu halten. Je besser ich mich vorher mit den Daten auseinandergesetzt hab, desto einfacher ist es, die möglichen Modelle vorzusortieren. Die neuen Erkenntnisse nutze ich, um bestehende Modelle durch leistungsfähigere zu ersetzen, um die Vorhersagegenauigkeit zu verbessern. Nach der Modellierung kam das Testen und Auswerten, bei dem ich sicherstellte, dass die Modelle den Anforderungen entsprechen. Die Modelle wurden optimiert und erneut getestet, bis sie akzeptable Leistungen lieferten.
Und nachdem die Modelle erfolgreich waren, war der Prozess abgeschlossen?
Michelle: Nein, der Prozess endet nicht dort. Daten ändern sich im Laufe der Zeit, daher ist es wichtig, die Modelle regelmäßig zu aktualisieren und sicherzustellen, dass sie den aktuellen Daten entsprechen. Es müssen Prozesse implementiert werden, die frühzeitig erkennen, wenn die Daten „driften“, also nicht mehr zu dem erstellten Modell passen. Manche Modelle können sich dann selbst neu anpassen, manche müssen wieder von den Data Scientists angefasst werden.
Du hast vorher in einem Projekt zur Appentwicklung gearbeitet. Was war für dich der größte Unterschied?
Michelle: Die genauen Arbeitsschritte in einem Data Science Projekt sind oft unklar und man muss viel ausprobieren. Es erfordert einen kontinuierlichen Austausch und Zusammenarbeit mit Auftraggebern und anderen Teammitgliedern, um gemeinsam die besten Lösungen zu finden. Anders als in der Welt der Softwareentwicklung gibt es in der Data Science kein definitives „fertig“. Die ständige Suche nach Verbesserungen und die Anpassung an neue Gegebenheiten sind Teil des Kerns der Data Science, und wann ein Modell gut genug ist, hängt davon ab, welche Güte für den Kunden wirtschaftlich sinnvoll ist.
Das Grünstrom Projekt klingt nach einem spannenden Beispiel für die Herausforderungen, denen Data Scientists gegenüberstehen. Es unterstreicht die Bedeutung von Anpassungsfähigkeit, kontinuierlichem Lernen und Zusammenarbeit, um die besten Ergebnisse zu erzielen und zur Förderung nachhaltiger Energiepraktiken beizutragen.
Michelle: Genau, es war eine aufregende Reise, und es war mir eine Freude, an diesem Projekt teilgenommen zu haben. Dieses Projekt ist vielseitig und kann in eine breitere Lösung integriert werden, beispielsweise beim Lademanagement von Fahrzeugflotten oder anderen energieintensiven Industrieprozessen. Das Potential ist groß und es zeigt, wie Data Science einen wichtigen Beitrag zur Nachhaltigkeit leisten kann.
Sie möchten mehr darüber erfahren, wie unsere Data Science-Lösungen Sie und Ihre Kunden dabei unterstützen können, wichtige Entscheidungen zum Schutz der Umwelt zu treffen? Lesen Sier hier mehr.