Masterarbeit Thomas Schreiber

 

Ein Zeitreihen Gruppierungsansatz für Gebäudeautomations- und -regelungssysteme

Tsne Urheberrecht: EBC Zweidimensionale Visualisierung eines sechsdimensionalen Datensatzes. Statistische Features von 3822 Zeitreihen, aus der Datenbank des E.ON Energy Research Centers, werden durch einen Algorithmus (T-SNE) gruppiert.

In Deutschland steigt die Anzahl installierter Gebäudeautomations- und -regelungssysteme (BACS) stetig an. In diesen Systemen stellt der nicht optimale Anlagenbetrieb

einen der Hauptgründe für Einschränkungen im Komfort und Energieverluste dar. Strukturierte Daten aller Sensoren und Aktoren im System sind ein gutes Fundament für Entscheidungen über Regelungsstrategien und Effizienzoptimierungen. In der Praxis ist die Analyse von BACS-Daten allerdings eine sehr herausfordernde und zeitintensive Aufgabe. Die Daten sind meist chaotisch, verwirrend und liegen in unüberschaubarer Menge vor. Um die aufgezeichneten Zeitreihen den entsprechenden Komponenten zuordnen zu können, müssen diese zunächst händisch in Gruppen eingeteilt werden. Zu Beginn jeder BACS-Datenanalyse werden die Zeitreihen nach Plausibilität eingeteilt und entsprechend bezeichnet, eine sehr fehleranfällige Aufgabe. Algorithmen aus dem Bereich des maschinellen Lernens zeigen vielversprechende Ergebnisse in einer Vielzahl von Klassifizierungsaufgaben. In einer vorangegangenen Arbeit wurde bereits gezeigt, dass solche Algorithmen ebenfalls ein großes Potential für Zeitreihenklassifizierung von BACS-Daten haben.

In ihrer Arbeit untersuchten die Autoren Algorithmen aus dem Bereich des überwachten Lernens, hierbei werden korrekt bezeichnete Trainingsdaten benötigt. In der vorliegenden Arbeit wird eine Auswahl der vielversprechendsten Techniken aus dem Bereich des unüberwachten Lernens vorgestellt und auf einen Datensatz, extrahiert aus dem BACS des E.ON Energy Research Centers, angewendet.

Unüberwachte Algorithmen arbeiten ausschließlich mit Ähnlichkeiten in den Daten, vorhandene

Bezeichnungen werden nur zur Validierung verwendet. Es werden neun Algorithmen darauf trainiert, Gruppen in den Zeitreihen zu finden. Als Repräsentationen der Zeitreihen werden sowohl statische Features, als auch unüberwacht generierte Features, welche mittels eines „deep convolutional auto-encoders" extrahiert werden, verwendet. Weiterhin wird die Gruppierungsgenauigkeit von „dynamic time warp" untersucht. Dynamic time warp ist eine Methode zur Gruppierung von Zeitreihe, bei der die Rohdaten direkt verglichen werden. Es wird gezeigt, dass selbst die besten der untersuchten Methoden nicht in der Lage sind die 22 Gruppen zu finden, welche bei der Arbeit mit den BACS-Daten definiert wurden. Darüber hinaus ergeben die Untersuchungen aber auch, dass unüberwachtes Gruppieren grundsätzlich möglich ist. Weiter werden sowohl die gefundenen Gruppen als auch mögliche Schlüsse für die Arbeit mit BACS-Daten diskutiert. Da sie auf Ähnlichkeiten in den Daten basieren, können wertvolle Informationen für zukünftige Arbeiten gewonnen werden.