Bachelorarbeit Johannes Kern

 

Innenraum Komfort und Energieeffizienz in Smart Building mit Deep Reinforcement Learning

Reinforcement Learning Urheberrecht: EBC Reinforcement Learning

Die automatisierte Auswertung von Daten komplexer Energiesysteme in Gebäuden gewinnt durch die Energiewende immer mehr an Bedeutung, um die Energieeffizienz in diesem Sektor deutlich zu steigern. In der vorliegenden Arbeit wird ein Reinforcement Learning Algorithmus vorgestellt, der durch übergebene Datensätze die Regelung einer Lüftungsanlage in einem Raum vornehmen kann und dabei neben dem Innenraumkomfort auch den Energieverbrauch der Lüftungsanlage berücksichtigt. Ziel der Arbeit ist es, für einen solchen Algorithmus Bewertungsfunktionen für den Innenraumkomfort und den Energieverbrauch der Lüftungsanlage zu entwickeln und anhand von Zeitreihendaten Rückschlüsse auf das Verhalten eines solchen Algorithmus zu ziehen. Zur Bewertung des Innenraumkomforts werden sowohl der thermische Innenraumkomfort mit der Raumlufttemperatur und der relativen Luftfeuchte berücksichtigt als auch die Raumluftqualität mit CO2- und VOC-Konzentration (Volatile Organic Compounds). Ferner wird der Energieverbrauch der Lüftungsanlage durch den Zuluftvolumenstrom approximiert und der Energieverbrauch des Heiz- und Kühlungssystems anhand deren Teillastbedarfe sowie der Kühlwasseraustrittstemperatur des Kühlungssystems bewertet. Als Reinforcement Learning Algorithmus wird der Deep Deterministic Policy Gradient (DDPG) verwendet, welcher alle aufgenommenen Datenpunkte getrennt voneinader betrachtet. Daher wird für jeden betrachteten Parameter eine Reward-Funktion, wodurch der Zustand in einem Raum bewertet werden kann, entwickelt. Die ermittelten Reward-Funktionen werden in einem Besprechungsraum in einem Bürogebäudekomplex in München getestet. Als Beispiel dienen eine besonders heiße Sommerwoche vom 22. Juli bis 28. Juli 2019 und eine kalte Winterwoche vom 26. November bis 3. Dezember 2018. Aus dem Verlauf der vergebenen Rewards für die Zustände in diesen Wochen können Rückschlüsse darüber gezogen werden, wie ein Reinforcement Learning Algorithmus lernen und regeln könnte. Dabei fällt auf, dass der Verlauf der Reward-Funktionen in der Winterwoche deutlich vorhersehbarer ist als der der Sommerwoche, was vor allem an falschem Nutzerverhalten wie dem Öffnen von Fenstern liegen wird. Langfristig sollte der ermittelte Reinforcement Learning Algorithmus angepasst und erweitert werden, dass er neben einer Einzelraumregelung für ein gesamtes Gebäude angewendet werden kann.