Bachelorarbeit Richard Roth

 

Analyse und Bewertung von Stringdistanzalgorithmen für die Metadatenanalyse in komplexen Energiesystemen

Illustration des Auswahlalgorithmus in Aikido Urheberrecht: EBC Illustration des Auswahlalgorithmus in Aikido

Gebäude sind für fast 40% des gesamten Energieverbrauchs ins Deutschland verantwortlich und haben damit einen enormen Einfluss auf unsere Umwelt. Um dem Klimawandel zu begegnen, ist es daher unerlässlich, den Energiebedarf von Gebäuden zu senken.

Ein flächendeckender und effizienter Einsatz von Energiemanagementsystemen in Gebäuden kann dazu beitragen, diesen Energiebedarf deutlich zu verringern. Damit ein solches System einwandfrei arbeiten kann, bedarf es strukturierter und einheitlich aufbereiteter Daten, die von den zugrunde liegenden Modellen der Gebäudemanagementsysteme bereitgestellt werden. In der Praxis ist die Darstellung dieser Daten jedoch uneinheitlich, was den effizienten Einsatz eines Energiemanagementsystems erschwert.

Das manuelle Strukturieren von Daten in gängige Schemata ist ein zeitaufwändiges und damit teures Verfahren. Es existieren daher bereits viele Ansätze, um diesen Prozess mit Hilfe von maschinellem Lernen zu beschleunigen.

Aikido ist ein Tool, dass einem Benutzer ermöglicht, eine große Anzahl von Datenpunkten durch aktives maschinelles Lernen in das BUDO Schema, ein hierarchisch aufgebautes Benennungschema, zu überführen. Hierzu werden dem Benutzer konstant neue Labels von Datenpunkten zum manuellen Klassifizieren vorgeschlagen, um weitere Vorhersagen zu optimieren. Um eine steile Lernkurve zu erreichen, ist es entscheidend, diese Labels gezielt auszuwählen. Hierzu schlägt ein Auswahlalgorithmus dem Benutzer diejenigen Labels vor, die sich am stärksten von bereits klassifizierten Labels unterscheiden und den noch nicht klassifizierten Labels am ähnlichsten sind. Als Maß für diesen Unterschied wird die Levenshtein-Stringdistanz verwendet.

Diese Auswahl führt zu keiner Verbesserung im Vergleich zu zufällig ausgewählten Labels. Folglich ist das Ziel dieser Arbeit, die Vorhersagegenauigkeit von Aikido zu erhöhen, indem weitere Algorithmen für die Berechnung der Distanz zwischen Strings untersucht und auf den Auswahlalgorithmus des Tools angewendet werden.

Die Ergebnisse zeigen, dass die Vorhersagegenauigkeit fast ausschließlich von den Datensätzen und weniger von dem gewählten Stringdistanzalgorithmus oder anderen Modifikationen des Verfahrens abhängt. Dieses Resultat entspricht Ergebnissen aus vergleichbaren Anwendungen in der wissenschaftlichen Literatur.