Motivation

Elektronische Augen und künstliche Intelligenz ermöglichen bereits heute automatische Türwächter, Fahrassistenzsysteme und Wohnräume, die über das Wohl ihrer Bewohner wachen. Dabei kann die Privatsphäre der Menschen gewahrt werden, indem die Videodaten direkt im Sensor verarbeitet werden (sog. „eingebettete KI“). Insbesondere die Erkennung zeitlich zusammenhängender Aktivitäten und Vorgänge stellen dabei aber eine große Herausforderung dar. Vor allem komplexe Anwendungen mit konventioneller KI (künstliche neuronale Netze, z.B. Convolutional Neural Networks - CNNs) haben einen Bedarf an Rechenleistung, der in eingebetteten Hardware-Lösungen einen zu hohen Stromverbrauch, Probleme mit der Abwärme und hohe Herstellungskosten verursacht. Eine Echtzeitverarbeitung in Anwendungen zur Erkennung von Aktivitäten mit zeitlichem Kontext ist daher in vielen Fällen mit eingebetteter KI nicht möglich.