Uwe Rienäcker

 

Selektive Videoaufzeichnung durch Klassifikation bewegter Regionen im komprimierten Bildraum

 

Zusammenfassung

In diesem Dokument wird ein Verfahren zur Klassifizierung bewegter Regionen für die selektive Videoaufzeichnung beschrieben. Die für die Bewegungserkennung und Extraktion der Objekteigenschaften benötigten Informationen werden ausschließlich aus dem komprimierten Bildraum gewonnen. Schwellwertoperationen auf der Differenz ausgewählter DCT Koeffizienten aufeinanderfolgender Frames liefern die Basis der Segmentation bewegter Regionen. Ein Regelwerk zur Clusterbildung verbindet zusammenhängende Bereiche des binären Differenzbildes und unterdrückt einzelne Blöcke ohne nachbarschaftliche Beziehungen. Für die Klassifikation der Regionen werden die jeweils kleinsten umschließenden rechteckigen Bereiche herangezogen. Aus bestimmten DCT Koeffizienten dieser Bereiche werden Merkmalsvektoren für die Klassifikation durch ein neuronales Netz extrahiert. Frames ohne erkennbare Bewegung oder ohne einer Objektklasse zugeordnete Regionen werden schon bei der Aufzeichnung verworfen. Die verbleibenden Informationen können für weitere Auswertungen verwendet oder einfach nur gespeichert werden. Die Vermeidung rechenzeitintensiver Operationen wie inverse DCT und Farbraumkonvertierungen ermöglicht eine Echtzeitverarbeitung der Videodaten mit geringen Anforderungen an die Hardware. Dieses wird durch experimentelle Ergebnisse bestätigt. Die spezielle Optimierung auf die Verarbeitung von Motion JPEG komprimierten Videodaten gab dem Projekt den Namen »Motion Jpeg CLassification System«.

 

PDF : Selektive Videoaufzeichnung durch Klassifikation bewegter Regionen im komprimierten Bildraum ind