Computer Vision (M.Sc.)

Kurzdarstellung der Inhalte

Das Modul wird in den Masterstudiengängen Informatik und Data Science angeboten.

Computer Vision (CV) ist ein Fachgebiet, welches von der Informatik und den Ingenieurswissenschaften vorangetrieben wird. Mit Kameras aufgenommene Bilder und Bildreihen werden durch die Anwendung unterschiedlicher Methoden verarbeitet und analysiert. Das Ziel ist, Bildinhalte maschinell erkennen und auswerten zu können. Interessant ist beispielsweise die Ermittlung von geometrischen Informationen, welche unter anderem die Größe, die Form und die Oberflächenbeschaffenheit der aufgenommenen Objekte umfasst. Aber auch die Klassifikation der Bildinhalte ist für viele Computer Vision Anwendungen essenziell. Weitere Fragestellungen beschäftigen sich mit der Verfolgung und Analyse von Bewegungen oder dem Abschätzen der Anzahl an aufgenommenen Elementen. Die Anwendungsmöglichkeiten von Computer Vision (CV) sind zahlreich. Allen gemeinsam ist, dass sie sich die maschinelle Auswertung von dem, was wir sehen, zum Ziel gesetzt haben.

Die Veranstaltung bietet einen praxisnahen und anwendungsorientierten Einstieg in dieses faszinierende Fachgebiet. Sehr schnell werden Sie merken, dass es im Kern zwei komplementäre Herangehensweisen gibt, eine CV-Frage zu lösen. Zunächst ist da die analytische Herangehensweise, in der nach Merkmalen des Objekts gesucht wird. Man nennt dieses Vorgehen auch Feature-based-Engineering. Anhand dieser Merkmale können die Objekte erkannt werden. Es gibt aber zahlreiche Fragestellungen, da kann man schlichtweg nicht alle Möglichkeiten erfassen, um konkret zu definieren, welche Merkmale typisch für das gesuchte Objekt sind. Nehmen wir mal als Beispiel ein Auto. Ein Auto hat immer vier Räder, aber von der Seite aufgenommen sieht man nur zwei und von oben gar keins. Also woran erkennt man, dass auf dem Bild ein Auto zu sehen ist? Diese und ähnliche Fragestellungen nutzen Machine Learning Methoden zur Lösung der Problemstellungen. Die Convolutional Neural Networks (CNN) haben hier neue Maßstäbe gesetzt. Interessant ist, dass die CNN intern eine Reihe von bewährten Methoden der analytischen Computer Vision nutzen.

Der erste Schritt zur Lösung einer CV-Aufgabe ist immer zu entscheiden, welche Aspekte durch analytische Methoden (Feature-based-Engineering) gelöst werden können und bei welchen Machine Learning zielführender ist. Die Gegenüberstellung von der merkmalsbasierten Analyse und den Convolutional Neural Networks zieht sich folglich wie ein roter Faden durch die Veranstaltung, die sich in die folgenden Kapitel gliedert:

Wahrnehmung, um die Fragestellungen maschinengerecht formulieren zu können
Funktionsweise von Neuronale Netzen
klassische Herangehensweise: Methoden der analytische Computer Vision
Merkmalsbasierte Methoden (SIFT, SURF, ORB)
Convolutional Neural Networks
weiterführende Themen

Beide, sowohl die analytische Herangehensweisen als auch die Nutzung von Convolutional Neural Networks werden im Praktikum vertieft. In der zweiten Hälfte des Praktikums entwickeln Sie selbst eine Fragestellung, die Sie prototypisch lösen. Hier einige Beispiele aus dem Sommersemester 2021: