Unsupervised Deep Learning in Computer Vision

MSE | P8 und P9 Forschungsprojektarbeiten in der MRU Computer Science / Fachgebiet ICT

 

Ausgangslage

Der Bereich Computer Vision beschäftigt sich damit, die Sehfähigkeiten von Menschen mit Algorithmen nachzubilden. Dieses Gebiet hat früher mit Algorithmen wie der Scalable Image Feature Transform (SIFT) in den vergangenen Jahren erstaunliches geleistet. Der SIFT-Algorithmus basiert, wie viele Bildverarbeitungsalgorithmen aus dieser Zeit, auf von Menschenhand entwickelten Features. Beispielsweise nutzt auch die Gesichtserkennung nach Viola-Jones feste, vordefinierte Features, welche nach fixen Vorschriften berechnet werden. Seit einigen Jahren werden künstliche Neuronale Netze mit viel Erfolg für Computer Vision genutzt. Durch den Einsatz von Convolutional Neural Networks wurden historische Fortschritte bei der Bildverarbeitung erzielt [1]. Google hat beispielsweise 2012 ein System vorgestellt [2], welches aus 10‘000‘000 Bildern unüberwacht gelernt hat Gesichter, Katzen und Autos zu erkennen und unterscheiden – ohne dass jemand diese Kategorien und Konzepte zuvor von Hand definiert hätte. Das System entwickelte aus den Eingabedaten selbständig geeignete, hierarchische Features und nutzte diese zur Klassifizierung.

Abbildung 1: Deep Learning-Algorithmen entwickeln selbständig abstrakte Konzepte wie „Katze“ anhand von Internetbildern

 

Zielsetzung / Methodik / Vorgehen

Die Kombination aus Computer Vision und Deep Learning kann nicht nur auf natürliche Bilder angewandt werden. In dieser Forschungsarbeit sollen diese Algorithmen auf Bilder des SDO-Satelliten angewandt werden, um dort selbständig Sonnenphänomene zu erkennen und zu kategorisieren. Das ist wichtig, weil man nur so bislang unbekannte Phänomene entdecken kann. Resultat soll neben der Projektdokumentation gegebenenfalls auch ein Paper Draft sein, welches im Journal „Astronomy and Computing“ publiziert werden kann.

Abbildung 2: Beispiel eines Sonnenphänomens (Sigmoid)

 

Teilaufgaben ür den Masterstudierenden

Zielsetzungen detaillieren, Interpretation, Evaluation von Varianten, Technologie-Transfer, Dokumentation

Studienart:
[x] Vollzeitstudium
[x] Teilzeitstudium 50% mit Assistenzanstellung

Projektorganisation: Arbeit in einem Projektteam / Einzelarbeit

Arbeitsort: Windisch

Advisor: Prof. Dr. André Csillaghy & Simon Felix

—–

[1] LeCun, Y., Kavukcuoglu, K. and Farabet, C., 2010, May. Convolutional networks and applications in vision. In Proceedings of 2010 IEEE international symposium on circuits and systems (pp. 253-256). IEEE.

[2] Le, Q.V., 2013, May. Building high-level features using large scale unsupervised learning. In 2013 IEEE international conference on acoustics, speech and signal processing (pp. 8595-8598). IEEE. https://arxiv.org/abs/1112.6209