Thema - TU Ilmenau

Transcription

Thema - TU Ilmenau
Bachelor-Arbeit
Thema: Untersuchung des Verhaltens eines „deep
convolutional neural nets“ für die Objekterkennung in
Sensorbildern in Bezug auf Falschalarme bei dem
Lernen von Hintergrundstrukturen
1) Kurze thematische Einordnung der Arbeit und deren generelle Zielstellung:
Durch einen anhaltenden Erfolg des „Deep Learnings“ im Bereich der Computer Vision, insb. in Wettbewerben
wie dem „ImageNet Large Scale Visual Recognition Challenge“ (ILSVRC), konnten Ansätze wie die
„deep convolutional neurals nets“ stark an Popularität gewinnen. Doch auch bei diesen Netzen ist es
nicht nur interessant die „positiven“ Klassen zu betrachten, sondern sind auch die „negativen“ Klassen,
d.h. Hintergrundstrukturen, von Relevanz, da die Behandlung dieser maßgeblich die Falschalarmrate
beeinflusst.
Zur Reduktion von Falschalarmen eines Detektionssystems wird häufig neben den zu detektierenden
Klassen auch eine Hintergrundklasse angelegt, welche mit „negativen“ Beispielen gelernt wird. Dabei gibt
es verschiedene Möglichkeiten, diese zu gestalten. In dieser Arbeit soll schwerpunktmäßig untersucht
werden, wie sich eine einzelne generische Hintergrundklasse im Vergleich zu vielen dedizierten
Hintergrundklassen, welche explizit nur bestimmte Störfaktoren enthalten, verhält.
2) Konkrete Aufgabenstellung mit Arbeitsschwerpunkten:
•Aufarbeitung des State-of-the-Art zum Themenfeld aus der Literatur (siehe unten)
•Erstellung einer Grobspezifikation zur Themenbearbeitung unter Berücksichtigung folgender Aspekte:
- Abgrenzung der Möglichkeiten verschiedener Ansätze zur Gestaltung von Hintergrundklassen
- Gegenüberstellung der Ansätze
- Validierung der Ansätze anhand einheitlicher Testdatensätze
- Fazit
•Weitere konkret erwartete Zwischenschritte:
- Experimenteller Beleg der Ergebnisse
- Verwendung des Neovision2-Heli Datensatzes als Basis
•Ausarbeitung von Präsentationen für den Eröffnungs- und Abschlussvortrag
•Anfertigen der Arbeit sowie der Begleit-CD entsprechend den Vorgaben des FG NI+KR
3) Zu erzielende Ergebnisse und erwartete eigene Beiträge (methodisch, technisch, software -technisch) :
•Eigenständiges Einarbeiten und Vertiefen der notwendigen Techniken
•Implementierung aller für die Aufgabe nötigen Software
•Ggf. Erweiterung der zu verwendenden Frameworks (insb. Caffe DL-Framework)
•Erstellung eines Fazits aufgrund eigener Experimente
4) Existierende Vorarbeiten im Unternehmen, auf die aufgesetzt werden kann (ev. auch mit Lit.angaben):
•Aufbau auf Arbeiten aus dem vorangegangenen Praktikum
5) Zu verwendende bzw. recherchierende Literatur:
Deep learning: Yann LeCun, Yoshua Bengio & Geoffrey Hinton, Nature 521, 436–444 (28 May 2015)
Deng, J., Dong, W., Socher, R., Li, L. J., Li, K., & Fei-Fei, L. (2009, June). Imagenet: A large-scale hierarchical image
database. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 248-255). IEEE
●Pierre Sermanet, David Eigen, Xiang Zhang, Michael Mathieu, Rob Fergus and Yann LeCun: OverFeat: Integrated
Recognition, Localization and Detection using Convolutional Networks, International Conference on Learning
Representations (ICLR2014)
●Sandhan, T.; Jin Young Choi, "Handling Imbalanced Datasets by Partially Guided Hybrid Sampling for Pattern Recognition,"
in Pattern Recognition (ICPR), 2014 22nd International Conference on , vol., no., pp.1449-1453, 24-28 Aug. 2014
●
●
6) Notwendige Vorkenntnisse für die Themenbearbeitung:
•Grundlagen der Bildverarbeitung und Computer Vision
•Grundlagen im Machine Learning und insb. Deep Learning
•Funktionsweise von convolutional neural networks
•Gute Programmierkenntnisse
Bearbeitungszeitraum: 01.02.2016 bis 30.04.2016
Betreuer im Unternehmen:
Dipl. Phys. Christoph Stahl, [email protected],
Tel: +49 8459 81 78139
Betreuer seitens der TU Ilmenau: 
Dipl.-Inf. Markus Eisenbach, [email protected],
Tel: +49 3677 69 4169
Betr. Hochschullehrer:
Prof. Dr. H.M. Groß