Thema - TU Ilmenau
Transcription
Thema - TU Ilmenau
Bachelor-Arbeit Thema: Untersuchung des Verhaltens eines „deep convolutional neural nets“ für die Objekterkennung in Sensorbildern in Bezug auf Falschalarme bei dem Lernen von Hintergrundstrukturen 1) Kurze thematische Einordnung der Arbeit und deren generelle Zielstellung: Durch einen anhaltenden Erfolg des „Deep Learnings“ im Bereich der Computer Vision, insb. in Wettbewerben wie dem „ImageNet Large Scale Visual Recognition Challenge“ (ILSVRC), konnten Ansätze wie die „deep convolutional neurals nets“ stark an Popularität gewinnen. Doch auch bei diesen Netzen ist es nicht nur interessant die „positiven“ Klassen zu betrachten, sondern sind auch die „negativen“ Klassen, d.h. Hintergrundstrukturen, von Relevanz, da die Behandlung dieser maßgeblich die Falschalarmrate beeinflusst. Zur Reduktion von Falschalarmen eines Detektionssystems wird häufig neben den zu detektierenden Klassen auch eine Hintergrundklasse angelegt, welche mit „negativen“ Beispielen gelernt wird. Dabei gibt es verschiedene Möglichkeiten, diese zu gestalten. In dieser Arbeit soll schwerpunktmäßig untersucht werden, wie sich eine einzelne generische Hintergrundklasse im Vergleich zu vielen dedizierten Hintergrundklassen, welche explizit nur bestimmte Störfaktoren enthalten, verhält. 2) Konkrete Aufgabenstellung mit Arbeitsschwerpunkten: •Aufarbeitung des State-of-the-Art zum Themenfeld aus der Literatur (siehe unten) •Erstellung einer Grobspezifikation zur Themenbearbeitung unter Berücksichtigung folgender Aspekte: - Abgrenzung der Möglichkeiten verschiedener Ansätze zur Gestaltung von Hintergrundklassen - Gegenüberstellung der Ansätze - Validierung der Ansätze anhand einheitlicher Testdatensätze - Fazit •Weitere konkret erwartete Zwischenschritte: - Experimenteller Beleg der Ergebnisse - Verwendung des Neovision2-Heli Datensatzes als Basis •Ausarbeitung von Präsentationen für den Eröffnungs- und Abschlussvortrag •Anfertigen der Arbeit sowie der Begleit-CD entsprechend den Vorgaben des FG NI+KR 3) Zu erzielende Ergebnisse und erwartete eigene Beiträge (methodisch, technisch, software -technisch) : •Eigenständiges Einarbeiten und Vertiefen der notwendigen Techniken •Implementierung aller für die Aufgabe nötigen Software •Ggf. Erweiterung der zu verwendenden Frameworks (insb. Caffe DL-Framework) •Erstellung eines Fazits aufgrund eigener Experimente 4) Existierende Vorarbeiten im Unternehmen, auf die aufgesetzt werden kann (ev. auch mit Lit.angaben): •Aufbau auf Arbeiten aus dem vorangegangenen Praktikum 5) Zu verwendende bzw. recherchierende Literatur: Deep learning: Yann LeCun, Yoshua Bengio & Geoffrey Hinton, Nature 521, 436–444 (28 May 2015) Deng, J., Dong, W., Socher, R., Li, L. J., Li, K., & Fei-Fei, L. (2009, June). Imagenet: A large-scale hierarchical image database. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 248-255). IEEE ●Pierre Sermanet, David Eigen, Xiang Zhang, Michael Mathieu, Rob Fergus and Yann LeCun: OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks, International Conference on Learning Representations (ICLR2014) ●Sandhan, T.; Jin Young Choi, "Handling Imbalanced Datasets by Partially Guided Hybrid Sampling for Pattern Recognition," in Pattern Recognition (ICPR), 2014 22nd International Conference on , vol., no., pp.1449-1453, 24-28 Aug. 2014 ● ● 6) Notwendige Vorkenntnisse für die Themenbearbeitung: •Grundlagen der Bildverarbeitung und Computer Vision •Grundlagen im Machine Learning und insb. Deep Learning •Funktionsweise von convolutional neural networks •Gute Programmierkenntnisse Bearbeitungszeitraum: 01.02.2016 bis 30.04.2016 Betreuer im Unternehmen: Dipl. Phys. Christoph Stahl, [email protected], Tel: +49 8459 81 78139 Betreuer seitens der TU Ilmenau: Dipl.-Inf. Markus Eisenbach, [email protected], Tel: +49 3677 69 4169 Betr. Hochschullehrer: Prof. Dr. H.M. Groß