Prof. Dr. Markus Döhring

Sprechstunde
nach Vereinbarung, auch möglich via Skype/Hangouts

Portrait: Döhring, Markus, Prof. Dr.

Details zur Person
Markus Döhring studierte Wirtschaftsinformatik an der Berufsakademie Mannheim und erhielt 2009 den Master of Science in Informatik an der Hochschule Darmstadt. Bis 2013 promovierte er am Lehrstuhl für Datenbanken und Informationssysteme der Universität Jena. Parallel war Markus Döhring 11 Jahre in verschiedenen industriellen Forschungs- und Entwicklungsbereichen der SAP tätig, zuletzt bis 2015 in Data-Mining nahen Themenbereichen wie Social Network Analysis oder Predictive Maintenance. 2015-2018 war er als Data Science Senior Manager in einem Analytics-Kompetenzzentrum der BASF tätig, dessen Fokus die algorithmengestützte Mustersuche in großen Datenmengen ist. Dort betreute und gestaltete er Projekte u.a. rund um die Themen Product Recommender, Business-Process Mining und Web Mining. Seit 03/2018 ist er berufen als Professor für Data Science und Grundlagen der Informatik an der Hochschule Darmstadt.

Hohe Stickoxidwerte sind ein ernstzunehmendes Problem in Städten mit hohem Kraftfahrzeugaufkommen [1].

Das DAnalytics Team der Digitalstadt Darmstadt [2] verfügt über ein modernes Sensorsystem zur Datenerfassung der Verkehrsflüsse, des Wetters und der Luftqualität [3].

Im Rahmen einer h_da exklusiven Machine Learning Challenge werden Ihnen diese Aufzeichnungen von teils nicht-öffentlich zugänglichen Daten bereitgestellt.

Das Ziel ist die Anwendung maschineller Lernverfahren zur datenbasierten Konstruktion eines Vorhersagemodells für die Schadstoffbelastung am Nachmittag eines Tages. Die Ergebnisse des Modells können auf einer h_da-internen Evaluationsplattform [4] hochgeladen und automatisch beurteilt werden, so dass sich eine kontinuierlich verändernde Bestenliste von Teilnehmern ergibt. Selbstverständlich können Sie dort auch zunächst unter einem Pseudonym bzw. als Team teilnehmen, die Weitergabe von Daten/Ergebnissen außerhalb eines Teams bzw. das Anlegen mehrerer Accounts ist jedoch streng untersagt.

Die wichtigsten Benefits für Sie als Studierende sind:

  • Zugang zu echten und spannenden exklusiven Daten aus Darmstadt
  • Möglichkeit zum zwanglosen Experimentieren und Lernen unabhängig vom gewählten Studiengang
  • Direktes, automatisches  und quantitatives Feedback zu Ihren „Machine Learning Skills”
  • Möglichkeit zum Austausch mit Studierenden anderer Fachbereiche in anderen Studiengängen, jedoch mit ähnlichen Schwerpunkten
  • Falls in Ihrem Studiengang passend, dürfen Sie die Daten gerne auch im Rahmen eines CP-wirksamen Moduls bzw. einer Seminar-/Abschlussarbeit bearbeiten.
  • Darüber hinaus winken Preise:
    • 1. Platz: 200€
    • 2. Platz: 100€
    • 3. Platz: 50€ und eine Kiste Club Mate (oder Getränk nach Wahl)
  • Sonderpreis für die besten Erkenntnisse bzw. explorative Datenanalyse: 150€

 

Termine:

 

Wir hoffen auf eine rege Teilnahme.

Bei Interesse :

  1. registrieren Sie sich bitte im DAnalytics Moodle Kurs [5]
  2. akzeptieren Sie die Teilnahmeerklärung (nur dann können Sie die Inhalte und Daten sehen)
  3. lesen Sie das Dokument zur Erläuterung der Challenge
  4. laden Sie sich die Challengedaten herunter und bearbeiten Sie diese mit Tools Ihrer Wahl
  5. schauen Sie sich das Video zur Verwendung von EvalAI zum Hochladen Ihrer Ergebnisse an
  6. registrieren Sie sich bei EvalAI [4]; dies ist ausschließlich mit Ihrer h-da Emailadresse möglich
  7. Prüfen Sie die Güte Ihrer Vorhersagen und verbessern Sie diese so lange, bis Sie auf Platz 1 sind  :-)

 

Die interne Evaluationsplattform ist vergleichbar z.B. mit https://www.kaggle.com/competitions , jedoch erlaubt sie es niederschwellig für Unternehmen aus der Region, ihre Datensätze geschützt und exklusiv mit einem begrenzten Kreis von h_da Studierenden zu teilen. Wenn Sie also als Studierende(r) oder Kollege/Kollegin Unternehmen kennen, die Interesse haben auf diesem Weg einer Machine Learning Challenge Studierende für Ihre Daten und Problemstellungen zu begeistern, dürfen Sie gerne auf uns zukommen.

Bei Fragen kommen Sie gerne auf uns zu. Viel Erfolg wünscht Ihr Challenge Team:

 

 

Prof. Dr. Markus Döhring (h_da FBI)

Dennis Imhof (h_da FBI)

Tobias Rohrer (h_da FBI)

Ralf Tank (DAnalytics)

Olaf Arras (DAnalytics)

 

 

[1] https://www.tagesschau.de/inland/eugh-stickoxid-deutschland-101.html

[2] https://www.digitalstadt-darmstadt.de/

[3] https://datenplattform.darmstadt.de/#!/tiles/

[4] http://uvm-evalai.fbi.h-da.de/ (nur im Hochschulnetz/VPN)

[5] https://lernen.h-da.de/course/view.php?id=15130    Code: Stickstoff

Modulbeschreibung siehe: https://obs.fbi.h-da.de/mhb/modul.php?nr=41.4984&sem=20201

Die Lehrveranstaltung wird voraussichtlich angeboten bestehend aus: 

  • Präsenzveranstaltungen mit grundsätzlich hohem Interaktionsanteil.

  • Für ca. 80% der Vorlesungsinhalte (Wissensvermittlung, anstatt klassischer "Vorlesung") kompakte durch den Dozenten aufgezeichnete Lehrvideos

  • Quellenangaben mit Scans/Ebooks zum Durchlesen
  • Q&A Sessions (Inverted Classroom)

Das Praktikum wird in Gruppen grundsätzlich Präsenz bearbeitet. Es besteht immer die Möglichkeit, Fragen an Dozenten und Tutoren über ein Moodle-Forum zu richten. 

Wir arbeiten im Praktikum primär mit Spark+Python (PySpark). 

Voraussetzung zur Teilnahme am Praktikum ist die grundsätzliche Bereitschaft, mit Cloud-Technologien z.B. von AWS zu arbeiten und sich dort bei Bedarf einen User anzulegen. 

Modulbeschreibung siehe: https://obs.fbi.h-da.de/mhb/modul.php?nr=30.7312&sem=20142 

Die Lehrveranstaltung wird voraussichtlich angeboten bestehend aus: 

  • Präsenzveranstaltungen mit grundsätzlich hohem Interaktionsanteil. . 
  • Für ca. 80% der Vorlesungsinhalte (Wissensvermittlung, anstatt klassischer "Vorlesung") kompakte durch den Dozenten aufgezeichnete Lehrvideos
  • Quellenangaben mit Scans/Ebooks zum Durchlesen
  • Q&A Sessions (Inverted Classroom)

Das Praktikum wird in 2er Gruppen in grundsätzlich Präsenz bearbeitet. Es besteht immer die Möglichkeit, Fragen an Dozenten und Tutoren über ein Moodle-Forum zu richten. 

Im Praktikum wird mit PowerDesigner + PostgreSQL gearbeitet. 

 

Sie haben eine spannende Idee für ein eigenes Projekt im Bereich Data Mining? Sie wollten z.B. schon immer einmal an einer Data Science Competition wie Kaggle teilnehmen? Bei ausreichender inhaltlicher Tiefe könnte sich hier das individuell gestaltbare Modul "Vertiefende F&E Studien" anbieten. Sprechen Sie mich bei Interesse darauf an. 

https://obs.fbi.h-da.de/mhb/modul.php?nr=41.4974&sem=20151

 

Ab dem Wintersemester 2022/23 betreue ich gerne wieder Abschlussarbeiten, thematisch bevorzugt im Bereich Data-, Text- und Web-Mining. Sprechen Sie mich dazu bitte frühzeitig an. 

Die betreuten Masterarbeiten im Studiengang Data Science sind hier hinterlegt: https://fbmn.h-da.de/index.php/Themen/DataScience

Für die betreuten Abschlussarbeiten im Bereich Informatik existiert aktuell leider kein zentrales Repository. 

Betreute Abschlussarbeiten im Bachelor/Master Informatik als Referent oder Korreferent:

Vorname

Nachname

Thema

Vanessa

Klein

Analyse des Validierungsprozesses von einem computergestützten System im pharmazeutischen Umfeld und Erarbeitung eines Lösungsvorschlags zur Prozessverbesserung

Andreas

Weber

Business Intelligence - Einführung eines innovativen und cloudbasierten Business Intelligence Layers als Reportinglösung in einem Automotive Konzern

Mohamed

Allouche

Guidelines for Making Existing Web Applications Progressive and Offline Capable

Levi

Flott

Development of a Domain-Specific Language in support of Software Architecture modelling

Lukas

Hohm

Verteiltes und inkrementelles Lernen mit Mondrian Forests

Dennis

Imhof

Quantifizierung des Rezyklatgehaltes in Kunststoffteilen für den Automobilbau mit Hilfe von Machine Learning-Methoden

Rebecca

Jox

Evaluation of Methods for Automatic Summary Generation on the Example of the Plenary Protocols of the German Bundestag

Jahn Zaib

Khan

Rekonstruktion von Vibrationsdaten

Ruben

Laack

Wie können Nutzeranmeldungen an Unternehmenssystemen gesichert werden

Oussama

Metawa

Anwendung von Latent Dirichlet Allocation auf Fachzeitschriftentexte sowie Identifikation neuer Industrie 4.0 Technologien mittels Pre-trained Language Modelle

Andre

Namur

Automatisiertes Machine Learning unter Verwendung von Data Warehouses

Dennis

Sauerwein

Verbesserte Cloud-Server Perfermance durch Performance-Verbesserungen in der lokalen Netzwerk-Infrastruktur

Tobias

Schmitt

Sicherheit in SQL- und NoSQL-Datenbanken in der Cloud

Alexander

Weinfurter

Log-basierte vorausschauende Wartung - Konzeption und Entwicklung eines Prototypen für Augenlaser

Selim

Dincer

Authentication Methods for Demand-Responsive Transport and their Impact on Privacy, Security and Convenience

Denis

Fedjakin

Erkennung von Äquivalenten SQL Statements in Teradata Datenbanken

Michael Sogyal

Löffler

Umsetzung einer Multicast-föhigen RPC-Middleware mit Publish/Subscribe

Jalil

Ariubi

Broadcast Production over IP Networks

Hinweise zu Bachelorarbeiten

Allgemeine Hinweise und Vorlagen zu Bachelorarbeiten finden Sie hier:https://fbi.h-da.de/studium/studienorganisation/studienorganisation-b-sc-informatik/abschlussarbeit 

Eine sehr gut bewertete Bachelorarbeit als Beispiel finden Sie hier: Quantifizierung des Rezyklatgehaltes in Kunststoffteilen für den Automobilbau mit Hilfe von Machine Learning-Methoden (Dennis Imhof, 2020) - Der Umfang ist keinesfalls eine Zielgröße für eine übliche Bachelorarbeit

Kontakt

Prof. Dr. Markus Döhring

Kommunikation
Schöfferstraße 8b
64295 Darmstadt
Büro: D15, 303

Markus Döhring