Prof. Dr. Markus Döhring
Sprechstunde
nach Vereinbarung, auch möglich via Skype/Hangouts

Details zur Person
Markus Döhring studierte Wirtschaftsinformatik an der Berufsakademie Mannheim und erhielt 2009 den Master of Science in Informatik an der Hochschule Darmstadt. Bis 2013 promovierte er am Lehrstuhl für Datenbanken und Informationssysteme der Universität Jena. Parallel war Markus Döhring 11 Jahre in verschiedenen industriellen Forschungs- und Entwicklungsbereichen der SAP tätig, zuletzt bis 2015 in Data-Mining nahen Themenbereichen wie Social Network Analysis oder Predictive Maintenance. 2015-2018 war er als Data Science Senior Manager in einem Analytics-Kompetenzzentrum der BASF tätig, dessen Fokus die algorithmengestützte Mustersuche in großen Datenmengen ist. Dort betreute und gestaltete er Projekte u.a. rund um die Themen Product Recommender, Business-Process Mining und Web Mining. Seit 03/2018 ist er berufen als Professor für Data Science und Grundlagen der Informatik an der Hochschule Darmstadt.
Hohe Stickoxidwerte sind ein ernstzunehmendes Problem in Städten mit hohem Kraftfahrzeugaufkommen [1].
Das DAnalytics Team der Digitalstadt Darmstadt [2] verfügt über ein modernes Sensorsystem zur Datenerfassung der Verkehrsflüsse, des Wetters und der Luftqualität [3].
Im Rahmen einer h_da exklusiven Machine Learning Challenge werden Ihnen diese Aufzeichnungen von teils nicht-öffentlich zugänglichen Daten bereitgestellt.
Das Ziel ist die Anwendung maschineller Lernverfahren zur datenbasierten Konstruktion eines Vorhersagemodells für die Schadstoffbelastung am Nachmittag eines Tages. Die Ergebnisse des Modells können auf einer h_da-internen Evaluationsplattform [4] hochgeladen und automatisch beurteilt werden, so dass sich eine kontinuierlich verändernde Bestenliste von Teilnehmern ergibt. Selbstverständlich können Sie dort auch zunächst unter einem Pseudonym bzw. als Team teilnehmen, die Weitergabe von Daten/Ergebnissen außerhalb eines Teams bzw. das Anlegen mehrerer Accounts ist jedoch streng untersagt.
Die wichtigsten Benefits für Sie als Studierende sind:
- Zugang zu echten und spannenden exklusiven Daten aus Darmstadt
- Möglichkeit zum zwanglosen Experimentieren und Lernen unabhängig vom gewählten Studiengang
- Direktes, automatisches und quantitatives Feedback zu Ihren „Machine Learning Skills”
- Möglichkeit zum Austausch mit Studierenden anderer Fachbereiche in anderen Studiengängen, jedoch mit ähnlichen Schwerpunkten
- Falls in Ihrem Studiengang passend, dürfen Sie die Daten gerne auch im Rahmen eines CP-wirksamen Moduls bzw. einer Seminar-/Abschlussarbeit bearbeiten.
- Darüber hinaus winken Preise:
- 1. Platz: 200€
- 2. Platz: 100€
- 3. Platz: 50€ und eine Kiste Club Mate (oder Getränk nach Wahl)
- Sonderpreis für die besten Erkenntnisse bzw. explorative Datenanalyse: 150€
Termine:
- 01.08.2021: Start der Challenge
- 02.09.2021 10:30-12:00: Infosession mit DAnalytics zur Klärung von Detailfragen - https://rooms.h-da.de/r/Data%20Science%20Extern
- 31.10.2021: Ermittlung der Sieger anhand des Leaderboards
Wir hoffen auf eine rege Teilnahme.
Bei Interesse :
- registrieren Sie sich bitte im DAnalytics Moodle Kurs [5]
- akzeptieren Sie die Teilnahmeerklärung (nur dann können Sie die Inhalte und Daten sehen)
- lesen Sie das Dokument zur Erläuterung der Challenge
- laden Sie sich die Challengedaten herunter und bearbeiten Sie diese mit Tools Ihrer Wahl
- schauen Sie sich das Video zur Verwendung von EvalAI zum Hochladen Ihrer Ergebnisse an
- registrieren Sie sich bei EvalAI [4]; dies ist ausschließlich mit Ihrer h-da Emailadresse möglich
- Prüfen Sie die Güte Ihrer Vorhersagen und verbessern Sie diese so lange, bis Sie auf Platz 1 sind :-)
Die interne Evaluationsplattform ist vergleichbar z.B. mit https://www.kaggle.com/competitions , jedoch erlaubt sie es niederschwellig für Unternehmen aus der Region, ihre Datensätze geschützt und exklusiv mit einem begrenzten Kreis von h_da Studierenden zu teilen. Wenn Sie also als Studierende(r) oder Kollege/Kollegin Unternehmen kennen, die Interesse haben auf diesem Weg einer Machine Learning Challenge Studierende für Ihre Daten und Problemstellungen zu begeistern, dürfen Sie gerne auf uns zukommen.
Bei Fragen kommen Sie gerne auf uns zu. Viel Erfolg wünscht Ihr Challenge Team:
Prof. Dr. Markus Döhring (h_da FBI)
Dennis Imhof (h_da FBI)
Tobias Rohrer (h_da FBI)
Ralf Tank (DAnalytics)
Olaf Arras (DAnalytics)
[1] https://www.tagesschau.de/inland/eugh-stickoxid-deutschland-101.html
[2] https://www.digitalstadt-darmstadt.de/
[3] https://datenplattform.darmstadt.de/#!/tiles/
[4] http://uvm-evalai.fbi.h-da.de/ (nur im Hochschulnetz/VPN)
[5] https://lernen.h-da.de/course/view.php?id=15130 Code: Stickstoff
Modulbeschreibung siehe: https://obs.fbi.h-da.de/mhb/modul.php?nr=41.4984&sem=20201
Die Lehrveranstaltung wird voraussichtlich angeboten bestehend aus:
Präsenzveranstaltungen mit grundsätzlich hohem Interaktionsanteil.
Für ca. 80% der Vorlesungsinhalte (Wissensvermittlung, anstatt klassischer "Vorlesung") kompakte durch den Dozenten aufgezeichnete Lehrvideos
- Quellenangaben mit Scans/Ebooks zum Durchlesen
- Q&A Sessions (Inverted Classroom)
Das Praktikum wird in Gruppen grundsätzlich Präsenz bearbeitet. Es besteht immer die Möglichkeit, Fragen an Dozenten und Tutoren über ein Moodle-Forum zu richten.
Wir arbeiten im Praktikum primär mit Spark+Python (PySpark).
Voraussetzung zur Teilnahme am Praktikum ist die grundsätzliche Bereitschaft, mit Cloud-Technologien z.B. von AWS zu arbeiten und sich dort bei Bedarf einen User anzulegen.
Modulbeschreibung siehe: https://obs.fbi.h-da.de/mhb/modul.php?nr=30.7312&sem=20142
Die Lehrveranstaltung wird voraussichtlich angeboten bestehend aus:
- Präsenzveranstaltungen mit grundsätzlich hohem Interaktionsanteil. .
- Für ca. 80% der Vorlesungsinhalte (Wissensvermittlung, anstatt klassischer "Vorlesung") kompakte durch den Dozenten aufgezeichnete Lehrvideos
- Quellenangaben mit Scans/Ebooks zum Durchlesen
- Q&A Sessions (Inverted Classroom)
Das Praktikum wird in 2er Gruppen in grundsätzlich Präsenz bearbeitet. Es besteht immer die Möglichkeit, Fragen an Dozenten und Tutoren über ein Moodle-Forum zu richten.
Im Praktikum wird mit PowerDesigner + PostgreSQL gearbeitet.
Sie haben eine spannende Idee für ein eigenes Projekt im Bereich Data Mining? Sie wollten z.B. schon immer einmal an einer Data Science Competition wie Kaggle teilnehmen? Bei ausreichender inhaltlicher Tiefe könnte sich hier das individuell gestaltbare Modul "Vertiefende F&E Studien" anbieten. Sprechen Sie mich bei Interesse darauf an.
https://obs.fbi.h-da.de/mhb/modul.php?nr=41.4974&sem=20151
Ab dem Wintersemester 2022/23 betreue ich gerne wieder Abschlussarbeiten, thematisch bevorzugt im Bereich Data-, Text- und Web-Mining. Sprechen Sie mich dazu bitte frühzeitig an.
Die betreuten Masterarbeiten im Studiengang Data Science sind hier hinterlegt: https://fbmn.h-da.de/index.php/Themen/DataScience
Für die betreuten Abschlussarbeiten im Bereich Informatik existiert aktuell leider kein zentrales Repository.
Betreute Abschlussarbeiten im Bachelor/Master Informatik als Referent oder Korreferent:
Vorname
Nachname
Thema
Vanessa
Klein
Analyse des Validierungsprozesses von einem computergestützten System im pharmazeutischen Umfeld und Erarbeitung eines Lösungsvorschlags zur Prozessverbesserung
Andreas
Weber
Business Intelligence - Einführung eines innovativen und cloudbasierten Business Intelligence Layers als Reportinglösung in einem Automotive Konzern
Mohamed
Allouche
Guidelines for Making Existing Web Applications Progressive and Offline Capable
Levi
Flott
Development of a Domain-Specific Language in support of Software Architecture modelling
Lukas
Hohm
Verteiltes und inkrementelles Lernen mit Mondrian Forests
Dennis
Imhof
Quantifizierung des Rezyklatgehaltes in Kunststoffteilen für den Automobilbau mit Hilfe von Machine Learning-Methoden
Rebecca
Jox
Evaluation of Methods for Automatic Summary Generation on the Example of the Plenary Protocols of the German Bundestag
Jahn Zaib
Khan
Rekonstruktion von Vibrationsdaten
Ruben
Laack
Wie können Nutzeranmeldungen an Unternehmenssystemen gesichert werden
Oussama
Metawa
Anwendung von Latent Dirichlet Allocation auf Fachzeitschriftentexte sowie Identifikation neuer Industrie 4.0 Technologien mittels Pre-trained Language Modelle
Andre
Namur
Automatisiertes Machine Learning unter Verwendung von Data Warehouses
Dennis
Sauerwein
Verbesserte Cloud-Server Perfermance durch Performance-Verbesserungen in der lokalen Netzwerk-Infrastruktur
Tobias
Schmitt
Sicherheit in SQL- und NoSQL-Datenbanken in der Cloud
Alexander
Weinfurter
Log-basierte vorausschauende Wartung - Konzeption und Entwicklung eines Prototypen für Augenlaser
Selim
Dincer
Authentication Methods for Demand-Responsive Transport and their Impact on Privacy, Security and Convenience
Denis
Fedjakin
Erkennung von Äquivalenten SQL Statements in Teradata Datenbanken
Michael Sogyal
Löffler
Umsetzung einer Multicast-föhigen RPC-Middleware mit Publish/Subscribe
Jalil
Ariubi
Broadcast Production over IP Networks
Hinweise zu Bachelorarbeiten
Allgemeine Hinweise und Vorlagen zu Bachelorarbeiten finden Sie hier:https://fbi.h-da.de/studium/studienorganisation/studienorganisation-b-sc-informatik/abschlussarbeit
Eine sehr gut bewertete Bachelorarbeit als Beispiel finden Sie hier: Quantifizierung des Rezyklatgehaltes in Kunststoffteilen für den Automobilbau mit Hilfe von Machine Learning-Methoden (Dennis Imhof, 2020) - Der Umfang ist keinesfalls eine Zielgröße für eine übliche Bachelorarbeit
Kontakt
Prof. Dr. Markus Döhring
Kommunikation
Schöfferstraße 8b
64295 Darmstadt
Büro: D15, 303