Prof. Dr. Markus Döhring

Sprechstunde
nach Vereinbarung, auch möglich via Skype/Hangouts

Weitere Funktionen
  • Fachbereichsrat (Mitglied Stellvertreter)

Portrait: Döhring, Markus, Prof. Dr.

Details zur Person
Markus Döhring studierte Wirtschaftsinformatik an der Berufsakademie Mannheim und erhielt 2009 den Master of Science in Informatik an der Hochschule Darmstadt. Bis 2013 promovierte er am Lehrstuhl für Datenbanken und Informationssysteme der Universität Jena. Parallel war Markus Döhring 11 Jahre in verschiedenen industriellen Forschungs- und Entwicklungsbereichen der SAP tätig, zuletzt bis 2015 in Data-Mining nahen Themenbereichen wie Social Network Analysis oder Predictive Maintenance. 2015-2018 war er als Data Science Senior Manager in einem Analytics-Kompetenzzentrum der BASF tätig, dessen Fokus die algorithmengestützte Mustersuche in großen Datenmengen ist. Dort betreute und gestaltete er Projekte u.a. rund um die Themen Product Recommender, Business-Process Mining und Web Mining. Seit 03/2018 ist er berufen als Professor für Data Science und Grundlagen der Informatik an der Hochschule Darmstadt.

Grundlagen und Implementierung moderner neuronaler Netzarchitekturen SS'24 (Master Data Science, Master Informatik)

Im kommenden Sommersemester biete ich erstmals die Lehrveranstaltung „Grundlagen und Implementierung moderner neuronaler Netzarchitekturen“ an, die Prof. Braun und ich entwickelt haben und die er Wintersemester bereits gehalten hat. Inhaltlich im Zentrum stehen die Transformer-Modelle, ein wesentlicher Bestandteil der aktuellen Large Language Models wie ChatGPT. Das dazu nötige Rüstzeug im allgemeinen Bereich der neuronalen Netze wird umfangreich vermittelt. Als T-Modul (Informatik) bzw. DS-I Modul (Data Science) hat das Modul entsprechend mathematische Schwerpunkte, die aber praxisnah vermittelt werden. 

Prof. Braun hat im ersten Lauf bereits einige hervorragende Lehrvideos produziert. Diese werden zu einem Großteil zur asynchronen Wissensvermittlung eingesetzt. Dementsprechend soll die Zeit in den Lehrveranstaltungen primär für (ggf. auch individuelle) Lernbegleitung, Fragenklärung, Übungen, gemeinsame Experimenten und Praktikumsinhalte verwendet werden. 

Die Inhalte aus aktueller Sicht sind: 

•    Einführung neuronale Netze
•    Gradienten und Backpropagation
•    Affine Transformation und Perzeptron
•    Modelloptimierungen: Dropout, Normalisierung
•    Klassifikation und Softmax
•    Kullback-Leibler-Divergenz und Kreuzentropie
•    Sequence-To-Sequence
•    Attention-Mechanismus
•    Transformer
•    Fine-Tuning vortrainierter Transformermodelle
•    Implementierungsaspekte (z.B. numerische Stabilität)
•    Weitere Transformer-Architekturen


Der Praktikumsteil des Moduls ist aktuell noch „experimentell“, d.h. die Erwartung an Teilnehmerinnen und Teilnehmer ist, diesen aktiv durch Vorschläge und Feedback mitzugestalten. 
Es gibt hierzu bereits einige Ideen und Aufgabenstellungen.


Daraus ergibt sich insgesamt folgender grober Plan für die Organisation der Lehrveranstaltung: 

•    Ca. 6-8 Termine à 1.5h vor der Vorlesungszeit verteilt auf die Kalenderwochen 12, 14 und 15, überwiegend im Inverted-Stil auf Basis der Lehrvideos und für technische Intros zum Praktikum. Prioritäten bei der Gestaltung hierbei (z.B. primär Online-Termine, Präsenz-Kickoff, genaue Verteilung) können wir ggf. noch mit dem zu erwartenden Teilnehmerkreis klären
•    Ein Block (2SWS) pro Woche im Semester überwiegend in Präsenz, der flexibel je nach Bedarf für Praktikum/Übung/Lernbegleitung genutzt werden kann und ggf auch mal ausfallen kann wenn kein Bedarf besteht. 
•    Weitere außerordentliche Termine nach Bedarf&Absprache.
•    Das Praktikum wird in 2-4er Teams bearbeitet. 

Dieser erste Durchlauf meinerseits wird mit 16 Plätzen 50:50 Master Informatik und Data Science durchgeführt. Da es bereits jetzt eine hohe Nachfrage gibt, werden wir so verfahren, dass sich Interessierte bei mir per Mail melden und wir dann Plätze losen werden. 
Für den Kurs ist mir wichtig, dass Sie eine hohe Eigenmotivation mitbringen, an dem Thema wirklich interessiert sind, Sie sich auf die mathematischen „Innereien“ von neuronalen Netzen einlassen, mir öfters Feedback geben und Sie Lust haben aktiv das Praktikum mitzugestalten.

Da der Kurs bereits vor Vorlesungsstart begonnen hat, ist aktuell keine Einschreibung mehr möglich. 

Modulbeschreibung siehe: https://obs.fbi.h-da.de/mhb/modul.php?nr=41.4984&sem=20201

Die Lehrveranstaltung wird voraussichtlich angeboten bestehend aus einem Mix aus: 

  • überwiegend Präsenzveranstaltungen mit grundsätzlich hohem Interaktionsanteil.

  • Teilweise Wissensvermittlung, anstatt klassischer "Vorlesung" durch kompakte, durch den Dozenten aufgezeichnete Lehrvideos

  • Quellenangaben mit Scans/Ebooks zum Durchlesen
  • Q&A Sessions (Inverted Classroom)

Das Praktikum wird in 3er Gruppen grundsätzlich Präsenz bearbeitet. Es besteht immer die Möglichkeit, Fragen an Dozenten und Tutoren über ein Moodle-Forum zu richten. 

Wir arbeiten im Praktikum primär mit Spark+Python (PySpark). 

Voraussetzung zur Teilnahme am Praktikum ist die grundsätzliche Bereitschaft, mit Cloud-Technologien z.B. von AWS zu arbeiten und sich dort bei Bedarf einen User anzulegen. 

Modulbeschreibung siehe: https://obs.fbi.h-da.de/mhb/modul.php?nr=30.7312&sem=20142 

Die Lehrveranstaltung wird voraussichtlich angeboten durch einen Mix aus: 

  • überwiegend Präsenzveranstaltungen mit grundsätzlich hohem Interaktionsanteil. . 
  • Teilweise Wissensvermittlung, anstatt klassischer "Vorlesung" durch kompakte, durch den Dozenten aufgezeichnete Lehrvideos
  • Quellenangaben mit Scans/Ebooks zum Durchlesen
  • Q&A Sessions (Inverted Classroom)

Das Praktikum wird in 2er Gruppen grundsätzlich in Präsenz bearbeitet. Es besteht immer die Möglichkeit, Fragen an Dozenten und Tutoren über ein Moodle-Forum zu richten. 

Im Praktikum wird mit PowerDesigner + PostgreSQL gearbeitet. 

 

Sie haben eine spannende Idee für ein eigenes Projekt im Bereich Data Mining? Sie wollten z.B. schon immer einmal an einer Data Science Competition wie Kaggle teilnehmen? Bei ausreichender inhaltlicher Tiefe könnte sich hier das individuell gestaltbare Modul "Vertiefende F&E Studien" anbieten. Sprechen Sie mich bei Interesse darauf an. 

https://obs.fbi.h-da.de/mhb/modul.php?nr=41.4974&sem=20151

 

Für das Sommersemester 2024 habe ich leider keine freien Kapazitäten mehr zur Betreuung von Abschlussarbeiten. Ab dem Wintersemester 2024/2025 betreue ich gerne wieder Abschlussarbeiten, thematisch bevorzugt im Bereich Data-, Text- und Web-Mining. Sprechen Sie mich dazu bitte frühzeitig an. 

Die betreuten Masterarbeiten im Studiengang Data Science sind hier hinterlegt: https://fbmn.h-da.de/abschlussarbeiten-data-science

Für die betreuten Abschlussarbeiten im Bereich Informatik existiert aktuell leider kein zentrales Repository. 

 

Allgemeine Hinweise und Vorlagen zu Bachelorarbeiten finden Sie hier:https://fbi.h-da.de/studium/studienorganisation/studienorganisation-b-sc-informatik/abschlussarbeit 

Eine sehr gut bewertete Bachelorarbeit als Beispiel finden Sie hier: Quantifizierung des Rezyklatgehaltes in Kunststoffteilen für den Automobilbau mit Hilfe von Machine Learning-Methoden (Dennis Imhof, 2020) - Der Umfang ist keinesfalls eine Zielgröße für eine übliche Bachelorarbeit

  • Betreuung von dualen Praxisphasen und Bachelorarbeiten 
  • F&E Projekt "MediaWatch": Überwachung der Publikationsgeschwindigkeit und des thematischen Bias auf unterschiedlichen News-Plattformen
  • DataForge: Informationsextraktion aus Emails gemeinsam mit der R+V 

Kontakt

Prof. Dr. Markus Döhring

Kommunikation Schöfferstraße 8b
64295 Darmstadt
Büro: D15, 303

+49.6151.533-68961
markus.doehring@h-da.de

1

Sprechstunde
nach Vereinbarung, auch möglich via Skype/Hangouts