Prof. Dr. Markus Döhring

Professor
Fachbereich I

Sprechstunde
nach Vereinbarung, auch möglich via Skype/Hangouts

Schöfferstraße 8b
64295 Darmstadt
: D15,303
Markus Döhring

Markus Döhring studierte Wirtschaftsinformatik an der Berufsakademie Mannheim und erhielt 2009 den Master of Science in Informatik an der Hochschule Darmstadt. Bis 2013 promovierte er am Lehrstuhl für Datenbanken und Informationssysteme der Universität Jena. 
Parallel war Markus Döhring 11 Jahre in verschiedenen industriellen Forschungs- und Entwicklungsbereichen der SAP tätig, zuletzt bis 2015 in Data-Mining nahen Themenbereichen wie Social Network Analysis oder Predictive Maintenance. 2015-2018 war er als Data Science Senior Manager in einem Analytics-Kompetenzzentrum der BASF tätig, dessen Fokus die algorithmengestützte Mustersuche in großen Datenmengen ist. Dort betreute und gestaltete er Projekte u.a. rund um die Themen Product Recommender, Business-Process Mining und Web Mining. 
Seit 03/2018 ist er berufen als Professor für Data Science und Grundlagen der Informatik und koordiniert gemeinsam mit Prof. Dr. Sebastian Döhler (Fachbereich MN) den Masterstudiengang Data Science. 

Erstsemestereinführung Master Data Science

Für das Wintersemester führen wir die Data Science Einführungsveranstaltung am 1.10. um 14:30 in C10/8.02 durch.

Der Teil von 14:30-16:30 richtet sich speziell an DS-Erstsemester, ab 16:30 sind alle DS-Studierende eingeladen.

 

Slot

Thema

14:30-15:00

Aufbau des Studiums, Informationen zum aktuellen Semester

15:00-15:15

Belegsystem

15:15-15:45

was erwartet mich auf meinem Weg zum Data Scientist?

15:45-16:15

Beispielhafte Arbeitsergebnisse des Studiums

16:15-16:30

Studentische Infos, Tipps&Tricks (gerne auch mehr Zeit bei Bedarf)

16:30-17:00

Vorstellung von Professoren und Vorlesungen (jeder ~3 Minuten), Fragerunde

17:00-17:15

Spezifische Beleghinweise für das Wintersemester 19/20

open End

Social Event, Kneipentour, ...

In der Veranstaltung werden die nötigen Methoden und das nötige Wissen zur Anwendung relevanter Text- und Web-Mining Verfahren entlang des KDD Prozesses (Knowledge Discovery in Databases) gegeben. Dies schließt relevante Schritte wie die Datenbaffung aus dem WWW, die Aufbereitung unstrukturierter und semistrukturierter Text/HTML Daten, und die statistische Analyse bzw. das Lernen von Modellen mit (un)überwachten Verfahren des maschinellen Lernens mit ein. 

Die Vorlesung findet montags 14:15-15:45, erstmalig am 14.10. statt.

Das Praktikum beginnt am 30.10. und findet dienstags-y 14:15-17:30 und mittwochs 16:00-19:15 statt. 

Im folgenden finden Sie einige Details zur Vorlesung, die über die Modulbeschreibung ( https://obs.fbi.h-da.de/mhb/modul.php?nr=41.5042&sem=20182 ) hinausgehen:

  • Folgender Inhaltsblöcke werden in der Vorlesung inhallich abgestimmt auf das Praktikum vermittelt:
    • Mustererkennung in semi-strukturierten Webdaten mit regulären Ausdrücken und XPath
    • Crawler-Architekturen und -Programmierung mit Scrapy, sowie Such-Strategien im WWW mit Scrapy
    • Text-Vorverarbeitung mit Verfahren des Natural Language Processing
    • Information Retrieval: Anfragemodelle, Ähnlichkeitsfunktionen, Duplikaterkennung, Gütemaße und Evaluation, Lernen von Wortvektoren mit Word2Vec
    • Unüberwachtes Lernen: Probabilistische Topicmodelle
    • Überwachtes Lernen: Standard-Klassifikatoren auf Textrepräsentationen
    • Ausblick: Neuronale Netze und Deep Learning
  • Falls Sie die Veranstaltungen "Natural Language Processing" oder "Data-/Textmining" bereits belegt haben, ist dies eher nützlich als hinderlich. Die Veranstaltungen überschneiden sich zu max. je ca. 15% und haben einen jeweils anderen Fokus. 
  • Das Praktikum wird überwiegend Python-basiert stattfinden und von Nina Krüger und Dr. Steffen Schnitzer (https://werdenktwas.de/) mit betreut. Zu Beginn des Semesters werden wir einen optionalen Python-Crashkurs anbieten. Dieser findet am Mittwoch 09.10. 10:00-16:00 in D14/111 statt. 
  • Wichtiger Hinweis: Für diese Wahlpflicht-Veranstaltung kann es nötig sein, dass Sie sich bei Webdiensten wie z.B. Amazon Web Services, Kaggle oder Yelp zur Nutzung von Infrastruktur und/oder Datensätzen registrieren. Bitte belegen Sie die Veranstaltung nur, wenn Sie damit einverstanden sind.  

Synchronisationsmodul Informatik WS 19/20 (Master Data Science)

Der Kickoff für das Synchronisationsmodul Informatik im Masterstudiengang Data Science (Modulbeschreibung: https://obs.fbi.h-da.de/mhb/modul.php?nr=90107.1021&sem=20162 ) findet wie folgt in Raum D14/111 statt:

  • am Montag 07.10. von 10:00-16:00
  • am Dienstag 08.10.
    • von 10:00-13:00 regulär
    • von 13:00-16:00 Git-Einführung zusammen mit den Teilnehmern des Data Science Projekts
  • am Mittwoch 9.10. 10:00-16:00 Python Einführung gemeinsam mit weiteren Interessierten

Bitte bringen Sie ein Notebook mit einer VirtualBox (https://www.google.de/search?q=virtualbox) Installation mit!

 

Die regelmäßigen Termine während der Vorlesungszeit (Änderungen vorbehalten) ab 14.10. sind nach aktuellem Stand Mo4-5 und Di1-3.

Data Science Projekt WS 19/20 (Master Data Science)

Das Data Science Projekt im Wintersemester 19/20 findet im Rahmen einer strategischen Partnerschaft mit www.sanofi.de, einem der größten Pharmakonzerne weltweit, statt. Ziel ist die Vorhersage von Qualitätseigenschaften aus Fertigungsdaten (z.B. Sensorwerten) bei Insulinspritzen. 

Modulbeschreibung: https://obs.fbi.h-da.de/mhb/modul.php?nr=90107.1051&sem=20172

Für alle Teilnehmer des Data Science Projekts findet am Dienstag 08.10. von 13:00-16:00 in Raum D14/111 ein Git-Einführungskurs gemeinsam mit den Teilnehmern des Synchronisationsmoduls Informatik statt. 

Weitere Aktivitäten in der Lehre im WS 19/20

  • Betreuung von KoSi Projekten und Seminararbeiten (Bachelor Informatik)
  • Betreuung von Projekten dualer Data Science Studenten
  • F&E Studien: "Kaggle Competition"

Vertiefende F&E Studien mit Data Science Bezug

Sie haben eine spannende Idee für ein eigenes Projekt im Bereich Data Mining? Sie wollten z.B. schon immer einmal an einer Data Science Competition wie Kaggle teilnehmen? Bei ausreichender inhaltlicher Tiefe könnte sich hier das individuell gestaltbare Modul "Vertiefende F&E Studien" anbieten. Sprechen Sie mich bei Interesse darauf an. 

https://obs.fbi.h-da.de/mhb/modul.php?nr=41.4974&sem=20151

 

Masterarbeiten

Kapazitätsbedingt können in nächster Zeit keine zusätzlichen Masterarbeiten mehr von mir betreut werden. Kommen Sie mit Ihren thematischen Vorstellungen jedoch gerne auf mich zu, ich kann Sie ggf. weitervermitteln. 

Ab dem Sommersemester 2020 betreue ich gerne wieder Masterarbeiten, thematisch bevorzugt im Bereich Data-, Text- und Web-Mining. Sprechen Sie mich dazu bitte frühzeitig an.