Prof. Dr. Markus Döhring
Sprechstunde
nach Vereinbarung, auch möglich via Skype/Hangouts
- Ersthelfer
- Fachbereichsrat (Mitglied Stellvertreter)
- Studienfachberater
Details zur Person
Markus Döhring studierte Wirtschaftsinformatik an der Berufsakademie Mannheim und erhielt 2009 den Master of Science in Informatik an der Hochschule Darmstadt. Bis 2013 promovierte er am Lehrstuhl für Datenbanken und Informationssysteme der Universität Jena.
Parallel war Markus Döhring 11 Jahre in verschiedenen industriellen Forschungs- und Entwicklungsbereichen der SAP tätig, zuletzt bis 2015 in Data-Mining nahen Themenbereichen wie Social Network Analysis oder Predictive Maintenance. 2015-2018 war er als Data Science Senior Manager in einem Analytics-Kompetenzzentrum der BASF tätig, dessen Fokus die algorithmengestützte Mustersuche in großen Datenmengen ist. Dort betreute und gestaltete er Projekte u.a. rund um die Themen Product Recommender, Business-Process Mining und Web Mining.
Seit 03/2018 ist er berufen als Professor für Data Science und Grundlagen der Informatik an der Hochschule Darmstadt.
Für das Wintersemester führen wir die Data Science Einführungsveranstaltung diesmal virtuell in https://rooms.h-da.de/r?room=Data+Science+Extern am 30.09. um 09:00 durch.
Der Teil von 09:00-10:00 richtet sich speziell an DS-Erstsemester, ab 10:00 sind alle DS-Studierende eingeladen.
Slot
Thema
09:00-09:30
Aufbau des Studiums, Informationen zum aktuellen Semester
09:30-09:45
Belegsystem
09:45-10:00
was erwartet mich auf meinem Weg zum Data Scientist?
10:00-10:15
Studentische Infos, Tipps&Tricks
10:15-10:40
Vorstellung von Professoren und Vorlesungen (jeder ~3 Minuten), Fragerunde
10:40-11:00
Spezifische Beleghinweise für das Wintersemester 24/25
Synchronisationsmodul Informatik WS 24/25 (Master Data Science)
Der Kickoff für das Synchronisationsmodul Informatik im Masterstudiengang Data Science (Modulbeschreibung: https://obs.fbi.h-da.de/mhb/modul.php?nr=90107.1021&sem=20162 ) findet von 09.10.-11.10. statt in Raum C23 2.01
Bitte bringen Sie ein Notebook mit einer Docker Installation mit!
In der Veranstaltung werden die nötigen Methoden und das nötige Wissen zur Anwendung relevanter Text- und Web-Mining Verfahren entlang des KDD Prozesses (Knowledge Discovery in Databases) gegeben. Dies schließt relevante Schritte wie die Datenbaffung aus dem WWW, die Aufbereitung unstrukturierter und semistrukturierter Text/HTML Daten, und die statistische Analyse bzw. das Lernen von Modellen mit (un)überwachten Verfahren des maschinellen Lernens mit ein.
Im folgenden finden Sie einige Details zur Vorlesung, die über die Modulbeschreibung ( https://obs.fbi.h-da.de/mhb/modul.php?nr=41.5042&sem=20182 ) hinausgehen:
- Folgender Inhaltsblöcke werden in der Vorlesung inhallich abgestimmt auf das Praktikum vermittelt:
- Mustererkennung in semi-strukturierten Webdaten mit regulären Ausdrücken und XPath
- Crawler-Architekturen und -Programmierung mit Scrapy, sowie Such-Strategien im WWW mit Scrapy
- Text-Vorverarbeitung mit Verfahren des Natural Language Processing
- Information Retrieval: Anfragemodelle, Ähnlichkeitsfunktionen, Duplikaterkennung, Gütemaße und Evaluation, Lernen von Wortvektoren mit Word2Vec
- Unüberwachtes Lernen: Probabilistische Topicmodelle
- Überwachtes Lernen: Standard-Klassifikatoren auf Textrepräsentationen
- State of the Art: Neuronale Netze und Deep Learning, inkl. einiger aktueller Entwicklungen im Bereich Transformer Models, z.B. BERT, GPT & co.
- Stark empfohlen sind Vorerfahrungen im Bereich Data Mining (z.B. erworben durch das "Machine Learning" Modul im Data Science Master oder auch dem Modul "Datenvorverarbeitung und Feature Engineering".
- Falls Sie die Veranstaltung "Natural Language Processing" bereits belegt haben, ist dies eher nützlich als hinderlich. Dieseüberschneidet sich zu max. je ca. 15% und haben einen jeweils anderen Fokus.
- Wichtiger Hinweis: Für diese Wahlpflicht-Veranstaltung kann es nötig sein, dass Sie sich bei Webdiensten wie z.B. Google, Amazon Web Services, Kaggle oder Yelp zur Nutzung von Infrastruktur und/oder Datensätzen registrieren. Bitte belegen Sie die Veranstaltung nur, wenn Sie damit einverstanden sind.
Data Science Projekt WS 24/25 (Master Data Science) mit Sanofi
Das Data Science Projekt im Wintersemester 22/23 findet im Rahmen einer strategischen Partnerschaft mit www.sanofi.de, einem der größten Pharmakonzerne weltweit, statt. Thematisch wird die mutlivariate Analyse von Daten in der Insulinproduktion im Vordergrund stehen.
Modulbeschreibung: https://obs.fbi.h-da.de/mhb/modul.php?nr=90107.1051&sem=20172
Für alle Teilnehmer des Data Science Projekts findet voraussichtlich am 09.10. ODER am 10.10. ODER am 11.10. ein optionaler Git-Einführungskurs gemeinsam mit den Teilnehmern des Synchronisationsmoduls Informatik statt.
Sie haben eine spannende Idee für ein eigenes Projekt im Bereich Data Mining? Sie wollten z.B. schon immer einmal an einer Data Science Competition wie Kaggle teilnehmen? Bei ausreichender inhaltlicher Tiefe könnte sich hier das individuell gestaltbare Modul "Vertiefende F&E Studien" anbieten. Sprechen Sie mich bei Interesse darauf an.
https://obs.fbi.h-da.de/mhb/modul.php?nr=41.4974&sem=20151
Für das Wintersemester 24/25 habe ich leider keine freien Kapazitäten mehr zur Betreuung von Abschlussarbeiten. Ab dem Sommersemester 2025 betreue ich gerne wieder Abschlussarbeiten, thematisch bevorzugt im Bereich Data-, Text- und Web-Mining. Sprechen Sie mich dazu bitte frühzeitig an. Im Wintersemester 25/26 befinde ich mich voraussichtlich im Forschungssemester, daher muss die Anmeldung einer Masterarbeit für das Sommersemester 2025 spätestens im März erfolgt sein.
Die betreuten Masterarbeiten im Studiengang Data Science sind hier hinterlegt: https://fbmn.h-da.de/abschlussarbeiten-data-science
Für die betreuten Abschlussarbeiten im Bereich Informatik existiert aktuell leider kein zentrales Repository.
Allgemeine Hinweise und Vorlagen zu Bachelorarbeiten finden Sie hier:https://fbi.h-da.de/studium/studienorganisation/studienorganisation-b-sc-informatik/abschlussarbeit
Eine sehr gut bewertete Bachelorarbeit als Beispiel finden Sie hier: Quantifizierung des Rezyklatgehaltes in Kunststoffteilen für den Automobilbau mit Hilfe von Machine Learning-Methoden (Dennis Imhof, 2020) - Der Umfang ist keinesfalls eine Zielgröße für eine übliche Bachelorarbeit
- Betreuung von dualen Praxisphasen und Bachelorarbeiten
- F&E Projekt "MediaWatch": Überwachung der Publikationsgeschwindigkeit und des thematischen Bias auf unterschiedlichen News-Plattformen
- DataForge: Informationsextraktion aus Emails gemeinsam mit der R+V
Kontakt
Kommunikation
Schöfferstraße 8b
64295 Darmstadt
Büro: D15, 303
+49.6151.533-68961
markus.doehring@h-da.de
1
Sprechstunde
nach Vereinbarung, auch möglich via Skype/Hangouts