Hauptseminar

Visual Analytics und Machine Learning: Mittels Verständnis zum Ziel

Analysen sind nicht zuletzt durch die zunehmende Digitalisierung eine stetige Notwendigkeit, dies gilt gleichermaßen bei der Identifizierung von Fehlern, Problemen oder Verbesserungsmöglichkeiten. Mittels Visual Analytics setzt man dabei auf die Kombination der algorithmischen und massiven Berechnungsmöglichkeiten seitens computerbasierter Systeme und die insb. visuellen und kognitiven Fähigkeiten der Anwender. In dem Hauptseminar geht es dabei vor allem um den Einsatz von Visual Analytics in aktuellen angewandten Gebieten z.B. Smart Manufacturing, die Trendanalyse oder auch Legal Analytics. Hierbei sollen unter Berücksichtigung gegebener Aufgabenstellungen aktuelle Ansätze, Methoden und Umsetzungen recherchiert und untersucht werden. Das Ziel soll dabei eine wissenschaftliche Ausarbeitung sein, die auf empirischen und wissenschaftlichen Standards beruht.

Die Domäne des Smart Manufacturing steht für die intelligente Fertigung, welche sich u.a. aus der Notwendigkeit der Digitalisierung in der fertigenden Industrie ergibt. Durch die hieraus resultierende immer stärkere Vernetzung der Anlagen und Kommunikation dieser miteinander, werden auch immer größere größeren Datenmengen (z.B. Log-Daten) generiert. Diese Datenmengen zielgerichtet zu explorieren und z.B. im Fehlerfall effizient auszuwerten, ist heute nur mit großem Aufwand von Personal und Zeit möglich. Im Rahmen der Fehleranalyse kann so beispielsweise Visual Analytics als Zusammenspiel von Algorithmen, Visualisierungen und dem Endnutzer die Chance bieten, Fehlerfälle schneller zu erkennen und dem Benutzer aktiv in der Fehlersuche unterstützen.

Die Domäne der Trendanalyse beschäftigt sich mit der Erkennung von Trends innerhalb gegebener textueller oder statistischer Daten. Traditionell finden solche Analysen bei Finanzdaten (z.B. Aktienkurse) Anwendung. Aber es gibt noch eine Vielzahl weiterer Anwendungsfälle, so lassen sich etwa bei der Analyse aktueller Nachrichtenmeldungen und wissenschaftlichen Publikationsdaten aufkommende Trends in Form von Topics ermitteln. Aber erst durch Visual Analytics und die damit einhergehenden interaktiven Explorationsmöglichkeiten ist erst eine fundierte thematische Untersuchung möglich, wie sie etwa von Unternehmen im Technologiemanagement benötigt werden.

Legal Analytics beschäftigt sich mit der Auswertung von Rechtsdaten. Egal ob Gesetzestextes, oder Patentdaten, Legal Analytics versteht sich darauf statistisch und algorithmisch komplizierte Texte auszuwerten. So können z.B. Beziehungen oder Abhängigkeiten und Folgen automatisch herausgearbeitet und visualisiert werden. Dies erlaubt eine schnelle Auswertung der analysierten Texte zu einer definierten Fragstellung. Hiervon können Juristen, Unternehmen, wie auch privat Personen gleichermaßen profitieren.

Machine Learning und verschiedene Arten der Visualisierung finden dagegen Anwendung auf allen Anwendungsgebieten. Machine Learning ist in der heutigen Forschung alltäglich geworden. Mittels Autoencodern lassen sich hervorragend auch nicht lineare Datensätze nach Ausreißern filtern (Smart Manufacturing). Transformer sind im Bereich des Natural Language Processing (NLP) unübertroffen (Trendanalyse / Legal Analytics). Egal ob es im Bereich der Text Generation oder dem Topic Modelling ist. Statistische Verfahren wie Latent Dirichlet Allocation (LDA) werden ebenso stetig weiterentwickelt. Ensemble-Methoden haben ihre Nützlichkeit z.B. in der IT-Sicherheit bewiesen. Hierbei werden mehrere parallele neuronale Netze auf die Erkennung eines Merkmals trainiert und mittels Abstimmungsalgorithmus Gefahren detektiert.

Allen Verfahren gemein ist, dass neue Merkmale und Informationen aus vorhandenen Datensätzen extrahiert und annotiert werden. Durch die intelligente Vorverarbeitung wird das Explorieren großer Datenmengen erst möglich. Visualisierung in den unterschiedlichen Typen, egal ob geometrically-transformed, iconic, dense oder stacked Displays, dienen der geeigneten Aufbereitung der gefundenen Informationen. Gepaart mit verschiedenen wissenschaftlich elaborierten Interaktionsmöglichkeiten können zielgerichtet passend für jede Anwendungsdomain neue Visualisierungen entwickelt werden. Denn nicht nur das Herausfiltern der nötigen Informationen, sondern auch gleichbedeutend die Vermittlung der gewonnenen Erkenntnisse ist wichtig um das Anwendungsproblem hinreichend zu erfassen und Lösungen zu finden.

Der Leitfaden für dieses Seminar ist "Mittels Verständnis zum Ziel". Es geht hier um die wissenschaftliche Ausarbeitung von Fragestellungen die direkt aus der aktuellen Forschung stammen. Durch das Recherchieren, die Aufbereitung und Ausarbeitung der Fragestellung wird ein aktuelles Verständnis auf einem Teilgebiet aktueller Forschung gewonnen. Dies befähigt die Studierenden im späteren Arbeitsleben die gewonnen theoretischen Kenntnisse aktiv angewandt einzusetzen.

In allen Themengebieten wird passende Einstiegsliteratur bereitgestellt, welche als Grundlage für eine eigenständige weiterführende Literaturrecherche dienen soll. Die erstellten wissenschaftlichen Ausarbeitungen umfassen 15 Seiten pro Person im Springer LNCS-Format (Latex- oder Word-Template). Die Themenkomplexe werden in Gruppen von 1-2 Studierende bearbeitet. Die Veranstaltung umfasst drei Präsenztermine, den Kick-off mit Themenauswahl, die Präsentation des Zwischenstandes und die Abgabe des eigenständigen wissenschaftlich erarbeiteten Papers mit Präsentation der Ergebnisse. Auf Wunsch können auch weitere Termine zur Absprache vereinbart werden.

 

Kontakt

Lukas Kaupp

Kommunikation Holzhofallee 36b
64295 Darmstadt
Büro: D22, 0.05

+49.6151.533-60141
lukas.kaupp@h-da.de

1

Sprechstunde
Nach Absprache