Big Data Cluster

Das am Fachbereich Informatik im Rahmen des Big Data Competence Centers seit 2012 betriebene und in den Jahren 2015 bzw. 2017 erweiterte Big Data Cluster ermöglicht es, in Lehrveranstaltungen, Praktika und studentischen Projektarbeiten das Thema Big Data auch praktisch und realitätsnah zu vermitteln. Darüber hinaus kann im Rahmen von Abschlussarbeiten Kompetenz in der Durchführung von vergleichenden Untersuchungen mit realistischen Datenmengen und Anwendungsszenarien erworben werden.

Hardware

Kern des Big Data Cluster sind 40 Nodes die dynamisch für unterschiedliche Einsatzszenarien konfiguriert werden können sowie eine entsprechende Netzwerk-Umgebung. Die Nodes unterscheiden sich in der Ausstattung bezüglich der Prozessoren, des RAM und der Speichermedien, um für die unterschiedlichsten Big Data Szenarien geeignete Infrastruktur anzubieten. Die technischen Details der Ausstattung finden Sie untenstehend.

Software

Derzeit werden die folgenden Big Data Softwareprodukte auf dem Cluster angeboten:

  • Apache Spark
  • Apache Hadoop
  • MongoDB
  • Couchbase
  • Apache Cassandra
  • Neo4j
  • SAP HANA

Weitere Software kann bei Bedarf unterstützt werden.

Technische Ausstattung im Detail

Die 40 Nodes unterscheiden sich in der Ausstattung bezüglich der Prozessoren, des RAM und der Speichermedien, um für die unterschiedlichsten Big Data Szenarien geeignete Infrastruktur anzubieten:

  • 28 x Dell PowerEdge C6220
    • 2 Intel Xeon E5-2609 (je 4 Cores)
    • 64 GB RAM
    • 4 x 1 TB SATA 7.2 k
  • 8 x Dell PowerEdge C6320
    • 2 Intel Xeon E5-2620v2 (je 6 Cores)
    • 128 GB RAM
    • 4 x 1 TB SATA 7.2 k
  • 2 x Dell PowerEdge C6320
    • 2 Intel Xeon E5-2620v2 (je 6 Cores)
    • 128 GB RAM
    • 2 x 1 TB SATA 7.2 k
    • 2 x 200 GB SATA SSD
  • 2 x Dell PowerEdge C6320
    • 2 Intel Xeon E5-2695v2 (je 12 Cores)
    • 128 GB RAM
    • 2 x 1 TB SATA 7.2 k
    • 2 x 200 GB SATA SSD

Um die Infrastruktur parallel für unterschiedliche Lehrveranstaltungen und Projekte nutzen zu können, steht ein entsprechender Storage Node zur Verfügung:

  • Dell PowerEdge R720XD
  • Intel Xeon E5-2630L 2.00 GHz (6 Cores)
  • 16 GB RAM
  • 24 TB Near-Line SAS

Für Lehrveranstaltungen und Projekte zum Thema paralleles Rechnen auf Grafikkarten sind außerdem 4 Nvidia M2075 Grafikkarten integriert. 

Forschungsleiterin

Mitarbeiter

Benedict Reuschling

Details zur Person

Finanzierung

Die Finanzierung erfolgte aus Mitteln nach dem Gesetz zur Verbesserung der Qualität der Studienbedingungen und der Lehre des Landes Hessen.