Auswertung von Metadaten in großen Speichersystemen

From Lsdf
Revision as of 11:23, 9 October 2018 by Nico.schlitter (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Beschreibung

Die Large Scale Data Facility (LSDF) am SCC stellt Wissenschaftlern einen großen Datenspeicher mit momentan über 10 Petabyte zur Verfügung. In dem Speichersystem befinden sich momentan mehrere 100-Millionen einzelne Dateien sehr unterschiedlicher Größe. Für die Überwachung des Systems und zum Verständnis der Arbeitsweise der Nutzer werden in regelnmäßigen Abständen Informationen über die Eigenschaften aller Dateien in eine NoSQL-Datenbank (Elasticsearch) gespeichert. Im Rahmen dieses Praktikums geht es darum, die in der Elasticsearch-Datenbank gespeicherte Daten auszuwerten und mit geeigneten Werkzeugen zu visualiseren, um verschiedene für den Betrieb der Speicherplattform relevante Fragestellungen zu beantworten,


Voraussetzungen

  • Grundkenntnisse in der Administration von Linuxsystemn

Kontakt

jan.sundermann@kit.edu