From Lsdf
Jump to navigationJump to search
Beschreibung
Die Large Scale Data Facility (LSDF) am SCC stellt Wissenschaftlern einen großen Datenspeicher mit momentan über 10 Petabyte zur Verfügung. In dem Speichersystem befinden sich momentan mehrere 100-Millionen einzelne Dateien sehr unterschiedlicher Größe. Für die Überwachung des Systems und zum Verständnis der Arbeitsweise der Nutzer werden in regelnmäßigen Abständen Informationen über die Eigenschaften aller Dateien in eine NoSQL-Datenbank (Elasticsearch) gespeichert. Im Rahmen dieses Praktikums geht es darum, die in der Elasticsearch-Datenbank gespeicherte Daten auszuwerten und mit geeigneten Werkzeugen zu visualiseren, um verschiedene für den Betrieb der Speicherplattform relevante Fragestellungen zu beantworten,
Voraussetzungen
- Grundkenntnisse in der Administration von Linuxsystemn