PSE
From Lsdf
Jump to navigationJump to search
Praxis der Software Entwicklung: Entwicklung eines Big (Meta) Data Visualisers
Überblick
Wissenschaftliche Forschungsprojekte nutzen oftmals mehrere heterogene Speichersysteme, um wissenschaftliche Daten im Petabyte-Bereich abzulegen. Bei diesem Projekt am SCC soll ein Werkzeug zur Visualisierung von Nutzungsdaten dieser großen Datenmengen entstehen. Das Ziel ist hierbei produktive Tools zu entwickeln, mit denen dieser teure Speicherplatz effizient verwaltet werden kann. Es soll helfen, ungenutzte Datenmengen zu erkennen und zeitnah auf kostengünstige Speichermedien (Bandlaufwerke) zu migrieren.
Projekt
Konkret soll eine Web Anwendung implementiert werden, bei der die Clients vom Server die Metadaten abrufen und visualisieren. Vorverarbeitungsschritte können auf dem Server durchgeführt werden.
Details
- Es soll ein REST-Server konzipiert und in Python implementiert werden, der Anfragen der clients. Aufgaben des Servers sind:
- Clientanfragen überprüfen (authentisierung, authorisierung)
- Statusinformationen bereitstellen
- Vorverarbeitung der Metadaten
- Fehlerbehanglung, Logging
- Speichersysteme sollen abstrakt behandelt und klassifiziert werden (Qualitäten, wie Kosten, Verfügbarkeit, ...)
- Es sollen durch Module (Agents) verschiedene Kopierprotokolle unterstützt werden (cp, scp, gridftp)
- Clients sollen dazu dienen Datentransfers zu konfigurieren. Die Transfer-Tasks werden an den Server submittiert, der die Anfragen dann asynchron abarbeitet. Clients können jederzeit Statusabfragen machen. Es sollen geeignete Clients entworfen und implementiert werden:
- Graphisches Web User Interface (Javascript/HTML5)
- Die Clients sollen von den gängigsten Betriebssystemen aus verwendet werden können
- Zur Kommunikation zwischen den Komponenten sollen REST Schnittstellen verwendet werden