Bachelorarbeit: Prognostiziertes Skalierungsverhalten von HPC-Applikationen durch Erarbeitung eines Performancemodells

In HPC-Umgebungen wird ein mathematisches Problem in Form von Jobs bearbeitet. Eine Applikation berechnet ein Ergebnis aus gegebenen Eingabedaten. Solche Berechnungen dauern häufig Tage oder Wochen, weshalb typischerweise mehrere Rechner zusammen an Teilergebnissen rechnen. Hierbei führt eine stärkere Skalierung über mehr Rechner aber nicht unbedingt zu einer geringeren Berechnungsdauer, sondern belegt wertvolle Ressourcen. Ein bestimmenden Faktor für dieses Verhalten ist die Verteilbarkeit des zugrunde liegenden Algorithmus, zum Beispiel wie das Problem in parallel berechnete Teilprobleme partitioniert werden kann. Weiterhin ist die Parallelisierbarkeit durch die Hardware selbst, wie z.B. die Anzahl der CPUs oder verfügbaren Arbeitsspeicher pro Rechner, limitiert. Ein noch ungelöstes Problem ist das Schließen aus den Eingabedaten und der Applikation auf die maximale Anzahl der zu verwendenden Rechner, die noch eine Verkürzung der Gesamtlaufzeit bewirken. Auch wenn dieses Problem im allgemeinen Fall nicht lösbar ist, kann für ausgewählte Applikation eines Cluster eine annähernd optimale Lösung bestimmt werden.

Aufgabe der Bachelorarbeit ist es, sich in das Themengebiet einzuarbeiten und ein System zu entwerfen und zu entwickeln, welches auf Grund der Eingabedaten exemplarisch für die Anwendung Gromacs eine möglichst optimale Skalierung vorschlägt. Denkbar wäre eine Datensammlung, Testumgebung oder Applikationserweiterung, um dieses Ziel zu erreichen.

Betreuer: Matthias Keller

Teaching