918726

Terascale in den Top500 - politische Auswirkungen

23.01.2004 | 10:22 Uhr | Peter Müller

Terascale in den Top500 - politische Auswirkungen

Auf Anhieb schaffte es der 5,2 Millionen US-Dollar teure Terascale X-Cluster mit 10,28 TFlop/s Linpack auf Platz 3 der Top500-Liste von November 2003. Dabei löste der Rechner ein dicht besetztes lineares Gleichungssystem der Dimension 520.000 mit 58 Prozent seiner Spitzenleistung von 17,6 TFlop/s. Ein Gleichungssystem der Größe 152.000 berechnete der Cluster aus 1100 G5-PCs mit der halben Linpack-Leistung von 5,1 TFlop/s.

Die Nummer 2 der Top500 hält der 215 Millionen US-Dollar teure ASCI Q auf Basis von 8192 Hewlett-Packard AlphaServern. Er erreicht bei einer Matrixgröße von 633.000 13,88 TFlop/s und damit 68 Prozent seiner Spitzenleistung. Der Earth Simulator mit 5120 NEC Vektorprozessoren löst ein lineares System der Dimension 1.075.200 mit 35,86 TFlop/s, immerhin 88 Prozent seiner theoretischen Spitzenleistung. Dafür schlägt er auch mit 350 Millionen US-Dollar zu Buche.

Natürlich haben die extrem niedrigen Kosten des X-Clusters die Entscheider in allen Supercomputer-Rechenzentren geschockt. Wie sollen sie jetzt argumentieren, um weiterhin die bislang üblichen Summen zum Kauf der Supercomputer zu erhalten? Oder sind die "echten" Supercomputer wirklich schon Relikte einer untergehenden Ära?

Neue Benchmarks

Doch noch gibt es keine Benchmarks mit realen Programmen auf Virginia Techs X. Man kann aber davon ausgehen, dass die Bronzemedaille dabei nicht mehr an den X geht. Rudolf Eigenmann, Professor an der Purdue University, stellte auf der US-Supercomputer-Konferenz in Phoenix eine Rangliste von Top Application Performers (TAP, Anwendungs-Benchmarks) auf. Sie basiert auf der neuen SPEC HPC2002 Suite (Standard Performance Evaluation), die reale und aktuelle Anwendungen aus den Bereichen Chemie, Klimamodellierung und Seismik/Exploration enthält.
Dabei zeigte sich, dass Rechner wie der X-Cluster mit einer großen Prozessorzahl, aber einer moderaten Vernetzung zwar bei den bislang verwendeten Linpack-Benchmarks gut abschneiden. Dieser Benchmark aus den 70er Jahren hat aber nur noch wenig Praxisrelevanz, denn gerade die moderat vernetzten Cluster fallen bei realen Applikationen stark ab: Der Linpack mit seinem speicherfreundlichen Algorithmus erfordert deutlich weniger Kommunikation der Knoten untereinander, als dies bei realistischen physikalischen Modellen der Fall ist. Somit ist das Geld, das bei anderen, deutlich teureren Hochleistungs-Clustern in eine schnelle Kommunikation der Knoten gesteckt wird, doch sinnvoll angelegt.

In das gleiche Horn stoßen Jack Dongarra und Piotr Liuszczek aus Tennessee. Sie kündigen eine neue Benchmark-Suite mit internationaler Beteiligung an, die HPC-Challenge-Benchmarks. Im ersten Release wird diese die Lokalität von Daten, den Speicherzugriff eines Prozessors (STREAM-Benchmark), einen zufallsartigen Zugriff, eine Matrixtransposition sowie Interprozessorkommunikation und deren Verzögerung berücksichtigen.

Schon vor eineinhalb Jahren präsentierte IDC (International Data Corporation) seinen neuen HPC Benchmark und die zugehörige Rangliste. In diesem fasst IDC Linpack-, SPECint- und SPECfp-Leistung, theoretische Prozessorbandbreite, STREAM-Ergebnisse, Prozessorzahl und die Speicherbandbreite des Gesamtsystems zusammen. Diese Rangliste unterscheidet sich drastisch von der der Top500.

Wie wenig aussagekräftig bisherige Supercomputing-Benchmarks, wie der für die Top500 genutzte Linpack, sind, zeigt sich beim Vergleich der beiden schnellsten Rechner der Welt: So ist der Earth Simulator beim Linpack "nur" 4,6 Mal schneller als ASCI Q. Misst man dagegen mit dem ebenfalls recht gebräuchlichen STREAM Triad, landen beide Systeme wieder auf Platz eins und zwei, unterscheiden sich bei der Rechenleistung aber um den Faktor 36.

Macwelt Marktplatz

918726