NIC  
John von Neumann-Institut für Computing
 
 
Das NIC  
Supercomputer  
Beratung  
Dokumentation  
Rechenzeit  
Forschungsgruppen  
Publikationen  
NIC-Serie  
Proceedings  
NIC-Broschüre     
Projekte  
Internes  
Neues & Termine  
Kontakt  
Impressum  
Suche  
 
NIC-Broschüre online: Supercomputing

Die Broschüre des John von Neumann-Instituts für Computing gibt es auf deutsch und auf englisch. Sie kann bestellt werden beim NIC-Sekretariat (nic@fz-juelich.de).

Einleitung Supercomputing Astrophysik Elementarteilchenphysik Vielteilchenphysik Polymere Chemie Umwelt Sonstiges
Vorwort Super-
computing
Astro-
physik
Elementar-
teilchen
Viel-
teilchen
Polymere Chemie Umwelt Sonstige
Gebiete


    Supercomputing

Begleittext "Supercomputing" Wolfgang Gürich, NIC-ZAM
Cray-Komplex in Jülich NIC-ZAM
Prinzipdarstellung der JuNet-Teilnetze und ihrer Verbindungen Dieter Conrads, NIC-ZAM
APE100-Installation am DESY Zeuthen Ulrich Gensch, Peter Wegner, NIC-DESY Zeuthen
Standard PCI-Bus-Karte Ulrich Gensch, Peter Wegner, NIC-DESY Zeuthen
Response Time Monitor Wolfgang Gürich, NIC-ZAM
Systemüberwachung mit TREND Bernd Mohr, NIC-ZAM
Metacomputing im Gigabit Testbed West Thomas Eickermann, NIC-ZAM
UNICORE: Uniformes Interface für Computer-Ressourcen Dietmar Erwin, NIC-ZAM
Automatische Leistungsanalyse paralleler Programme mit KOJAK Michael Gerndt, NIC-ZAM
Algorithmenentwicklung für DYNA3D Johannes Grotendorst, NIC-ZAM


Begleittext "Supercomputing"

Wissenschaftliches Rechnen spielt international in den großen Forschungseinrichtungen schon seit vielen Jahren eine wichtige Rolle. Als 1983 das Forschungszentrum Jülich mit der Installation des Rechners CRAY X-MP, des ersten Vektorrechners dieser Leistungsklasse in Europa, in das Supercomputing einstieg, wurden hier neue Akzente gesetzt. Das wissenschaftliche Rechnen wurde seitdem in Richtung Supercomputing, Simulation und Modellierung konsequent fortentwickelt, sowohl durch die Erforschung neuer Algorithmen und Methoden, durch die Erweiterung des Anwendungsspektrums als auch durch den Ausbau der innovativen Rechnerausstattung.

Die derzeit für das NIC in Jülich bereitstehenden Rechnerressourcen basieren auf dem im Jahre 1997 realisierten Supercomputer-Komplex; er umfaßt drei Vektorrechner und zwei massiv-parallele Rechner, die über ein Hochgeschwindigkeitsnetz miteinander verbunden sind.

Für Anwendungen aus dem Gebiet der theoretischen Elementarteilchenphysik stehen dem NIC in Zeuthen Parallelrechner mit SIMD-Architektur zur Verfügung. Diese Rechnerarchitektur hat sich insbesondere bei der Simulation von Problemen der Quantenchromodynamik als besonders leistungsfähig erwiesen.

Um den Anwendern des NIC den größtmöglichen Nutzen aus den bereitgestellten Rechnerressourcen bieten zu können, sind Forschungs- und Entwicklungsarbeiten zur Einbindung der Supercomputer in den Rechnerbetrieb, zum Anschluß an Hochgeschwindigkeitsnetze und zur Programmierunterstützung unerläßlich. Diese Arbeiten müssen mit der notwendigen Weiterentwicklung von Hardware und Software eng verbunden sein.

So werden neben Systemen zur Verfügbarkeitsüberwachung und zur Steuerung auch Werkzeuge zur Beurteilung der Nutzungsqualität (RTM, TREND) eingesetzt. Die Möglichkeit des verteilten Rechnens auf unterschiedlichen Rechnerarchitekturen, die über Breitband-Kommunikationsnetze verbunden sind, wird erprobt (Metacomputing). Die Entwicklung eines einheitlichen, plattformunabhängigen Rechnerzugangs für die Benutzer schafft die technischen Voraussetzungen für ein künftiges zentrenübergreifendes Supercomputing (UNICORE).

Unmittelbare Unterstützung finden die Nutzer des NIC durch projektbegleitende Beratung, durch Kurse und durch den Erfahrungsaustausch bei Anwender-Workshops. Der Einstieg in das Programmieren paralleler Programme wird durch die Entwicklung von Methoden zum automatischen Ablauf von Analyse-Werkzeugen (KOJAK) erleichtert.

Neue parallele Algorithmen finden Eingang in Programmbibliotheken aber auch in die Portierung von Programmpaketen auf massiv-parallele Rechner und erschließen z.B. Anwendungen aus der Strukturmechanik neue Größenordnungen bei der Simulation komplexer Systeme (DYNA3D).

(Wolfgang Gürich, NIC-ZAM)


Cray-Komplex in Jülich

Cray-Komplex in Jülich

Der Cray-Supercomputerkomplex in Jülich setzt sich zusammen aus den massiv-parallelen Systemen CRAY T3E mit 512 Prozessoren (300 GFLOPS) und CRAY-T3E mit 256 Prozessoren (225 GFLOPS) sowie aus den Vektorrechnern CRAY T90 (30 GFLOPS) und CRAY J90 (3,2 GFLOPS) jeweils mit 16 Prozessoren. Ein weiteres System CRAY J90 mit 12 Prozessoren dient als File-Server. Alle Cray-Systeme sind untereinander durch eine schnelle Datenleitung (GigaRing mit 1,6 GByte/s) verbunden.


Prinzipdarstellung der JuNet-Teilnetze und ihrer Verbindungen

Prinzipdarstellung der JuNet-Teilnetze und ihrer Verbindungen

Aufgabe des ZAM ist die Bereitstellung leistungsfähiger Kommunikationssysteme nach dem jeweiligen Stand der Technik. Das lokale Netz des Forschungszentrums, JuNet, besteht aus dem etablierten Ethernet/FDDI-Teil, dem mit dem 1995 begonnenen Aufbau eines ATM-Netzes eine neue Komponente zur Seite gestellt wurde. JuNet verbindet die institutsinternen Netze untereinander, mit zentralen und dezentralen Serverkapazitäten im Forschungszentrum und mit der Außenwelt.

Neben dem ISDN, das überwiegend für den Zugang zum JuNet aus dem Privatbereich genutzt wird, erfolgt die weltweite Netzeinbindung des Forschungszentrums über das Breitband-Wissenschaftsnetz (B-WiN) des DFN-Vereins, derzeit mit einem 34-Mbps-Anschluß. An den Vorbereitungen des G-WiN (Gigabit-WiN) als Nachfolger des B-WiN ist das Forschungszentrum als Projektführer des Gigabit Testbed West, einem von zwei Gigabit-Testbeds in Deutschland, beteiligt.

Mit der Einführung der ATM-Technik in das JuNet werden neben den bisherigen Diensten die Voraussetzungen für hochauflösende Visualisierungen, für die Nutzung moderner breitbandiger Multimedia-Netzdienste sowie für Metacomputing geschaffen, sowohl innerhalb des Forschungszentrums als auch - zunächst projektorientiert im Rahmen des Gigabit-Projekts - zu externen Partnern. Im Vorfeld der Betriebseinführung innovativer Kommunikationstechniken führt das ZAM Pilotimplementierungen neuer Netztechniken und Betatests neuer Gerätegenerationen durch.

(Dieter Conrads, NIC-ZAM)


APE100-Installation am DESY Zeuthen

APE100-Installation am DESY Zeuthen

Für die Bearbeitung besonders rechenintensiver Probleme in der Theorie der Elementarteilchen wurde im DESY Zeuthen das Zentrum für paralleles Rechnen eingerichtet. Seit Mitte 1994 sind in Zeuthen Parallelrechner "Quadrics" der Firma Alenia Spazio installiert. Diese Computer beruhen auf der Entwicklung von italienischen Elementarteilchenphysikern des Istituto Nazionale di Fisica Nucleare (INFN) unter dem Namen APE100 und bieten ein besonders gutes Preis/Leistungsverhältnis für Simulationen auf Gittern. Im Gegensatz zu herkömmlichen Supercomputern arbeiten sie nach dem SIMD-Prinzip (Single Instruction, Multiple Data), bei dem alle Prozessoren völlig synchron arbeiten. Sie stellen insbesondere eine hocheffektive und kostengünstige Lösung für Rechnungen auf dem Gebiet der Gitterfeldtheorie dar, die einen numerischen Zugang zu den grundlegenden Eigenschaften der Elementarteilchen und ihrer Wechselwirkungen erlaubt.

Die gegenwärtige Installation bei DESY besteht aus drei Rechnern mit insgesamt 768 Prozessoren und einer Spitzenleistung von 45 GFLOPS. Die Rechner laufen seit Anfang 1994 nahezu problemlos. Im jährlichen Mittel konnte eine Auslastung von > 90 % erreicht werden. Dabei lag das Verhältnis von erreichter Leistung zur maximal möglichen Leistung je nach Anwendung bei ca. 30 bis 70 Prozent.

(Ulrich Gensch, Peter Wegner, NIC-DESY Zeuthen)


Standard PCI-Bus-Karte

Standard PCI-Bus-Karte Ausgehend von der gegenwärtigen APE100-Architektur wurde im INFN das Nachfolgermodell konzipiert, das einen Zwischenschritt auf dem Weg zum 1 TFLOPS-Rechner darstellt. Um dieses Ziel zu erreichen, leistet DESY auf dem Gebiet der Kommunikationshardware und Softwareentwicklung Beiträge zum Entwicklungsprojekt des APEmille. Es wurde eine auf dem Standard-PCI-Bus basierende Karte entwickelt, die über serielle Kommunikationsschnittstellen, Datenübertragungen bis zu 132 MBytes/s zwischen zwei PCs erlauben. Diese Karten verbinden alle sogenannte Host-PCs, die den massiv parallelen APEmille-Rechner steuern. Darüber hinaus kann diese Karte zur Vernetzung von herkömmlichen PCs oder Workstations im Hochgeschwindigkeitsbereich eingesetzt werden. Die APEmille-Architektur hebt u.a. durch die 64-Bit-Gleitkomma-Arithmetik, eine lokale Adressierbarkeit und schnellere Kommunikationsschnittstellen einige Beschränkungen der APE100-Familie auf, wodurch sich breitere Anwendungsmöglichkeiten ergeben.

Die Zusammenarbeit von INFN und DESY soll in Zukunft noch intensiviert werden, um über das APEmille-Projekt hinaus gemeinsam innovative Parallelrechner für die Elementarteilchenphysik zu konzipieren und zu entwickeln.

(Ulrich Gensch, Peter Wegner, NIC-DESY Zeuthen)


Response Time Monitor

Response Time Monitor Für die Beurteilung der Leistungsfähigkeit interaktiver Systeme ist das Antwortzeitverhalten ein bestimmender Faktor. Zur Messung dieses Verhaltens mit der Möglichkeit zur frühzeitigen Erkennung von Engpaßsituationen wurde ein Response Time Monitor (RTM) entwickelt und zur Überwachung der zentralen interaktiven Rechnersysteme in Jülich eingesetzt. Ein RTM-Agent simuliert dabei eine interaktive Sitzung eines "Standard-Benutzers" durch eine Folge von Kommandos, Programmaufrufen und "Denkpausen". Die gemessenen Antwortzeiten und weitere Parameter (z.B. Systemauslastung, Anzahl aktiver Benutzer) werden an einen WWW-Server übermittelt, der die Meßwerte als HTML-Dokument für das Internet bereitstellt.

(Wolfgang Gürich, NIC-ZAM)


Systemüberwachung mit TREND

Systemüberwachung mit TREND TREND (Torus REsources and Node Display) erlaubt die Überwachung und Beobachtung eines Rechensystems vom Typ CRAY T3E. TREND ist ein verteiltes Client/Server-System. Es besteht aus einem TREND-Datenerfassungsdämon, welcher auf dem zu überwachenden System läuft und einmal pro Minute alle notwendigen Daten erfaßt und sie zu einem konventionellen WWW-Server überträgt. Auf diese Weise sind die Daten weltweit abrufbar. Der Server verteilt die Daten an die TREND-Anzeige-Clienten, die auf den lokalen Arbeitsstationen der Benutzer laufen. Angezeigt werden Informationen zu allen laufenden, blockierten und wartenden Benutzerprogrammen, zu Konfigurationsdaten des Gesamtsystems und einzelner Prozessorelemente sowie zur Auslastung. Außerdem werden allgemeine Systeminformationen bereitgestellt.

Die Entwicklung und der Vertrieb von TREND wird von der Firma SGI/Cray Research unterstützt. TREND wird mittlerweile weltweit in Rechenzentren eingesetzt.

(Bernd Mohr, NIC-ZAM)


Metacomputing im Gigabit Testbed West

Metacomputing im Gigabit Testbed West Zur Bearbeitung anspruchsvoller numerischer Probleme reicht die Rechenleistung selbst modernster heutiger Supercomputer nicht immer aus. Die zunehmende Stabilität und Bandbreite moderner Weitverkehrsnetze (WANs) erlaubt es, Hochleistungsrechner an verschiedenen Standorten zu einem virtuellen Gesamtsystem zu verbinden und so einen sogenannten Metacomputer aufzubauen.

Im Rahmen eines vom BMBF geförderten Projekts, dem Gigabit Testbed West, werden parallele Anwendungen für den Einsatz im Metacomputing untersucht. Hieran sind unter der Leitung des Forschungszentrums Jülich fünf deutsche Forschungseinrichtungen, drei Hochschulen und zwei Unternehmen beteiligt. Dem Projekt steht eine leistungsstarke ATM-Verbindung (zur Zeit 2,4 Gbit/s) zwischen dem NIC in Jülich und der GMD in St. Augustin zur Verfügung.

Sogenannte "coupled fields"-Algorithmen, bei denen zwei oder mehr nur lose gekoppelte orts- und zeitabhängige Größen auf die Rechner verteilt werden, sind besonders für das Metacomputing geeignet, da der Kommunikationsbedarf zwischen den Teilen moderat ist. Eine solche Anwendung, die im Gigabit Testbed West erprobt wird, ist die Simulation von Schadstoffausbreitung im Boden (in Zusammenarbeit mit ICG-4), bei der Grundwasser und gelöste Schadstoffe miteinander wechselwirken. Ein Beispiel für "heterogenes Metacomputing", d.h. die Kopplung von Rechnern unterschiedlicher Architektur, ist die Echtzeit-Auswertung von Kernresonanz-(MR)-Untersuchungen des menschlichen Gehirns (in Kooperation mit dem IME). Hier wird ein MR-Tomograph mit der T3E und einem leistungsstarken Visualisierungs-Server in der GMD gekoppelt, um Hirnfunktionen kartieren und dreidimensional darstellen zu können.

(Thomas Eickermann, NIC-ZAM)


UNICORE: Uniformes Interface für Computer-Ressourcen

UNICORE-Projekt UNICORE ist ein vom BMBF gefördertes Verbundprojekt mit dem Ziel, eine Software-Infrastruktur zu entwickeln, die Anwendern einen intuitiven, konsistenten und sicheren Zugang zu verteilten Computer-Ressourcen ermöglicht. UNICORE realisiert insbesondere die folgenden Funktionen: architektur- und betriebssystemunabhängige Erstellung von Batch-Jobs über ein graphisches Benutzerinterface; Verteilung von Teilaufgaben auf geeignete Rechner und Synchronisation der Ausführung durch UNICORE; sicheren Dateitransfer zwischen UNICORE-Systemen über das Internet; plattformunabhängige Kontrolle und Steuerung der Jobs. UNICORE setzt moderne Web-Techniken ein wie https, signierte Java Applets und Zertifikate für sichere Kommunikation und Authentifizierung. Es ist für den Einsatz in Produktionsumgebungen konzipiert.

An UNICORE arbeiten, koordiniert durch das ZAM, Universitäten, deutsche und europäische Forschungseinrichtungen sowie zwei Software-Firmen und Hersteller von Hochleistungsrechnern zusammen.

(Dietmar Erwin, NIC-ZAM)


Automatische Leistungsanalyse paralleler Programme mit KOJAK

KOJAK

Der Einsatz paralleler Hochleistungsrechner zur Untersuchung wissenschaftlicher Problemstellungen dient dem Ziel, komplexe Simulationsrechnungen in akzeptabler Zeit ausführen zu können. Die effiziente Nutzung der vorhandenen Betriebsmittel ist Voraussetzung für die schnelle Abarbeitung einzelner Programme und für die Optimierung des Gesamtdurchsatzes.

Der typische Prozeß der Leistungsanalyse besteht in der wiederholten Ausführung der Programminstrumentierung, der Programmausführung mit Leistungsmessung und der Analyse der Leistungsdaten durch den Anwender bis die ineffizienten Programmteile erkannt sind (siehe Abbildung). Alle drei Schritte erfordern große Erfahrung im Umgang mit den Analysewerkzeugen und ein fundiertes Wissen über mögliche Leistungsengpässe. Ziel der Entwicklung von KOJAK ist es, die Anwender durch weitgehende Automatisierung des Ablaufs bei der Erkennung typischer Engpässe zu unterstützen. Hierzu wird eine Datenbasis mit Nachweisregeln potentieller Leistungsengpässe aufgebaut und eine automatische Steuerung der Analyseschritte realisiert.

Das Projekt ist eingebettet in die Esprit Arbeitsgruppe APART (Automatic Performance Analysis: Resources and Tools), an der drei europäische Unternehmen, sechs europäische und drei amerikanische Universitäten unter der Führung des Forschungszentrums Jülich beteiligt sind.

(Michael Gerndt, NIC-ZAM)


Algorithmenentwicklung für DYNA3D

Oktogonale Stahlträger vor und nach Crash Im Bereich der Strukturmechanik werden vom ZAM für Projekte in Forschung und Anwendung geeignete Programmpakete auf den Supercomputern validiert und bereitgestellt. Darüber hinaus werden Arbeiten zur Entwicklung paralleler Algorithmen durchgeführt. In einem Verbundprojekt mit der Firma CONDAT wurde eine maschinenunabhängige Parallelversion des Finite-Element-Programms CONDAT-DYNA3D entwickelt.

Das verwendete Parallelisierungskonzept basiert auf einer Gebietszerlegung des Modells und dem Austausch von Knotenkräften mittels Message Passing. CONDAT-DYNA3D wurde auf drei unterschiedlichen parallelen Plattformen implementiert: einem Workstation-Cluster, einer massiv-parallelen Architektur und einem Parallelrechner mit gemeinsamem Speicher (Shared Memory). Im Bereich nichtlineare Strukturmechanik ermöglicht CONDAT-DYNA3D Anwendungen, die von quasistatischen Materialprüfungstests bis zur Simulation von Hochgeschwindigkeitsvorgängen reichen.

Die Abbildung zeigt das kontrollierte plastische Beulen eines Stahlträgers mit oktogonalem Querschnitt. Im Rechenmodell breiten sich die Kontakte gleichmäßig über den ganzen Querschnitt von der Stirnseite des Trägers her aus. Oktogonalträger werden u.a. bei Fahrzeugen eingesetzt, um bei einem Auffahrunfall die kinetische Energie des Autos gezielt abzubauen.

(Johannes Grotendorst, NIC-ZAM)


Einleitung Supercomputing Astrophysik Elementarteilchenphysik Vielteilchenphysik Polymere Chemie Umwelt Sonstiges
Vorwort Super-
computing
Astro-
physik
Elementar-
teilchen
Viel-
teilchen
Polymere Chemie Umwelt Sonstige
Gebiete

<


NIC-Home/ENGLISH  

S.Hoefler-Thierfeldt@fz-juelich.de, 29-Mar-2004
URL: <http://www.fz-juelich.de/nic/Publikationen/Broschuere/supercomputing-d.html>