|
Die Broschüre des
John von Neumann-Instituts für Computing gibt es auf Deutsch und
auf Englisch. Sie kann bestellt werden
beim NIC-Sekretariat (nic@fz-juelich.de).
deutsche Broschüre (pdf) | English brochure (pdf)
Scientific Computing
Wissenschaftliches Rechnen auf Höchstleistungsrechnern spielt international in den großen
Forschungseinrichtungen schon seit vielen Jahren eine wichtige Rolle. Als 1983 das
Forschungszentrum Jülich mit der Installation des Rechners CRAY X-MP, des ersten
Vektorrechners dieser Leistungsklasse in Europa, in das Supercomputing einstieg, wurden
hier neue Akzente gesetzt. Das wissenschaftliche Rechnen wurde seitdem in Richtung
Höchstleistungsrechnen, Simulation und Modellierung konsequent fortentwickelt, sowohl
durch die Erforschung neuer Algorithmen und Methoden, durch die Erweiterung des
Anwendungsspektrums, als auch durch den Ausbau der innovativen Rechnerausstattung.
Das Flaggschiff der Rechnerressourcen, die derzeit für das NIC in Jülich
bereit stehen, ist der
im Januar 2004 installierte IBM-Supercomputer "Jump". Außerdem sind ein Vektorrechner
und verschiedene Cluster-Systeme installiert. Als Speichermedien stehen für
Supercomputeranwendungen Magnetplatten und Magnetkassettenroboter mit einer
Speicherkapazität von 2,2 PetaByte zur Verfügung.
Für Anwendungen aus dem Gebiet der theoretischen Elementarteilchenphysik sind in Zeuthen
für das NIC Parallelrechner mit SIMD-Architektur installiert. Diese Rechnerarchitektur hat
sich insbesondere bei der Simulation von Problemen der Quantenchromodynamik als
besonders leistungsfähig erwiesen.
Um den Anwendern des NIC den größtmöglichen Nutzen aus den bereitgestellten
Rechnerressourcen bieten zu können, sind Forschungs- und Entwicklungsarbeiten zur
Einbindung der Höchstleistungsrechner in den Rechnerbetrieb, zum Beispiel durch
Entwicklung neuer Überwachungssysteme, und zum Anschluss an
Hochgeschwindigkeitsnetze unerlässlich. Die Weiterentwicklung der Netztechnologien, z.B.
innerhalb nationaler Kooperationen wie VIOLA, ist daher von besonderer Bedeutung.
Unmittelbare Unterstützung finden die Nutzer des NIC durch projektbegleitende Beratung,
durch Kurse und durch den Erfahrungsaustausch bei Anwender-Workshops. Das NIC-ZAM
verfolgt bei der Nutzerunterstützung ein dreistufiges Konzept: Der Helpdesk löst die kleinen
alltäglichen Probleme, für Methoden und Programmoptimierung stehen Fachberater zur
Verfügung; außerdem ist jedem Projekt ein Betreuer zugeordnet, mit dem es eine langfristige
wissenschaftliche Partnerschaft eingehen kann.
Die Vielfältigkeit der NIC-Projekte erfordert sowohl ein eingehendes Verständnis von
unterschiedlichen Simulationsmethoden und Technologien, als auch die Bereitstellung von
Werkzeugen zur effektiven Systemnutzung und zum einfachen, doch sicheren Zugang zu den
Ressourcen. Daher nehmen im NIC-ZAM auch die Forschungs- und Entwicklungsaktivitäten
in den Bereichen "Computational Science", Informatik und angewandter Mathematik einen
breiten Raum ein. Die Aktivitäten umfassen die Entwicklung von Grid-Umgebungen sowie
von Werkzeugen zur Optimierung paralleler Programme (KOJAK) und zur Visualisierung
und Steuerung von Simulationen.
Das NIC-ZAM ist bestrebt, sich mit seiner Rechnerausstattung an der Weltspitze zu
behaupten. Die Beobachtung der Entwicklung neuer Rechnerarchitekturen und die
Untersuchung zukünftiger Systeme - seien es Cluster mit schnellen Netzwerken oder
Leadership-Class-Systeme für höchste Performance - ist daher ein erklärtes Ziel.
(Rüdiger Esser, NIC-ZAM, Jülich)

Der Supercomputer, ein IBM p690-Cluster mit dem Kosenamen Jump (Jülich Multi
Processor), besteht aus 41 Rechnerknoten mit jeweils 32 Prozessoren des Typs Power4+ mit
1,7 GHz Taktrate und jeweils 128 GByte gemeinsamen Hauptspeicher. Alle Knoten sind über
ein schnelles Verbindungsnetzwerk "High Performance Switch" miteinander verbunden. Das
Gesamtsystem kommt auf eine Spitzenleistung von 8,9 TeraFlops. Benutzer können
Anwendungen mit mehreren hundert Prozessoren und bis zu 5 TeraByte Hauptspeicher
ausführen.

Drei Silos dieses Magnetkassettenroboters stellen eine Speicherkapazität von 2,2 PetaByte für
den Supercomputer in Jülich bereit.

Für die Beurteilung der Leistungsfähigkeit interaktiver Systeme ist das Antwortzeitverhalten
ein bestimmender Faktor. Zur Messung dieses Verhaltens mit der Möglichkeit zur
frühzeitigen Erkennung von Engpasssituationen wurde ein Response Time Monitor (RTM)
entwickelt und zur Überwachung der zentralen interaktiven Rechnersysteme in Jülich
eingesetzt. Ein RTM-Agent simuliert dabei eine interaktive Sitzung eines
"Standard-Benutzers" durch eine Folge von Kommandos, Programmaufrufen und
"Denkpausen". Die
gemessenen Antwortzeiten und weitere Parameter (z.B. Systemauslastung, Anzahl aktiver
Benutzer) werden an einen WWW-Server übermittelt, der die Messwerte als HTML-
Dokument für das Internet bereitstellt.
(Wolfgang Gürich, NIC-ZAM, Jülich)

DESY hat in Zeuthen einen massiv-parallelen APEmille-Supercomputer für Anwendungen in
der theoretischen Elementarteilchenphysik installiert. Dieser Rechner besteht aus 1.104
Prozessoren, die über 8 "Crates" verteilt und mit einem schnellen dreidimensionalen
Verbindungsnetzwerk verbunden sind. Der Rechner erreicht eine Peak-Performance von 583
GFlops. Anwendungen in der Gittereichtheorie erzielen eine sehr hohe Effizienz von 50 %
oder mehr der Peak-Performance. Dies, zusammen mit der Stabilität des Rechners, hat den
APEmille-Rechner zum Arbeitspferd für Gittereichtheoriephysiker in Deutschland gemacht.
Die Rechenzeit auf dem APEmille-System wird durch die Rechenzeitkommission des NIC
vergeben.
Der APEmille-Rechner wurde in einer Zusammenarbeit zwischen dem Istituto Nazionale di
Fisica Nucleare (INFN) in Italien und DESY gebaut. Der Erfolg dieses Rechners und die
zukünftigen Erfordernisse an Rechenzeit, die durch ein europäisches ECFA-Komitee evaluiert
wurden, überzeugten INFN und DESY, den ehrgeizigen Plan zu verfolgen, einen Nachfolge-Rechner,
apeNEXT, zu entwickeln. Er soll eine Rechenleistung von ungefähr 10 TeraFlops
erreichen. Dies würde auch die Rechenerfordernisse, die von dem deutschen
Gittereichtheorieforum (LatFor) formuliert worden sind, erfüllen. Die Universität von
Paris-Süd hat sich der apeNEXT-Kooperation angeschlossen und andere Institutionen wie etwa die
Universität Bielefeld haben zu dem Projekt beigetragen. Die Entwicklung des Prozessors, der
gesamten anderen Hardware und auch der meisten Software-Komponenten des
apeNEXT-Systems ist inzwischen erfolgreich abgeschlossen. Anfang 2005 soll ein
Prototyp-Rechner des
apeNEXT-Typs mit einer Peak-Performance von 1,6 TeraFlops installiert werden und erste
Anwendungsprogramme ausführen. Auf der Grundlage dieses Prototyps können dann größere
Installationen, die im Multi-Teraflops-Bereich liegen, installiert werden.
(Karl Jansen, Dirk Pleiter, Hubert Simma, NIC, DESY-Zeuthen)

Eine Aufgabe des ZAM ist die Bereitstellung leistungsfähiger Kommunikationssysteme nach
dem jeweiligen Stand der Technik. Heute ist der überwiegende Teil von JuNet, dem Campus-
Netzwerk des Forschungszentrums, ein zentral verwaltetes geswitchtes Ethernet mit 100 und
1000 Mbit/s, das sich auf eine Glasfaser-Infrastruktur stützt. Es wird durch ein rasch
wachsendes Funknetz ergänzt.
Neben dem ISDN, das überwiegend für den Zugang zum JuNet aus dem Privatbereich genutzt
wird, erfolgt die weltweite Netzeinbindung des Forschungszentrums über das Gigabit
Wissenschaftsnetz (G-WiN) des DFN-Vereins, derzeit mit einem 622 Mbit/s-Anschluss. Als
Partner im Projekt VIOLA beteiligt sich das Forschungszentrum an den Vorbereitungen für
die nächste Generation des Wissenschaftsnetzes - das X-WiN.
Zusätzlich betreiben das ZAM und zwei Hochschulen in Jülich und Aachen mithilfe
angemieteter Glasfasern (sog. "dark fibres") ein eigenes Netz zwischen ihren Einrichtungen.
Es ermöglicht Kooperationen mit sehr anspruchsvollen Kommunikationsanforderungen
zwischen diesen Institutionen. Zurzeit werden die Glasfasern für den Zugang des
Forschungszentrums zum G-WiN-Standort in Aachen und für die Forschungsprojekte DEISA
und VIOLA eingesetzt.
Im Vorfeld der Betriebseinführung innovativer Kommunikationstechniken führt das ZAM
Pilotimplementierungen neuer Netztechniken und Betatests neuer Gerätegenerationen durch.
(Thomas Eickermann, NIC-ZAM, Jülich)

Zusätzlich zu dem stetig wachsenden Bedarf an Bandbreite im Internet verlangt das neue
Paradigma des Grid-Computing nach einer neuen Qualität von Diensten im Netz.
Grid-Computing ist eine Technologie, die stoßkantenfreien Zugang zu und Benutzung von
verteilten Ressourcen wie Höchstleistungsrechnern, riesigen Datenarchiven oder
experimentellen Instrumenten ermöglicht und dadurch Wissenschaftlern und Ingenieuren
gänzlich neue Wege der Arbeit und Zusammenarbeit eröffnen soll. Grid-Anwendungen
benötigen häufig die flexible Bereitstellung von hoher Netzwerkbandbreite auf Anforderung,
oft in Kombination mit Qualitätsgarantien. Heutige Netzwerke sind nicht in der Lage,
derartige Anforderungen effizient zu erfüllen.
Das vom BMBF geförderte Projekt VIOLA (Vertically Integrated Optical testbed for Large
Applications) befasst sich mit diesen Herausforderungen und dient als Pilotprojekt
für X-WiN, die nächste Generation des Wissenschaftsnetzes in Deutschland. Ein vom DFN-Verein
koordiniertes Konsortium von sechs Hochschulen und Forschungseinrichtungen sowie drei
industriellen Partnern baut dazu ein nationales optisches Testbed
im Raum Aachen-Jülich-Köln-Bonn auf (zunächst mit 10 Gbit/s
Ethernet- und SDH-Verbindungen). Eine Erweiterung
nach Bayern und eine Anbindung an das europäische Forschungsnetz GÉANT sind in
Vorbereitung. Im Projekt werden neueste Netzwerk-Komponenten getestet und eingesetzt
sowie Software zur dynamischen Bandbreitensteuerung entwickelt.
Innerhalb des Projektes VIOLA entwickelt das ZAM schwerpunktmäßig Grid-Anwendungen
so weiter, dass sie die Bandbreiten und Qualitätsmerkmale der neuen Netztechnik optimal
nutzen können. Die verteilte Simulation von Schadstoffausbreitung im Boden (in
Zusammenarbeit mit ICG-IV im Forschungszentrum Jülich) oder die verteilte kollaborative
Visualisierung großer atmosphärischer Datensätze sind derartige Anwendungen. UNICORE
wird dabei als Grid-Middleware eingesetzt und um Komponenten zur gleichzeitigen
Reservierung und Nutzung von Ressourcen einschließlich der benötigten Netzwerk-
Bandbreiten erweitert.
(Thomas Eickermann, NIC-ZAM, Jülich)

Grid-Computing ist eine Schlüsseltechnologie, die es Wissenschaftlern in Forschung und
Industrie ermöglicht, anspruchsvollste, komplexe Probleme zu lösen und in neuartiger Weise
zusammenzuarbeiten. Grids integrieren über schnelle Netze verteilte Computing-Ressourcen,
Daten aus Experimenten - z.B. Tomographen, Beschleunigern, Teleskopen oder Satelliten - ,
Daten aus Simulationsrechnungen, und sie ermöglichen die Visualisierung und Speicherung
der Ergebnisse an beliebigen Orten. Die so gestaltete Wissensumgebung erlaubt es, virtuelle
Organisationen dynamisch zu schaffen und damit Forschungs- und Entwicklungsarbeiten auf
neuartige Weise mit hoher Effizienz durchzuführen. Zusammengefasst: Grids ermöglichen
e-Science (enhanced Science).
Das ZAM kann auf dem Gebiet des Grid-Computing auf eine lange Reihe von Erfolgen
zurückblicken. Es leitete die Entwicklung von UNICORE (Uniform Interface to Computing
Resources) einer vertikal integrierten Grid-Software mit folgenden herausragenden
Eigenschaften: Benutzer können über eine intuitive, graphische Oberfläche komplexe
Arbeitsabläufe formulieren und diese stoßkantenfrei und sicher auf allen Systemen im einem
Grid ausführen. UNICORE übersetzt die Anforderungen des Benutzers in die jeweiligen
spezifischen Befehle für die Zielsysteme und steuert den Ablauf der Einzelaufgaben.
UNICORE-Nutzer müssen sich nicht mehr in die Interna von Betriebssystemen oder in die
Konventionen der Rechenzentren einarbeiten. X.509-Zertifikate - der etablierte
Grid-Standard - gewährleisten Sicherheit einschließlich Verschlüsselung und single-sign-on.
UNICORE passt sich den Policies der beteiligten Zentren an und erfordert keine Änderung
der bewährten Praxis.
|
Die UNICORE-Software ist als Open Source unter BSD-Lizenz verfügbar. Das ZAM
unterstützt Nutzer aus Forschung und Lehre beim Einsatz und koordiniert die
Weiterentwicklung. UNICORE ist die Basis für mehrere erfolgreiche EU-Projekte, die die
Software funktionell erweiterten und zu deren internationaler Anerkennung beitrugen. Das
Projekt GRIP (Grid Interoperability Project) zeigte, dass UNICORE und Globus sich auf
natürliche Weise ergänzen. UNICORE-Jobs können ohne Änderung sowohl auf UNICORE-
als auch Globus-Ressourcen ausgeführt werden, ohne dass die Anwendung geändert werden
muss.
Eine der herausragenden Eigenschaften von UNICORE ist seine erweiterbare
Anwendungsunterstützung. Dies wird im EU-Projekt OpenMolGRID genutzt, das zum Ziel
hat, die Entwicklung neuer Wirkstoffe mittels Grid-Technik zu beschleunigen. Ausgehend
von den Eigenschaften chemischer Verbindungen, die in unterschiedlichen Datenbanken
verfügbar sind, werden neue Moleküle im Computer zusammengesetzt und ihre
pharmakologischen Eigenschaften berechnet. Nur eine kleine Auswahl muss dann im Labor
synthetisiert werden. Um den Prozess zu automatisieren, erzeugt UNICORE anhand globaler
Vorgaben des Chemikers einen detaillierten, im Allgemeinen sehr komplexen Arbeitsablauf
(Abb. oben). Dieser Prozess kann Tausende von Einzelberechnungen mit unterschiedlichen
Algorithmen auslösen, die auf verteilten Systemen ablaufen (Abb. Mitte). Der
Wissenschaftler selektiert dann die Erfolg versprechenden Kandidaten (Abb. unten).
Grid-Computing wird langfristig nur dann erfolgreich bleiben, wenn geeignete Standards
geschaffen werden. Die Open Grid Service Architecture (OGSA) des Global Grid Forums
(GGF) definiert den Rahmen, innerhalb dessen Organisationen wie OASIS und W3C
spezifische Standards definieren. ZAM arbeitet aktiv im GGF und in OASIS mit. Das
EU-Projekt UniGrids (Uniform Interface to Grid Services) sichert die Weiterentwicklung von
UNICORE zu einem OGSA-konformen Grid-System.
|


|
(Dietmar Erwin, NIC-ZAM, Jülich)

Ein Ziel des "Wissenschaftlichen Rechnens" ist die Simulation von Problemen, die anders nur
schwer oder gar nicht zugänglich wären. Obwohl sich in verschiedenen Forschungsgebieten,
wie z.B. der Quantenchemie, der Festkörperphysik oder der Molekular-Dynamik, mit der Zeit
spezifische Methoden entwickelt haben, stehen sie ähnlichen (computer-)technischen
Herausforderungen gegenüber. Daher profitieren sie erheblich von einer interdisziplinären
Zusammenarbeit zwischen den Natur- und Ingenieurwissenschaften, der Informatik und der
angewandten Mathematik. Das NIC-ZAM beteiligt sich in enger Zusammenarbeit mit
führenden Forschergruppen an der Methodenentwicklung insbesondere für HPC-Systeme.
Der Schwerpunkt dieser Entwicklungsarbeiten liegt aufgrund ihrer Bedeutung für die
NIC-Nutzerschaft in der Physik und Chemie.
Einige Forschungsgebiete, die im NIC-ZAM bearbeitet werden, sind in der Abbildung
dargestellt. Die Themen reichen von Vielteilchen-Problemen (große Systeme, aber ziemlich
geringe Genauigkeit) bis hin zur Elementarteilchenphysik (kleine Systeme, aber hohe
Genauigkeit): Die Vielteilchen-Dynamik beschäftigt sich mit der zeitlichen Entwicklung von
Systemen, die bis 100 Millionen Teilchen enthalten. Aufgrund der physikalischen
Eigenschaften ist es notwendig, die Prozesse auf einer Zeitskala von
10-15 Sekunden zu
beschreiben, während die Simulationszeit bis zu 10-3 Sekunden sein kann;
dies führt dann zu
ca. 1012 Zeitschritten pro Rechnung! Folglich muss die Genauigkeit der Modelle
eingeschränkt werden, um annehmbare Rechenzeiten zu erreichen.
Katalytische Reaktionen sind anspruchsvolle Probleme der industriellen Chemie, aber von
beträchtlicher praktischer Bedeutung. Ein realistisches Modell muss auf der
Quantenmechanik, d.h. der approximativen Lösung der Schrödinger-Gleichung, basieren.
Glücklicherweise gibt es Methoden für diese Art Probleme, wie die Dichtefunktionaltheorie,
die gute Ergebnisse bei verhältnismäßig niedrigen Rechenkosten liefern. Jedoch wenn
zusätzliche Effekte, z.B. angeregte Zustände der Moleküle, für die Reaktionen wichtig
werden, müssen genauere quantenmechanische Methoden verwendet werden, dies aber auf
Kosten zunehmender Rechenzeiten.
Geht man nun zu den kleinsten physikalischen Teilchen, nämlich den Atomkernen, ihren
Bestandteilen oder anderen Elementarteilchen, so endet man schließlich bei der
Gitter-Quantenfeldtheorie, für die sogar heutige TeraFlops-Supercomputer nicht leistungsfähig
genug sind, um abschließende Antworten zur subatomaren Struktur der Materie zu geben.
Unabhängig davon, ob der kritische Parameter die erreichbare Systemgröße oder die
Genauigkeit des Modells ist, haben alle diese unterschiedlichen Forschungsfelder gemeinsam,
dass sie auf neueste Computerarchitekturen, Werkzeuge für die Optimierung und/oder
Parallelisierung der Programme sowie effiziente und leistungsfähige (mathematische)
Algorithmen angewiesen sind. Daher ist eine der Hauptaufgaben des NIC-ZAM die
Förderung des "Wissenschaftlichen Rechnens" durch Methodenentwicklung in
wissenschaftlichen Schlüsselgebieten, indem es den effizienten Einsatz fortschrittlicher
Computersysteme unterstützt und Training und Ausbildung für Wissenschaftler und
Studenten anbietet.
(Bernd Körfgen, NIC-ZAM, Jülich)

Der Einsatz paralleler Hochleistungsrechner zur Untersuchung wissenschaftlicher
Problemstellungen dient dem Ziel, komplexe Simulationsrechnungen in akzeptabler Zeit
ausführen zu können. Die effiziente Nutzung der vorhandenen Betriebsmittel ist
Voraussetzung für die schnelle Abarbeitung einzelner Programme und für die Optimierung
des Gesamtdurchsatzes. Der typische Prozess der Leistungsanalyse besteht in der
wiederholten Ausführung der Programminstrumentierung, der Programmausführung mit
Leistungsmessung und der Analyse der Leistungsdaten durch den Anwender, bis die
ineffizienten Programmteile erkannt sind. Alle drei Schritte erfordern große Erfahrung im
Umgang mit den Analysewerkzeugen und ein fundiertes Wissen über mögliche
Leistungsengpässe. Ziel der Entwicklung von KOJAK ist die weitgehende Automatisierung
dieses Ablaufs (siehe Diagramm). Mit Hilfe einer Datenbasis mit Nachweisregeln lokalisiert,
klassifiziert und bewertet eine Analysekomponente potentielle Leistungsengpässe automatisch
und meldet diese dem Benutzer sortiert nach deren negativen Einfluss auf die Leistung des
Programms. Darüber hinaus, falls nötig, erlauben diese Informationen eine gezieltere und
damit effizientere manuelle Analyse mit herkömmlichen Werkzeugen.
(Bernd Mohr, NIC-ZAM, Jülich)

Bei der Arbeit mit wissenschaftlichen Simulationsprogrammen kann der übliche Zyklus von
Vorbereitung, Programmlauf, Ergebnisüberprüfung im Post-Processing und Neuanpassung
von Simulationsparametern durch die Anwendung des Computational Steering erheblich
vereinfacht werden. Dabei werden das parallele Simulationsprogramm und die im
Post-Processing verwendete Visualisierung direkt miteinander verknüpft, so dass
Zwischenergebnisse der Berechnung kontrolliert und Programmparameter direkt angepasst
werden können. Dadurch können sowohl die Rechenressourcen besser benutzt als auch
Wartezeiten verringert werden.
Für die einfache Anwendung des Computational Steerings ist im Zentralinstitut für
Angewandte Mathematik die Bibliothek VISIT (Visualization Interface Toolkit) entwickelt
worden, welche die Entwicklung solcher interaktiven und verteilten Simulationen unterstützt.
Dabei stellt VISIT Funktionen zur Verfügung, die eine bidirektionale Verbindung zwischen
der Simulation und der Visualisierung etablieren und den transparenten Datenaustausch
darüber ermöglichen. VISIT unterstützt dabei auch parallele Programme und mit Hilfe eines
Directory-Servers (SEAP) den transparenten Verbindungsaufbau. Derzeit werden als
Visualisierungssysteme AVS/Express, IDL, VTK, and Perl/Tk unterstützt. Weiterhin wird im
EU-Projekt UniGrids ein Grid-Services-Interface entwickelt, das eine Integration von
interaktiven Simulationen in das UNICORE-Grid ermöglicht.
(Wolfgang Frings, NIC-ZAM, Jülich)


|