Blaues Gen

Blaues Gen ist ein Projekt von IBM hat darauf gezielt, Supercomputer zu entwerfen, die Betriebsgeschwindigkeiten beim PFLOPS (petaFLOPS) Reihe mit dem niedrigen Macht-Verbrauch erreichen können. Das Projekt hat drei Generationen von Supercomputern, Blauem Gene/L, Blauem Gene/P und Blauem Gene/Q geschaffen. Blaue Gensysteme haben seit mehreren Jahren den Top500 und die Green500 Rangordnungen des stärksten und des grössten Teiles der Macht effiziente Supercomputer beziehungsweise geführt, und sind in vielen Superrechenzentren aufmarschiert worden. Das Projekt wurde 2008 Nationalen Orden der Technologie und Neuerung verliehen.

Geschichte

Im Dezember 1999 hat IBM eine Forschungsinitiative von $ 100 Millionen für eine fünfjährige Anstrengung bekannt gegeben, einen massiv parallelen Computer zu bauen, auf die Studie von biomolecular Phänomenen wie Protein-Falte angewandt zu werden. Das Projekt hatte zwei Hauptabsichten: Um unser Verstehen der Mechanismen hinter dem Protein vorzubringen, das sich über die groß angelegte Simulation faltet, und neuartige Ideen in massiv zu erforschen, passen Maschinenarchitektur und Software an. Hauptgebiete der Untersuchung haben eingeschlossen: Wie man diese neuartige Plattform verwendet, seine wissenschaftlichen Absichten effektiv zu entsprechen, wie man solche massiv parallelen Maschinen verwendbarer macht, und wie man Leistungsziele an angemessenen Kosten durch neuartige Maschinenarchitekturen erreicht. Das anfängliche Design für das Blaue Gen hat auf einer frühen Version der Cyclops64 Architektur basiert, die von Monty Denneau entworfen ist. Die anfängliche Forschungs- und Entwicklungsarbeit wurde an IBM T.J verfolgt. Forschungszentrum von Watson.

1999 war von der Universität von Columbia bewegter Alan Gara, er hatte Arbeit an der QCDOC Architektur geführt

zu IBM T.J. Forschungszentrum von Watson.

Das QCDOC System war ein spezieller Zweck Computer für die QCD Berechnung; es hat einen Span mit einem eingebetteten Kern von PowerPC darauf verwendet. An IBM hat Alan Gara angefangen, an einer Erweiterung der QCDOC Architektur in einen mehr Mehrzwecksupercomputer zu arbeiten: 4D wurde Nah-Nachbarverbindungsnetz durch eine Netzunterstützen-Routenplanung von Nachrichten von jedem Knoten bis irgendwelchen anderer ersetzt; und ein paralleles Eingabe/Ausgabe-Subsystem wurde hinzugefügt. HIRSCHKUH hat angefangen, die Entwicklung dieses Systems finanziell zu unterstützen, und es ist bekannt als Blauer Gene/L (L für das Licht) geworden; die Entwicklung des ursprünglichen Blauen Gensystems hat unter dem Namen Blauen Gene/C (C für den Zyklopen) und, später, Cyclops64 fortgesetzt.

Im November 2001 hat sich Lawrence Livermore National Laboratory (LLNL) IBM als ein Forschungspartner für das Blaue Gen angeschlossen. Entwicklung ist an IBM T.J weitergegangen. Forschungszentrum von Watson und an IBM Rochester mit der Absicht, ein System an LLNL zu liefern

Blauer Gene/L

Im November 2004 schätzt ein 16-Gestelle-System, mit jedem Gestell, das 1,024 hält, Knoten, hat den ersten Platz in der TOP500-Liste mit einer Leistung von Linpack von 70.72 TFLOPS erreicht. Es hat dadurch den Erdsimulator von NEC eingeholt, der den Titel des schnellsten Computers in der Welt seit 2002 gehalten hatte. Von 2004 bis 2007 die Blaue Gene/L Installation an zu 104 Gestellen allmählich ausgebreitetem LLNL, 478 TFLOPS Linpack und 596 TFLOPS-Spitze erreichend. Der LLNL BlueGene/L Installation hat die erste Position in der TOP500-Liste seit 3.5 Jahren gehalten, bis im Juni 2008 es durch das Zellbasierte Erdkuckuck-System von IBM an Los Alamos National Laboratory eingeholt wurde, der das erste System war, um das 1 Zeichen von PetaFLOPS zu übertreffen.

Während die LLNL Installation die größte Blaue Gene/L Installation, viele kleinere gefolgte Installationen war. Im November 2006 gab es 27 Computer auf der TOP500-Liste mit der Blauen Gene/L Architektur. Alle diese Computer wurden verzeichnet als, eine Architektur der eServer Blauen Genlösung zu haben. Zum Beispiel wurden drei Gestelle von Blauem Gene/L am San Diego Supercomputerzentrum aufgenommen.

Während die TOP500-Maßnahme-Leistung auf einer einzelnen Abrisspunkt-Anwendung, Linpack, Blaue Gene/L auch Rekorde für die Leistung auf einem breiteren Satz von Anwendungen brechen. Blauer Gene/L war der erste Supercomputer jemals, um 100 TFLOPS durchzugehen, die auf einer echten Weltanwendung, nämlich einem dreidimensionalen molekularen Dynamik-Code (ddcMD) gestützt sind, Festwerden (nucleation und Wachstumsprozesse) geschmolzenen Metalls unter dem Hochdruck und den Temperaturbedingungen vortäuschend. Dieses Zu-Stande-Bringen hat den 2005-Preis von Gordon Bell gewonnen.

Im Juni 2006 haben NNSA und IBM bekannt gegeben, dass Blauer Gene/L 207.3 TFLOPS auf einem Quant chemische Anwendung (Qbox) erreicht hat. In Superrechen-2006 wurde Blauer Gene/L dem Gewinnen-Preis in allen HPC-Herausforderungsklassen von Preisen zuerkannt. 2007 hat eine Mannschaft von IBM Almaden Research Center und der Universität Nevadas ein künstliches fast halb so kompliziertes Nervennetz geführt wie das Gehirn einer Maus für die Entsprechung einer Sekunde (das Netz wurde an 1/10 der normalen Geschwindigkeit seit 10 Sekunden geführt).

Haupteigenschaften

Der Blaue Gene/L Supercomputer war in den folgenden Aspekten einzigartig:

  • Der Handel der Geschwindigkeit von Verarbeitern für den niedrigeren Macht-Verbrauch. Blauer Gene/L hat niedrige Frequenz verwendet, und niedrige Macht hat Kerne von PowerPC mit Schwimmpunkt-Gaspedalen eingebettet. Während die Leistung jedes Spans relativ niedrig war, konnte das System besseren Computer zum Energieverhältnis für Anwendungen erreichen, die größere Zahlen von Knoten verwenden konnten.
  • Doppelverarbeiter pro Knoten mit zwei Arbeitsweisen: Coprozessor-Weise, wo ein Verarbeiter Berechnung und die andere Griff-Kommunikation behandelt; und Weise des virtuellen Knotens, wo beide Verarbeiter verfügbar sind, um Benutzercode zu führen, aber die Verarbeiter teilen sowohl die Berechnung als auch die Nachrichtenlast.
  • System auf einem Span-Design. Alle Knotenbestandteile wurden auf einem Span mit Ausnahme von 512-Mb-Außen-SCHLUCK eingebettet.
  • Eine Vielzahl von Knoten (ersteigbar in der Zunahme 1024 bis zu mindestens 65,536)
  • Dreidimensionale Ring-Verbindung mit Hilfsnetzen für globale Kommunikationen (Sendung und die Verminderungen), Eingabe/Ausgabe und Management
  • Leichter OS pro Knoten für das minimale System oben (Systemgeräusch).

Architektur

Die Blaue Gene/L Architektur war eine Evolution des QCDSP und der QCDOC Architekturen. Jeder Blaue Gene/L Rechnet, oder Eingabe/Ausgabe-Knoten war ein einzelner ASIC mit verbundenen SCHLUCK-Speicherchips. Der ASIC hat zwei 700-MHz-PowerPC 440 eingebettete Verarbeiter, jeder mit einer doppelten Rohrleitung doppelte Präzision Floating Point Unit (FPU), ein Subsystem des geheimen Lagers mit dem eingebauten SCHLUCK-Kontrolleur und der Logik integriert, um vielfache Nachrichtensubsysteme zu unterstützen. Der Doppel-FPUs hat jedem Blauen Gene/L Knoten eine theoretische Maximalleistung von 5.6 GFLOPS (gigaFLOPS) gegeben. Die zwei Zentraleinheiten waren nicht geheimes Lager zusammenhängend miteinander.

Rechnen Sie Knoten wurden zwei pro paketiert schätzen Karte, mit 16 schätzen Karten plus bis zu 2 Eingabe/Ausgabe-Knoten pro Knotenausschuss. Es gab 32 Knotenausschüsse pro Kabinett/Gestell. Durch die Integration aller wesentlichen Subsysteme auf einem einzelnen Span und des Gebrauches der Logik der niedrigen Macht Rechnet jeder, oder Eingabe/Ausgabe-Knoten hat niedrige Macht (ungefähr 17 Watt, einschließlich SCHLUCKE) zerstreut. Dieses erlaubte sehr aggressive Verpacken von bis zu 1024 schätzt Knoten plus zusätzliche Eingabe/Ausgabe-Knoten im 19-zölligen Standardgestell, innerhalb von angemessenen Grenzen der Versorgung der elektrischen Leistung und Luftkühlung. Die Leistungsmetrik in Bezug auf MISSERFOLGE pro Watt, MISSERFOLGE pro M von floorspace und MISSERFOLGE pro Einheit hat erlaubtes Schuppen bis zur Höchstleistung gekostet. Mit so vielen Knoten waren Teilmisserfolge unvermeidlich. Das System ist im Stande gewesen, eine Reihe von fehlerhaften Bestandteilen elektrisch zu isolieren, um der Maschine zu erlauben, fortzusetzen zu laufen.

Jeder Blaue Gene/L Knoten wurde drei parallelen Kommunikationsnetzen beigefügt: Ein toroidal 3D-Netz für die Gleicher-zu-Gleicher-Kommunikation dazwischen schätzt Knoten, ein gesammeltes Netz für die gesammelte Kommunikation (Sendungen, und reduzieren Sie Operationen), und ein globales Unterbrechungsnetz für schnelle Barrieren. Die Eingabe/Ausgabe-Knoten, die Linux Betriebssystem, zur Verfügung gestellte Kommunikation zur Lagerung und den Außengastgebern über ein Netz von Ethernet führen. Die Eingabe/Ausgabe-Knoten haben filesystem Operationen im Auftrag der schätzen Knoten behandelt. Schließlich hat ein getrenntes und privates Netz von Ethernet Zugang zu jedem Knoten für die Konfiguration, das Starten und die Diagnostik zur Verfügung gestellt. Um vielfachen Programmen zu erlauben, gleichzeitig zu laufen, konnte ein Blaues Gene/L System in elektronisch isolierte Sätze von Knoten verteilt werden. Die Zahl von Knoten in einer Teilung musste eine positive Macht der ganzen Zahl 2, mit mindestens 2 = 32 Knoten sein. Um ein Programm auf Blauem Gene/L zu führen, war eine Teilung des Computers erst vorbestellt werden. Das Programm wurde dann geladen und auf allen Knoten innerhalb der Teilung geführt, und kein anderes Programm konnte auf Knoten innerhalb der Teilung zugreifen, während es im Gebrauch war. Nach der Vollziehung wurden die Teilungsknoten für zukünftige Programme veröffentlicht, um zu verwenden.

Blaue Gene/L rechnen Knoten haben ein minimales Betriebssystem verwendet, das ein einzelnes Benutzerprogramm unterstützt. Nur eine Teilmenge von POSIX-Anrufen wurde unterstützt, und nur ein Prozess konnte auf einmal auf dem Knoten in der Coprozessor-Weise — oder ein Prozess pro Zentraleinheit in der virtuellen Weise laufen. Programmierer mussten grüne Fäden durchführen, um lokale Parallelität vorzutäuschen. Anwendungsentwicklung wurde gewöhnlich in C, C ++, oder Fortran mit MPI für die Kommunikation durchgeführt. Jedoch sind einige scripting Sprachen wie Ruby und Pythonschlange zu den schätzen Knoten getragen worden.

Blauer Gene/P

Im Juni 2007 hat IBM Blauen Gene/P, die zweite Generation der Blauen Genreihe von Supercomputern entschleiert und hat durch eine Kollaboration entwickelt, die IBM, LLNL und die Führungsrechenmöglichkeit des Argonne Nationalen Laboratoriums eingeschlossen hat.

Design

Das Design von Blauem Gene/P ist eine Technologieevolution von Blauem Gene/L. Jeder Blaue Gene/P Rechnet Span enthält vier PowerPC 450 Verarbeiter-Kerne, an 850 MHz laufend. Die Kerne sind zusammenhängendes geheimes Lager, und der Span kann als ein 4-wegiger symmetrischer Mehrverarbeiter (SMP) funktionieren. Das Speichersubsystem auf dem Span besteht aus kleinen privaten L2 geheimen Lagern, einem L3 zentralen geteilten geheimen 8-Mb-Lager und DDR2 Doppelspeicherkontrolleuren. Der Span integriert auch die Logik für die Knoten-zu-Knoten-Kommunikation, mit denselben Netztopologien wie Blauer Gene/L, aber an mehr als zweimal die Bandbreite. Eine schätzen Karte enthält einen Blauen Gene/P Span mit 2 oder 4 GB-SCHLUCK, das Umfassen "schätzt Knoten". Eine Single rechnet Knoten hat eine Maximalleistung von 13.6 GFLOPS. 32 Rechnen Karten werden in einen luftgekühlten Knotenausschuss eingesteckt. Ein Gestell enthält 32 Knotenvorstands-(so 1024 Knoten, 4096 Verarbeiter-Kerne).

Indem

sie verwendet haben, haben viele klein, niedrige Macht, dicht Chips paketiert, Blauer Gene/P hat die Macht-Leistungsfähigkeit anderer Supercomputer seiner Generation, und bei 371 MFLOPS/W Blauen Gene/P Installationen überschritten, die an oder in der Nähe von der Spitze der Green500-Listen in 2007-2008 aufgereiht sind.

Installationen

Der folgende ist eine unvollständige Liste von Blauen Gene/P Installationen. Pro November 2009 hat die TOP500-Liste 15 Blaue Gene/P Installationen von 2 Gestellen (2048 Knoten, 8196 Verarbeiter-Kerne, 23.86 TFLOPS Linpack) und größer enthalten.

  • Am 12. November 2007 liefen die erste Blaue Gene/P Installation, JUGENE, mit 16 Gestellen (16,384 Knoten, 65,536 Verarbeiter) an Forschungszentrum Jülich in Deutschland mit einer Leistung von 167 TFLOPS. Wenn eröffnet, war es der schnellste Supercomputer in Europa und das sechste schnellste in der Welt. 2009 wurde JUGENE zu 72 Gestellen (73,728 Knoten, 294,912 Verarbeiter-Kerne) mit 144 terabytes des Gedächtnisses und 6 petabytes der Lagerung befördert, und hat eine Maximalleistung von 1 PetaFLOPS erreicht. Diese Konfiguration hat neue Luft-Wasser-Hitzeex-Wechsler zwischen den Gestellen vereinigt, die kühl werdenden Kosten wesentlich reduzierend.
  • Das erste Laboratorium in den Vereinigten Staaten, um einen Blauen Gene/P zu erhalten, war Argonne Nationales Laboratorium. Bei der Vollziehung, der 40-Gestelle-(40960 Knoten, 163840 Verarbeiter-Kerne) wurde "Unerschrockenes" System #3 auf dem Juni 2008 500 erste Liste aufgereiht. Das Unerschrockene System ist einer der Hauptmittel des ANREGEN Programms, in dem Verarbeiter-Stunden der "großartigen Herausforderung" Wissenschaft und Technikprojekten in einer von Experten begutachteten Konkurrenz zuerkannt werden.
  • Lawrence Livermore Nationales Laboratorium hat eine Gene/P Blaue 36-Gestelle-Installation, "Morgendämmerung" 2009 installiert.
  • Die Universität von König Abdullah der Wissenschaft und Technologie (KAUST) hat eine Gene/P Blaue 16-Gestelle-Installation, "Shaheen" 2009 installiert.
  • Ein Blaues Gene/P System ist der Hauptverarbeiter für die Niedrige Frequenzreihe für die Radioastronomie (LOFAR) Projekt in den Niederlanden und Umgebung europäischer Länder. Diese Anwendung verwendet die strömenden Datenfähigkeiten zur Maschine.
  • Ein Blauer 2-Gestelle-Gene/P ist am 9. September 2008 in Sofia, der Hauptstadt Bulgariens installiert worden, und wird von der bulgarischen Akademie von Wissenschaften und der Sofia Universität bedient.
  • 2010 wurde ein Blauer Gene/P an der Universität Melbournes für die viktorianische Lebenswissenschaft-Berechnungsinitiative installiert.
  • 2012 wurde ein Blauer Gene/P an der Reisuniversität installiert und wird mit der Universität von Sao Paulo gemeinsam verwaltet.

Anwendungen

  • Veselin Topalov, der Herausforderer zum Schachweltmeister-Titel 2010, bestätigt in einem Interview, dass er einen Blauen Gene/P Supercomputer während seiner Vorbereitung des Matchs verwendet hatte.
  • Der Blaue Gene/P Computer ist verwendet worden, um etwa ein Prozent eines menschlichen Kortex vorzutäuschen, 1.6 Milliarden Neurone mit etwa 9 Trillionen Verbindungen enthaltend.
  • Die Projektmannschaft von IBM Kittyhawk hat Linux zu den schätzen Knoten getragen und allgemeines Web 2.0 Arbeitspensen demonstriert, die an der Skala auf einem Blauen Gene/P laufen. Ihr Papier hat im ACM veröffentlicht Betriebssystemrezension beschreibt einen Kernfahrer, dass Tunnels Ethernet über das Baumnetz, das auf all-all TCP/IP Konnektivität hinausläuft. Standardsoftware von Linux wie MySQL führend, resultiert ihre Leistung auf der Reihe von SpecJBB unter dem höchsten in den Akten.
  • 2011 hat eine Rutgers Universität / IBM / Universität der Mannschaft von Texas den KAUST Shaheen Installation zusammen mit einer Blauen Gene/P Installation an IBM Watson Research Center in eine "hohe Bundesleistung Rechenwolke" verbunden, die IEEE-SKALA-2011-Herausforderung mit einer Ölreservoir-Optimierungsanwendung gewinnend.

Blauer Gene/Q

Das dritte Supercomputerdesign in der Blauen Genreihe, Blauer Gene/Q hat zum Ziel, 20 Petaflops im 2012-Zeitrahmen zu erreichen. Es setzt fort, den Blauen Gene/L und die/P Architekturen auszubreiten und zu erhöhen.

Design

  • Die Blauen Gene/Q Rechnen Span ist ein 18 Kernspan. 64-Bit-PowerPC A2 Verarbeiter-Kerne sind gleichzeitig 4-wegig, hat mehreingefädelt, und ist an 1.6 GHz gelaufen. Jeder Verarbeiter-Kern hat einen SIMD Viererkabelvektoren doppelte Präzision, die Punkt-Einheit, den QPU schwimmen lässt, nach dem das System genannt wird. Die Verarbeiter-Kerne werden durch einen Querbalken-Schalter mit 32 Mb eDRAM L2 geheimes Lager verbunden, mit der Hälfte der Kerngeschwindigkeit funktionierend. Das L2 geheime Lager ist multi-versioned, transactional Gedächtnis und spekulative Ausführung unterstützend, und hat Hardware-Unterstützung für Atomoperationen. L2 geheimes Lager Fräulein wird von zwei eingebauten DDR3 Speicherkontrolleuren behandelt, die an 1.33 GHz laufen. Der Span integriert auch Logik für Span-zu-Span-Kommunikationen in 5D Ring-Konfiguration, mit 2GB/s verbindet sich Span-zu-Span. 16 Verarbeiter-Kerne werden für die Computerwissenschaft verwendet, und ein 17. Kern für das Betriebssystem hilft Funktionen wie Unterbrechungen, asynchrone Eingabe/Ausgabe, MPI schreitend und RAS. Der 18. Kern wird als ein Ersatzteil verwendet, im Falle dass einer der anderen Kerne, wie in der Herstellung dauerhaft beschädigt wird, aber normalerweise geschlossen wird. Der Blaue Gene/Q Span wird auf dem SOI Kupferprozess von IBM an 45 nm verfertigt, und wird 205 GFLOPS an 1.6 GHz liefern und 55 Watt ziehen. Es ist 19×19 Mm groß (359.5 Mm ²) und umfasst 1.47 Milliarden Transistoren. Der Span wird auf einer schätzen Karte zusammen mit DDR3 16-GB-SCHLUCK (d. h., 1 GB für jeden Benutzerverarbeiter-Kern) bestiegen.
  • Ein Q32 rechnet Schublade wird 32 haben schätzen Karten, jedes Wasser, das abgekühlt und in 5D Netzring verbunden ist.
  • Gestelle werden 32 haben rechnen Schubladen für insgesamt 1024 schätzen Knoten, 16,384 Benutzerkerne und 16 TB RAM.
  • Getrennte Eingabe/Ausgabe-Schubladen werden Luft abgekühlt sein und 8 enthalten schätzen Karten und 8 PCIe Vergrößerungsablagefächer für Infiniband oder 10 Netzwerkanschluss von Gigabit Ethernet.

Leistung

Zur Zeit der Blauen Gene/Q Systemansage im November 2011 verzeichnet ein anfängliches Gene/Q Blaues 4-Gestelle-System (4096 Knoten, 65536 Benutzerverarbeiter-Kerne) erreicht #17 im TOP500 mit 677.1 TeraFLOPS Linpack, ursprünglichen 2007 BlueGene/L 104-Gestelle-Installation überbietend, die oben beschrieben ist.

Dasselbe 4-Gestelle-System hat die Spitzenposition in der Graph500-Liste mit mehr als 250 GTEPS (giga überquerte Ränder pro Sekunde) erreicht. Blaue Gene/Q Systeme haben auch die Green500 Liste vom grössten Teil der Energie effiziente Supercomputer mit ungefähr 2 GFLOPS/W überstiegen.

Installationen

Das archetypische Blaue Gene/Q System genannt die Sequoia wird an Lawrence Livermore Nationales Laboratorium 2012 als ein Teil der Fortgeschrittenen Simulation und des Rechenprogramms installiert, das Kernsimulationen führt, und hat wissenschaftliche Forschung vorgebracht. Es wird aus 98,304 bestehen schätzen Knoten, die 1.6 Millionen Verarbeiter-Kerne und 1.6 PB Gedächtnis in 96 Gestellen umfassen, die ein Gebiet ungefähr bedecken, 6 Megawatt der Macht ziehend.

Ein Blaues Gene/Q System genannt Mira wird am Argonne Nationalen Laboratorium in der Argonne Führungsrechenmöglichkeit Anfang 2012 installiert. Es wird aus 49,152 bestehen schätzen Knoten, mit 70 PB der Plattenlagerung (470 GB/s Eingabe/Ausgabe-Bandbreite).

Siehe auch

Links


Ingvar Kamprad / Thorntonville, Texas
Impressum & Datenschutz