Lenovo Infrastructure Solutions Group, Intel oraz Centrum Komputerowe Leibniza (LRZ) działające przy Bawarskiej Akademii Nauk i Humanistyki, ogłaszają drugą fazę budowy superkomputera SuperMUC-NG w LRZ. System jest zintegrowanym, wysokowydajnym rozwiązaniem dla użytkowników LRZ, wykorzystującym sztuczną inteligencję do realizacji zaawansowanych symulacji, modelowania i analizy danych, co przyspieszy badania mające rozwiązać największe bolączki ludzkości.
Dzięki finansowaniu przez rząd Bawarii oraz niemieckie Federalne Ministerstwo Edukacji i Badań, faza druga przewiduje rozbudowę części Centrum Obliczeniowego Gaussa (GCS) zwanej SuperMUC-NG, zawierającej jeden z najszybszych i najbardziej energooszczędnych superkomputerów świata.
Rozwiązania zintegrowane z AI
Od czasu uruchomienia fazy pierwszej projektu SuperMUC-NG, naukowcy używają superkomputera nie tylko do tradycyjnych symulacji i modelowania, ale także do automatyzacji rozpoznawania obrazów i wzorów w obserwacjach planet, danych klimatycznych z satelitów, wizualizacji medycznych i dokumentacji zdrowotnej oraz danych demograficznych. Biorąc pod uwagę udane wykorzystanie SuperMUC-NG do tych zastosowań, zapotrzebowanie na wysokowydajną analitykę danych, uczenie maszynowe i duże ilości pamięci wzrosło jeszcze bardziej.
Wychodząc naprzeciw tym wymaganiom, postanowiono wesprzeć naukowców, wzbogacając SuperMUC-NG o nowej generacji procesory Intel Xeon Scalable (znane wśród ekspertów jako Sapphire Rapids) oraz procesory graficzne Intel HPC oparte na architekturze Xe HPC zwane również „Ponte Vecchio”.
W fazie drugiej wykorzystane zostanie również rozproszone asynchroniczne magazynowanie obiektów (DAOS), wykorzystujące potencjał 3 generacji procesorów Intel Xeon Scalable (zwanych również Ice Lake), zintegrowanych z platformą Lenovo ThinkSystem SR630 V2. DAOS posiada jeden petabajt pamięci masowej, co daje wysoką prędkość przesyłu dużych wolumenów danych, a architektura systemu może obsłużyć zadania wykorzystujące duże moce obliczeniowe i ilości danych, jak również aplikacje typu AI. Podsumowując, węzły obliczeniowe SuperMUC-NG zapewnią w fazie drugiej czterokrotnie wyższą wydajność w porównaniu z fazą pierwszą w przeliczeniu na wat mocy.
– Centrum Komputerowe Leibniza od dawna jest ważnym partnerem w dziedzinie innowacji zarówno dla Lenovo, jak i Intela. Faza druga to dobra okazja, aby podzielić się naszą wiedzą na temat „Exascale for Everyscale,” czyli rozwiązań wykorzystujących zaawansowane technologie Exascale w klastrach dowolnej wielkości, jak również aby dać naukowcom specjalistyczne zasoby potrzebne do przyspieszenia projektów – wyjaśnia Scott Tease, wiceprezes HPC i AI, Lenovo Infrastructure Solutions Group. – Dzięki wdrożeniu chłodzenia ciepłą wodą Neptune™ oraz inteligentniejszego zintegrowanego systemu sztucznej inteligencji i głębokiego uczenia się, LRZ może przez wiele lat pozostać liderem myśli technologicznej, wyznaczając nowe standardy w dziedzinie badań i rozwoju.
Zrównoważone podejście
Ulepszenia wprowadzone w fazie drugiej sprawią, że SuperMUC-NG będzie teraz w stanie wykonywać dodatkowe zadania w sposób jak najbardziej energooszczędny. Kluczem do tego jest integracja 240 węzłów obliczeniowych Intela z systemem ThinkSystem SD650 firmy Lenovo, wykorzystującym chłodzenie ciepłą wodą Neptune™ i połączonym z systemem pamięci masowej DAOS za pośrednictwem szybkiej sieci. Innowacyjna technologia bezpośredniego chłodzenia wodnego Neptune™ firmy Lenovo usuwa około 90% ciepła z systemu komputerowego, zmniejszając zużycie energii, znacznie zwiększając przy tym ogólną wydajność i ostatecznie pozwalając procesorom na najwyższą efektywność pracy.
Ponadto, komponenty w drugiej fazie projektu SuperMUC-NG będą wytwarzane w Europie, w nowym dedykowanym zakładzie produkcyjnym Lenovo na Węgrzech, aby zwiększyć ekologiczność łańcucha dostaw projektu.
– Dostarczanie zasobów i usług, które umożliwiają naukowcom przyspieszenie realizacji ich projektów, jest naszym głównym zadaniem w LRZ – mówi prof. dr Dieter Kranzlmüller, dyrektor LRZ. – Nasza współpraca z Lenovo i innymi partnerami w celu włączenia potencjału AI w następnej fazie umożliwi ośrodkowi osiągnięcie tego celu, zapewniając naukowcom możliwość lepszego wykonywania pracy. Co więcej, dzięki technologii chłodzenia ciepłą wodą firmy Lenovo jesteśmy w stanie zapewnić te ulepszenia w sposób maksymalnie zrównoważony i energooszczędny.”
Rozpoczęcie fazy drugiej
LRZ otrzyma system pamięci masowej DAOS w ostatnim kwartale 2021 r., a system obliczeniowy w drugim kwartale 2022 r. Zespół LRZ przygotowuje swoich użytkowników na rozszerzenie fazy drugiej o wsparcie, konsultacje w zakresie adaptacji oraz optymalizacji kodów i algorytmów sztucznej inteligencji, zapewniając badaczom dostęp do systemów GPU wyspecjalizowanych w aplikacjach sztucznej inteligencji. Program szkoleniowy LRZ oferuje również szeroką gamę kursów z zakresu uczenia maszynowego i głębokiego, dzięki którym użytkownicy mogą dostosować istniejące algorytmy lub opracować i wytrenować własne.
SuperMUC-NG znajduje się obecnie na 15 miejscu listy Top 500 superkomputerów na świecie.