Z Nvidie je výrobce superpočítačů. Její vlastní systém Selene je 7. nejrychlejší na světě

14

Nvidia se překvapivě stala provozovatelem 7. nejvýkonnějšího superpočítače na světě a se servery DGX zároveň jejich výrobcem. Paradoxně jde i o zatím nejrychlejší superpočítač s procesory AMD.

Dnes už jsme psali o tom, že byla vydána nová verze žebříčku nejvýkonnějších superpočítačů TOP500, kde je teď na čelní pozici mašina Fugaku v japonském výpočetním centru RIKEN. Ta je založená na zajímavých ARM procesorech Fujitsu a v kontrastu s dnešním mainstreamem nepoužívající GPU akcelerátory.

Ovšem v novém TOP500 je toho zajímavého víc. Docela hvězdně v něm totiž přistál privátně vlastněný a provozovaný superpočítač patřící Nvidii. Stroj nazvaný Selene využívá nové generace akcelerátorů Nvidia A100 a měl by to být skoro* nejvýkonnější takovýto „domácí“ superpočítač patřící nějaké firmě. Svým výkonem se totiž dostal na sedmé(!) místo žebříčku TOP500, tedy mezi úplně elitní, byť teď už o generaci starší zařízení velmocí (2. až 5. pozice jsou obří superpočítače USA a Číny).

7. nejvýkonnější superpočítač narychlo za 4 týdny

Stroj Selene obsahuje 2240 akcelerátorů (GPU) Nvidia A100 v celkem 280 „Superpod“ serverech Nvidia DGX A100. Je to vlastně dost málo, tento systém se dostal na vysokou pozici díky tomu, že tato nová generace GPU s architekturou Ampere výrazně zvýšila výkon a ostatní konkurenti tato GPU ještě nepoužívají. Klastr Nvidia údajně postavila za pouhé čtyři týdny. Jde tedy vlastně i o marketing ukazující, jak snadno lze ze serverů nabízených Nvidií podobné instalace stavět.

Nvidia A100. GPU Ampere GA100 v provedení SXM4 Zdroj: Nvidia

GPU jsou v DGX A100 osazena v počtu osmi kusů na jeden server, což tvoří jednu instanci. Takový 8×GPU server pak spravuje dvojice 64jádrových procesorů AMD Epyc 7742 se společnou 1TB pamětí RAM. Vedle zářezu pro Nvidii je Selene ironicky také nyní nejvýše postavený superpočítač s procesory AMD (nicméně v budoucnu by měly Epycy být vyzbrojené i špičkové Exascale systémy FrontierEl Capitan).

Nvidia DGX A100 Zdroj: Nvidia

Galerie: GPU Nvidia A100, architektura Ampere a servery DGX A100

Nvidia je teď vlastně výrobce superpočítačů

Komunikaci obstarávají adaptéry InfiniBand od Mellanoxu, který je teď také součástí Nvidie, se 494 switchi Mellanox Quantum. Systém má celkem 7 PB úložného prostoru v NVMe SSD a kapacita RAM by měla být v souhrnu 280 TB. Mimochodem, po akvizici Mellanoxu je teď vlastně Nvidia firmou nabízející kompletní HPC systémy podobně jako Cray, Dell, IBM, Bull, Sugon a tak podobně. Jinými slovy výrobce superpočítačů.

Pole žebříčku TOP500 má Selene výkon 27,58 PFLOPS, což by měl být výkon naměřený v Linpacku. Ovšem ve výpočtech umělé inteligence, které běží na speciálních akcelerátorech Tensor Core (které provozují jen maticové operace neuronových sítí se sníženou přesností), má Selene mít výkon vyšší než 1 EFLOPS. Nvidia bude pravděpodobně využívat hlavně tensor jádra a méně FP64, přičemž na totéž asi cílí u zákazníků.

Jeden server Nvidia DGX A100 stojí oficiálně 200 000 $ (a spotřebovává maximálně 6,5 kW). Pořídit jen samotné servery by tedy stálo „jen“ nějakých 56 milionů dolarů, ovšem je třeba ještě přičíst switche, kabely, elektroinstalaci a další příslušenství.

Nvidia DGX A100 v Argonne Labs Zdroj: Nvidia

7nm čipy přinesou velkou obměnu superpočítačů

Vysoké umístění Selene asi při poměrně malém množství uzlů/kabinetů nebude trvat tak dlouho. Je asi do značné míry dáno tím, že jde o jeden z prvních strojů se 7nm akcelerátory A100. Až je začnou používat další provozovatelé, kteří pořídí superpočítače složené už z většího klastru stejného hardwaru, budou mít výkony také větší a Selene předstihnou. Nicméně nevýznamný superpočítač Nvidie také nebude a firma pro něj určitě má svoje využití.

Nvidia se při této příležitosti pochlubila, že její GPU jsou ve 20 z 25 nejvýkonnějších superpočítačů. Současně také GPU systémy ovládají žebříček Green 500, v kterém jde o poměr mezi výkonem a spotřebou. Selene sice není úplně první, ale jen druhý systém v pořadí v této kategorii, ale pořád dodává úctyhodný výkon 20,5 GFLOPS na jeden watt spotřeby. Tyto počty ale samozřejmě platí jen tehdy, pokud běžící kód odkáže GPU dobře využít.

Jen-Hsun Huang peče Ampere Zdroj: Nvidia

Galerie: Šéf Nvidie předvádí v teaseru desku superpočítačového systému DGX A100

I nejrychlejší privátní superpočítač běží na Nvidii

* Úplně nejvýkonnější superpočítač používaný komerční firmou je na šesté pozici. Systém HPC5 má naměřený výkon 35,5 PFLOPS a jde o klastr serverů Dell PowerEdge provozovaný nadnárovní energetickou a ropnou společností Eni S.p.A. v Itálii. Tento stroj je založený na procesorech Intel Xeon Gold a Gpu Nvidia Tesla V100 (tedy ještě GPU Volta). Propojení je také Infinibandem od Mellanoxu.

Toto zařízení je jinak i nejvýkonnější superpočítač v Evropě. No, snad se skrze evropský program budování HPC technologií a hardwaru dostaneme výš.

Zdroje: Nvidia, TOP500

Z Nvidie je výrobce superpočítačů. Její vlastní systém Selene je 7. nejrychlejší na světě
Ohodnoťte tento článek!
4.5 (90%) 6 hlas/ů

14 KOMENTÁŘE

  1. „„Nvidia se překvapivě stala provozovatelem 7. nejvýkonnějšího superpočítače na světě a se servery DGX zároveň jejich výrobcem … narychlo za 4 týdny …její GPU jsou ve 20 z 25 nejvýkonnějších superpočítačů.“

    A nikdo neřekl ani popel…

    Toto by si mali 3x prečítať tý ktorí sa tak veľmi boja o nVidiu a poukazujú že chúďatko nemá vlastné CPU a AMD má, a aj intel bude mať za chvíľu svoje GPU, a AMD má aj APU a konzoly a nVidii sa zmenší trh z kartami a neviem čo.

    Na prvý pokus 7me naj. „superPC“, a postavene samotnou nVidiou.
    A povedzme mi kto by pol roka naspäť povedal že nVidia niečo také sama urobí – nie len že tam budú jej GPU ?

    Tým chcem povedať že keď môže AMD rásť, expandovať a „pchať“ sa tam kde vôbec nebolo tento príklad ukazuje že aj nVidia môže začať expandovať a skúšať nové, doteraz vôbec nepoužité spôsoby a konkurencia môže potom len pozerať ako „bager na hlinu“ 😀

    PS: už to tak vyzerá že NEplatí : „Výkon překvapivě zaostává za očekáváním. A o hodně!“ ale že tie GA100 pri správnom nasadaní, napr. „ve výpočtech umělé inteligence,“ naopak dávajú parádny výkon !
    …alebo sú všetci blbci a nVidia vyhodila miliardy za vývoj slabého GPU ktoré tak strašne zaostalo za očakávaniami 😀

  2. Tohle se čekalo od prvních nášlapů k akvizici Mellanoxu už někdy před rokem. Tedy ne zrovna, že si NV postaví u sebe superpočítač, to fakt ne. 😀 Ale že se chystá dodávat kompletní hotové systémy. Huang tu horizontální diverzifikaci prostě umí. Jinak by mě zajímalo zda to postavili za účelem marketingu, nebo pro svoje použití nebo to NV bude pronajímat. Možná vše dohromady. Přeci jen je to docela za ranec. 😀
    A taky gratulace do AMD, kolik že těch Epyců tam je? 560ks za nějaký 4 mil dolarů? 🙂 Ale tak věřím, že Lisa dala Jensenovi nějakou tu slevičku. 😀

    • „Přeci jen je to docela za ranec.“

      Nie je. Nie pre súčastnú nVidiu.

      Za posledné 3 mesiace dosiahli „čistého zisku 917 milionu dolarů“ – t.j. nejakých 300mega/mesiac takže takáto sranda za 56mega + „drobné“ je vážne nič.
      A ak vezmeme jej zisky za celý rok tak potom tých možno 60mega je len „banalita“.

      • Ne, 1+ miliarda korun bude vždycky ranec ať vydělává kdo chce co chce. A pokud už to počítáš takto nákladově pro NV, tak $56mega je koncová prodejní cena pro zákazníky, náklady NV budou sotva poloviční vzhledem k jejich průměrným 65% maržím… 😉

        • Podľa mňa nie, pretože práve ako píšeš nejde len o samotnú sumu ale o to kto koľko“vydělává“.

          Pozri, je 3000€ za notebook ranec alebo nie ?

          Ak berieš minimálku tak je to skutočne ranec, niečo na čo budeš dlho šporiť a dlho – predlho rozmýšľať, ak si poslanec a berieš 5000€ tak to zrazu nie sú ani 2/3 z jednej výplaty a hravo to dáš.
          Ano, cena je rovnaká ale to ako sa na to pozeráš je úplne iné keď máš 500€ alebo 5000€ mesačne.

          nVidia za 3 mesiace v čistom zarobila 917mega – 60 mega je sotva 6,5% z tej sumy.
          6,5% zo zisku za tri mesaice má byť ranec ? To hádam nie.

          A to ako si podotkol v realite to nebolo ani zdaleka 60mgea nakoľko si to nVidia postavila a „predala“ sama…

          btw. a ja to vzťahujem na nVidiu, jej príjmy a milióny z ktorými operuje, preto tam hore jasne píšem „Nie pre súčastnú nVidiu.“

          • Myslím, že vést 50ti příspěvkovou debatu na téma co to je a není ranec (což je dost subjektivní pojem) by bylo dost off topic až zbytečné. Navíc jsi úplně odběhl od mé původní myšlenky… „Jinak by mě zajímalo zda to postavili za účelem marketingu, nebo pro svoje použití nebo to NV bude pronajímat. Možná vše dohromady. Přeci jen je to docela za ranec.“ Roční budget NV na marketing je podle dostupných údajů jen $15 mil, bylo by z tohodle pohledu $50 mil ranec nebo ne? 😀

            • Samozřejmě, že to je marketing… a využití budou mít taky, to šlo určitě ruku v ruce při nápadu to postavit. Takhle Nvidia ukázala, chcete superpočítač a rychle? jak velký? možnost rozšíření? nabízíme DGX, není problém. Že tam jsou Epycy, to je jen ukázka pragmatického přístupu; firmu živí prodeje, ne nějaké fanwars. Využití – první, co mne napadlo, je DLSS. Vůbec bych se nedivil, kdyby Nvidia nabídla vývojářským studiím nějaký nástroj na trénování DLSS kombinovaný s přístupem na jejich superpočítač.