Nvidia na GTC 2018: Quadro GV100, server DGX-2 s výkonem 2 PFLOPS a NVSwitch

Na GTC 2018 Nvidia sice neodhalila GPU Turing ani Ampere, ale uvedla server s výkonem skoro 2 PFLOPS v AI výpočtech a přepínač logiky NVLink2.

25

Včera se odehrála úvodní prezentace Nvidie na její konferenci GTC 2018. Dříve se čekalo, že by na ní mohla být odhalena nová architektura GPU nebo dokonce rovnou nová generaci grafik GeForce pro herní PC. Již chvíli však kolují informace, že na ty přijde řada až později a skutečně – na GTC 2018 zatím ani nevykoukly. Ovšem Nvidia toho i tak představila poměrně dost, stavějíc ještě na architektuře Volta.

 

Quadro GV100

První z těchto novinek bylo oznámení nové grafické karty pro profi trh: modelu Quadro GV100. Jde jak už je vidět z názvu o kartu založenou na architektuře Volta a 12nm čipu GV100. Tedy o cosi jako o profesionální obdobu Titanu V, ovšem specifikace se liší. Quadro GV100 má v čipu GV100 aktivních 5120 shaderů (z celkových 5376) a spolu s tím 320 texturovacích jednotek a také 640 tzv. „tensor cores“, které slouží k akceleraci výpočtů pro neuronové sítě. Základní takt GPU neznáme, v boostu je taktováno na 1450 MHz. Teoretický výkon pro tuto frekvenci vychází na 14,8 TFLOPS v FP32, 29,6 TFLOPS v poloviční přesnosti FP16 a 7,4 TFLOPS v dvojité přesnosti FP64. Teoretický výkon tensor cores udává Nvidia jako 118,5 TFLOPS.

Co je na kartě proti Titanu V zajímavého, je paměťový subsystém. Použitá verze GV100 není osekaná a nese plnou 4096bitovou paměťovou sběrnici a na ní 32 GB paměti HBM2. Její efektivní takt je 1,7 GHz, což by mělo dávat propustnost 870 GB/s.

TDP karty je stanoveno na 250 W a je chlazena klasickým referenčním chladičem ve stylu Nvidie s jedním radiálním ventilátorem. Jako výstupy jsou dostupné čtyři DisplayPorty 1.4, DVI tentokrát chybí. Karta nicméně nese dvojici konektorů NVLink (místo konektorů SLI), které lze použít pro propojení dvou grafik v systému, což mělo už předchozí Quadro GP100.

Nvidia Quadro GV100
Nvidia Quadro GV100

Nvidia tuto grafiku kromě obvyklých použití směřuje i na vývojovou práci s ray tracingovou grafikou na bázi technologie DirectX Raytracing (DXR) a potažmo Nvidia RTX. Quadro GV100 by mělo být dostupné již nyní nebo v blízké době u obvyklých distributorů. Proti předchozím generacím je ale výrazně dražší: oficiální cena této karty činí 9000 dolarů (s DPH 223 500 Kč, a to při dnešním poměrně dobrém kurzu). Nicméně to asi bylo nevyhnutelné, kdy už „spotřebitelský“ Titan V s čipem Volta stál tři tisíce dolarů, což už bývalo kdysi teritorium právě top modelů řady Quadro.

DGX-2 a přepínače pro NVLink2

Kromě nového Quadra oznámila Nvidia ještě nový typ svého výpočetního serveru DGX. Po DGX-1 nyní přichází DGX-2. Tento systém řídí dva Xeony Platinum z poslední generace serverových CPU Intelu a je v něm v roli výpočetních koprocesorů nainstalováno 16 grafik Tesla V100 v „mezaninovém“ provedení. Nvidia uvádí, že výkon stroje dosahuje až 1920 TFLOPS, což je součet teoretických kapacit všech GPU při použití tensor cores. Teoretický výkon v klasických výpočtech FP32 je 240 TFLOPS. Systém má pod zátěží ale také hodně slušný příkon, Nvidia uvádí 10 000 W.

Konstrukce serveru DGX-2. GPU jsou ve dvou patrech, propojených modulem s přepínači logiky NVLink2 (Zdroj: AnandTech)
Konstrukce serveru DGX-2. GPU jsou ve dvou patrech, propojených modulem s přepínači logiky NVLink2 (Zdroj: AnandTech)

Stroj DGX-2 není ovšem jen souborem procesorů a grafik, sofistikovaný je na něm hlavně způsob propojení, který z něj dělá (alespoň pro některé úlohy) pokročilejší výpočetní platformu. GPU nejsou propojená rozhraním PCI Express, ale koherentním rozhraním NVLink2, které jim umožňuje přistupovat do paměti ostatních GPU. Každé z GPU Volta má šest rozhraní NVLink2, ovšem Nvidia je nepropojila přímo.

Přepínač pro NVLink

Po vzoru pokročilejších superpočítačových klastrů vyvinula Nvidia speciální přepínač (switch) pro konektivitu NVLink2, kterým lze propojit vyšší množství GPU. Čip nazvaný NVSwitch má údajně dvě miliardy tranzistorů a vyvádí ze sebe osmnáct linek NVLink2. Všech těchto 18 linek je propojeno dohromady společným crossbarem, celková propustnost má dělat 900 GB/s. Bližší parametry sděleny nebyly, takže například nevíme, jakou má NVSwitch spotřebu.

V DGX-2 by mělo být rovnou 12 těchto přepínačů. Tesly V100 jsou zdá se všemi šesti svými NVLinky zapojeny do některého ze switchů – schéma můžete vidět na obrázku. Jedna osmičlenná skupina GPU je tedy připojena k polovině (šestici) switchů, druhé osmička k druhé šestici. Zbylé porty obou šestic přepínačů jsou zřejmě použité k vzájemnému propojení switchů, jehož povaha úplně jasná není. Teoretická kapacita přenosu mezi dvěma GPU v tomto systému je podle Nvidie 300 GB/s.

Schéma zapojení přepínačů a GPU v serveru DGX-2 (Zdroj: AnandTech)
Schéma zapojení přepínačů a GPU v serveru DGX-2 (Zdroj: AnandTech)

Servery DGX-2 budou podle Nvidie stát 399 000 dolarů za jeden kus, u nás v korunách a s DPH momentálně 9,9 milionu. Kromě výše zmíněných GPU a CPU to obnáší ještě 30 TB NVMe SSD a „až 1,5 TB“ paměti DDR4 – formulace trošku budí dojem, že RAM možná není v ceně – a také 8× Infiniband a 8× 100Gb/s Ethernet jako konektivita. Systém ovšem ještě není dostupný, reálně bude na prodej až v třetím kvartálu roku.

Takto vypadá GPU GV100 na kartách Tesla V100 (Foto: Golem.de)
Tesla V100 v mezaninovém provedení (Foto: Golem.de)

Tesla V100 s 32 GB RAM

V DGX-2 jsou jinak osazené Tesly V100 s 32 GB paměti, což je upgrade proti původnímu 16GB modelu. Nvidia oznámila, že 32 GB HBM2 budou nyní mít všechny tyto karty (respektive výpočetní moduly), včetně těch, dodávaných v systémech DGX-1. Ostatní specifikace GPU jsou zachovány, podle Nvidie tedy nejde o nový model, ale spíše o cosi jako refresh.

Nvidia na GTC 2018: Quadro GV100, server DGX-2 s výkonem 2 PFLOPS a NVSwitch
Ohodnoťte tento článek!
5 (100%) 9 hlas/ů

25 KOMENTÁŘE

  1. Zacina to vypadat tragicky, bud se NVidia definitivne zblaznila a odchazi z trhu hernich grafik, protoze hraci cekali na oznameni Amperu a reakci spousty hracu bude nakup Xboxu nebo pripadne Playstationu nebo proste neni NVidia se stale schopna hnout z mista a Ampera nema potrebne zvyseni vykonu proti Pascalu. Tak jako tak to s hrama na PC zacina vypadat blede.

    • Ale tohle není žádná herní konference, to že hráči čekali je jedna věc, byly to jen šuškandy, stejné šuškandy jsou ale i o tom že představení bude později, s tím jde i ruku v ruce prohlášené NV k dění na trhu grafik a že ke zlepšení může dojít až někde kolem třetího kvartálu, proč by na trh šla nová generace, když ani té současné, nevyrábí dostatek k pokrytí trhu? Ohlašovat novou generaci třičtvrtě roku dopředu je doména jiného výrobce…

      Jinak ceny grafik pomalu začínají klesat a dostupnost se zlepšuje. Například GTX1080 je dnes celkem běžně skladem za ceny které jsou nižší než v době uvedení

      • Kamos chce novy PC, kupuje R5 2400G s integrovanou RX Vega. Chtel si koupit Intel procesor, ale potrebuje aspon trochu slusnou grafiku a tu nenasel, tak to vyresil takto. Naopak na GTX1080 nema prachy.
        Kdyz si kamos zvykne na integrovanou Vegu, tak co si asi casem koupi za grafiku? Zase od AMD, zvlast kdyz zaroven poridi FreeSync monitor, takze si zvykne na technologie od AMD.

        Cast hracu prechazi kvuli spatne dostupnosti grafik na Xbox a Playstationa, kde hardware take doddava AMD.

        Situace se tak stava tragickou pro firmy jako je Intel, NVidia a Steam. Ja jsem fanousek NVidii, takze to nelibe nesu, ale situace je opravdu pro vsechny mimo AMD je to tragedie.

        • ach jo … co ty vidíš jako tragedii, jiní vidí jinak … evidentně … tohle už vypadá jako plácání … pokud si kamoš „zvykne“, bude „zvyklý“ … myslíš, že to nVidie nějak pocítí?

        • V svetle ziskov či podielov napr. za minulý rok u nVidie – Grafiky, resp. Intelu – CPU vyznievajú tvoje slová o tom ako „situace je opravdu pro vse1chny mimo AMD je to tragédie“ neuveriteľne srandovne. Ach, chudák Huang 😀

        • ale to že jsou na trhu jen totální low endy nebo pak až vyšší mainstram nová generace (kamarád holt trefil špatnou situaci na trhu – před rokem si mohl chrochtat nad 1070 za 9k a 1080 za 13k, teď má smůlu) nijak nevyřeší, naopak to bude vypadat ještě hůře tím že nejen stará ale ani nová generace v krámech nebude, to pak zase bude v diskuzích nablito o paper launchích a kdoví čím dalším, zvlášť pokud se nová generace povede a nabídne výrazný výkonnostní posun který pak přiměje i mnohé vlastníky Pascalu upgradovat.

          • No nevím, jestli se povede, jako Výkonnostní posun, to bude, ze 14 NanoMetrů na 12 NanoMetrů jestli ano, tak to moc, velký posun není, a pokud se nepovede Architektura, což se takhle hodně, aby to byl výkonnostní posun výrazný, ze 14-Ti na 12 NanoMetrů, jestli tedy, tak to se povede, výrazný posun, tak jednou za 10 Let, když je to, jen o takhle málo lepší výrobní proces, byť, vlastně, Logicky, pokud by to bylo, opravdu ze 14 NanoMETRů, na asi tak 12 NanoMETrů, tak by vlastně, LOGICKy u High-ENDu, mněl ten Výkon, o 50% Stoupnout, a u Low-ENDu, obvykle o něco méně, ale pokud se povede, tak ten výkon bude vyšší o 50%, i u Low-ENDu, pokud tedy, není 12 NanoMETrový proces, jen vyladěný 14-Ti NanoMetrový, pak by posun výkonu, mohl být třeba, i jen 10%, a nebo možná spíše 20%, při stejné spotřebě, no uvidíme, kdyžtak, celkem, do-cela, zase, tedy! 🙂

        • No NVIDIa, m 70% TRHu, s Grafickými Kartami samostatnými do PC, AMD m á 30% TRHu, i když její grafické KARTy, jsou technologicky vyspělejší, a při stejné ceně, mají vyšší výkon, nebo spíše, při stejném výkonu nižší cenu, a nVIDIA teď, Sabotuje FIRMu AMD, podobně, jako Firma Intel, sabotovala AMD, a to no tak, více viz. tady: https://diit.cz/clanek/uzivatele-nabadaji-k-bojkotu-geforce-partner-program ,a Počítačový PROFFESIONÁLOVé se bouří, ale tvůj názopr je zajímavý o tom, Žádná, jsem rád že Fanoušci nVIDIE, konečně, každé Křivárně od ní přestali tleskat, a nVIDIA, po těch 15-Ti Letech Křiváren vůči AMD a ATI, půjde konečně do kopru, paráda, do-cela, celkem, zase, tedy! 🙂

      • S tou cenou pozor na to, že dolar od té doby proti koruně ztratil 20 % hodnoty.
        Jinak souhlasím s tím, že současné mlčení vůbec nic neznamená. A to, že je uvedení opožděné proti předpokladům, z toho se určitě nedají nějaké katastrofické implikace vytahovat. Nemusí to ani být odklad, nevíme, jaký byl původní plán Nvidie. A herní GPU určitě opouštět nebudou, IMHO, protože z nich mají většinu tržeb.

        • Jenze ty trzby mit nebudou, kdyz si hraci koupi konzole, kde je hardware od AMD. Naschvalk zjisti jakej je narust v prodejich konzoli za posledni rok a muzes nam o tom napsat clanek, mozna budes prekvapen i ty. 🙂

          • pc hráči žádné konzole kupovat nebudou a pokud ano, pak jen jako doplněk a kdože to nebude mít ty tržby? 😀 😀

        • Ano kurz dolaru tu cenu drží níž, stále dost vysoko nad MSRP která je pro 499 USD, při dnešním kurzu by měly být cena 1080 cca tak 13 tisíc a za cenu 1080 na našich krámech mohla být 1080Ti..

          • Já bych teď nic nehodnotil a dal tomu ještě tak měsíc čas. Teprve před 1-2 týdnama se začaly naskladňovat první karty (z oněch totálně vyprodaných modelů) v českých e-shopech a už teď je vidět, že ceny jdou ze zaváděcích astronomických dost rychle dolů.

            Příklad – na Alze jsem viděl před 10 dny první kusy GTX 1060 6GB skladem za 12000Kč. Aktuálně Tam je nejlevnější model za 9500Kč, skladem více jak 5ks a další 4 modely pod 10000Kč, opět skladem dostatek. Pořád nafouklá cena, ale už nijak zvláště proti těm podzimním.

            U GTX 1080 a 1080Ti je to zatím horší (o Radeonech nemluvě), ale zlepšovat se to bude úplně stejně, jen s lehkým zpožděním. To, že už jsou na skladě i ty RX Vega a RX 580/570, což byl problém i na podzim, jasně ukazuje, že fyzicky už ty karty jsou, jen teď budou nenažraní prodejci co nejdéle ještě ždímat zákazníky, než je plnící se sklady donutí ty ceny stahovat blízko k původním.

            Je to prostě hra na trpělivost lidí, kteří od ledna čekají na grafiku. Ale kdo počká ještě pár týdnů, určitě neprohloupí.

            Ethereum je aktuálně na letošním minimu a bojuje kolem $450, ostatní krypta na tom nejsou o moc lépe. A ta aktuální cena, se do dostupnosti grafik projeví právě až za několik týdnů nejdřív. I kdyby už to nešlo dolů a začalo se to vracet, tak je aktuálně celkem jasné, že někdy řekněmes na začátku května už budou sklady plné grafik a ceny tím pádem snad použitelné. 🙂

            (Poznámka: případný pád ETH pod veledůležitý support na $400, tzn. zpět do pásma, kde ETH bylo od června do listopadu, by mohl vést i k onomu rozprodávání rigů ze strany některých těžařů = další urychlení situace)

          • Gildore, na Aukru už to začíná, takže to bude možná dříve, než se nadějeme …

          • Super, já zatím jen zběžně sledoval Alzu ohledně toho naskladňování, každopádně celá sitauce se začíná zdá se vyvíjet docela rychle. 🙂

          • ETH právě na BItfinexu prorazilo kritický support na $400 s velikým prodaným objemem…

            I pokud by se to odtud odrazilo a dál nekleslo, tak toto byla důležitá psychologická hranice a určitě se teď najdou těžaři, co budou v panice prodávat rigy…především takoví ti, kteří nakupovali v lednu 1080Ti za 30tis./ks a zdaleka to nemají zaplacené.

    • 2 z 3ch PCI grafík sú od nVidie, herné noťasi sú z 99% v podaní nVidie, highend bol 100% ich 15 mesiacov, teraz je v najlepšom scenári Vega 64 maximálne niekde medzi 1080 a 1080Ti – ergo Ti či Titany sú bezkonkurenčné + vďaka tej drobnosti – miningu – nVidia predá všetko čo vyrobí.

      Vskutku, situácia hodná odchodu z herného trhu 😀 😀 😀

        • OK, nech sú to 2% ale verím bola by veľká sranda porovnať koľko čipov do 1050Ti/RX560 sa na zisku priamo pre AMD/NV vyrovná jedinému GP102 v Ti resp. priamo NV predávanou 1200USD Titan X/Xp.

          + pripočítaj si tú dobu počas ktorej boli bezkonkurenčný, Titan X od 08/2016 ? A do 03-04/2017 myslím lietala GTX1080 po 600USD…

          + tie ostatné faktory čo som spomenul a sme na 3mld. USD v čistom za rok 😀

          • …ktore huang strcil do titan V, ktory ma teraz problem s niektorymi vypoctami 🙂
            ved v pohode, chapem vyvoj highendu, aj jeho zmysel. len nechapem preco stale to je len o tom ze ked firma B ma pokrytych „len“ 98% trhu, stale sa porovnava s tymi 2% ktore nema.

  2. Citace: „plnou 4096bitovou paměťovou sběrnici a na ní 32 GB paměti HBM2“
    zvláštní, že u nVidie to JDE ale u AMD to koduri 4096bitovou sběrnici naschvál uškrtil na 2048 a ještě hlásal jak je problém sehnat HBM2 paměti. No jsem rád že ten břídil už u AMD nepracuje.

    • Koduri byl ale při tom návrhu tlačený cenou. Problém je že těch VEGA je ve srovnání s NV kartami střední třída = nízká cena, nízká marže, oproti TitanuV, Quadru a Teslám se to prodává jako rohlíky. Tzn i když má vega výrazně méně paměti, v objemu ji potřebují určitě více ale utrží na tom strašně málo. Když půjdeme jen k „levnému“ TitanV, cena odpovídá ceně 7.5 VEGA karet (Vega56), tzn 60GB HBM2, NVIDIA pro stejnou tržbu potřebuje jen 16GB HBM2, v Případě Quadra AMD potřebuje na stejnou tržbu 140GB HBM2, NV jen 32GB a u Volty ještě méně, ta DGX2 mašina má v plné palbě 512GB HBM2 a stojí 400 tisíc USD (pravda v ceně nejsou jen grafiky), tzn 1000ks Vegy56, tzn AMD musí prodat 8TB HBM2 na stejnou tržbu, což je 16x více než NV.

  3. Konecne prisli s novym DGX. Doteraz sa to rozne upravovalo aby boli v jednom stroji dve az sest. Teraz by mohla stacit jedna krabicka, max dve. A pre zaujimavost, pouziva sa v pristrojoch CT pocas operacie hlavy a mozgu na realny 3d obraz. Cize velky krok vpred a ciastocne zlacnenie.
    Este som to videl pri 3d scanoch budov na spracovanie dat z laserov a radarov na prevedenie dat do 3d modelu budovy vratane napr kabelaze, potrubi a podobne. Teraz sa par dni budova scanovala a cca tyzden spracovavali data, teraz sa to opat urychli