Nová verze standardu pamětí HBM2. Je rychlejší a s kapacitou až 24 GB na jeden čip

6

Letos na podzim se do grafických karet dostaly poprvé paměti GDDR6, přinášející slušné zvýšení propustnosti díky vysoké efektivní frekvenci (až 14,0 GHz). Ani alternativní technologie pamětí HBM/HBM2 ale nestagnuje a její možnosti se posunou také. Konsorcium JEDEC nyní vydalo novou verzi jejich specifikací, pod níž vzniknou čipy s podstatně vyšší kapacitou, ale také výkonem.

Paměti HBM i HBM2 používají nižší frekvence než aktuální verze GDDR, ale kompenzují to velmi širokou sběrnicí, která má 1024 bitů na jeden čip. Respektive na jedno pouzdro, protože tyto paměti se vyrábějí z více čipů DRAM naštosovaných na sobě a propojených technologií TSV. Jedno takové pouzdro tak má propustnost několika čipů GDDR, u HBM2 to dosud bylo až 256 GB/s (při efektivním taktu 2,0 GHz).

Nová verze standardu HBM2 nyní zvýšila takt až na 2,4 GHz efektivně (nebo chcete-li 2,4 Gb/s na jeden datový pin sběrnice), což znamená nárůst propustnosti o 20 %. Propustnost těchto nových „čipů“ HBM2 tím pádem dosáhne 307,2 GB/s. Karta s 2048bitovou sběrnicí (tedy konfigurací podobnou Radeonům RX Vega) by s nimi dosáhla 614 GB/s, s 4096bitovou už 1,23 TB/s. Výrobci by snad mohli takto rychlé paměti dodat poměrně rychle, protože už na nich pracovali předem (viz například letos v lednu Samsung).

Schéma stavby pamětí typu HBM (slajd firmy Hynix)

Vyšší kapacity, ale možná i nové pouzdro

V minulosti někdy byla nevýhoda HBM/HBM2 v tom, že šířka sběrnice více omezovala dostupné kapacity, zatímco u GDDR je možné osadit dva čipy na kanál. Nové čipy HBM2 by ale měly existovat v podstatně vyšších kapacitách, takže by toto mělo přestat představovat problém. JEDEC do standardu přidal možnost použít 12 vrstev čipů DRAM, zatímco dosavadní HBM2 používala dva, čtyři nebo osm. Přidání nových vrstev vyžaduje změnu shift registru, který rozděluje přenosy mezi jednotlivé čipy v pouzdru.

Zároveň bude možné použít čipy DRAM s vyšší kapacitou, 16 Gb (2GB) na jednu vrstvu místo dnes využívaných 8Gb (1GB) čipů. V tiskové zprávě se ovšem hovoří o tom, že pro tyto čipy byl ve standardu definován nový rozměr, jelikož plocha křemíku je větší. Pouzdra s touto vyšší kapacitou a/nebo 12 vrstvami proto možná budou odlišná a fyzicky nekompatibilní se současnými GPU. Ovšem výměnou za to budou mít trojnásobnou kapacitu. Díky dvojnásobně větším čipům a navýšení vrstev o 50 % bude maximální kapacita 24 GB. Grafika s highendovým 4096bitovým GPU by tedy s těmito komponentami mohlo mít 96 GB paměti.

Takovéto konfigurace ovšem budou drahé, takže je asi uvidíme jen ve výpočetních kartách pro datacentra a strojové učení, případně integrované na podobných akcelerátorech jiných architektur, FPGA a podobně. Čipy DRAM s vyšší kapacitou by ovšem asi mohly být nasazeny i při nižším počtu vrstev, takže by s nimi mohla být třeba 4GB, 8GB nebo 16GB pouzdra HBM2 levnější. I GPU třeba pro notebooky s jen jediným pouzdrem (jako jsou integrovaná GPU v procesorech jako je Kaby Lake-G nebo kompaktní Radeon Vega Mobile) by pak mohla mít vedle slušné propustnosti (307 GB/s je skoro jako propustnot šesti čipů GDDR6) také velkou kapacitu grafické paměti.

Nová verze standardu pamětí HBM2. Je rychlejší a s kapacitou až 24 GB na jeden čip

Ohodnoťte tento článek!
4.9 (97.33%) 15 hlas/ů

6 KOMENTÁŘE

  1. Pro výpočetní sektor určitě velmi dobrá zpráva.
    U herních karet se zatím ukazují HBM2 jako neúměrně drahé řešení. Doufám, že AMD už od toho v další generaci upustí.
    U notebooků je ale pozitivní faktor rozměru a spotřeby, takže tam to může ty vyšší výrobní náklady vykompenzovat. Kaby Lake-G se zdá jako dobré řešení.

    • Ono to tak úplně být nemusí, já si dokážu představit HBM i v herním segmentu, jen to GPU by muselo být o dost výkonnější – což byl doposud u uvedených GPU problém. Druhá možnost je mobilní platforma (jak správně píšeš), tam se to hodí taky.

      • Nebo jako masivní L4 cache pro CPU v PC. Bylo by fajn posunout se v průchodnosti u paměťově rozpřáhlých aplikací z desítek GB/s na stovky GB/s. Tr 2990WX je nakonec ukázkou, když pro non-only-cache úlohy to jádrům prohraje latence a bandwith RAM.

        • HBM se jako cache nehodí, protože IMHO není dost rychlá. HBM staví na nízko taktované paměti, která tím že je nastohovaná na sobě umožňuje velkou propustnost při vysokých latencích, které ale v grafických operacích nevadí.
          Avšak cache v procesorech běhají na frekvencích třeba 4GHz a mají přitom poměrně nízkou latenci, která je právě pro cache typická.

  2. Já bych to chtěl vidět v APU. Jeden dvouvrstvý 4GB čip s nejpomalejší rychlostí 1,4GHz má stále větší propustnost, než karta s 192bit sběrnicí a 7GHz čipy. A tomu APU by to stačilo jéje.