ARM má odpověď na AVX. Instrukce SVE škálují automaticky od 128 do 2048 bitů

23. 8. 2016

ARM přišel s 64bitovou
instrukční sadou ARMv8 poměrně pozdě (uvedena byla v roce
2012), její návrh je ale docela pozitivně hodnocen. Proti
aktuálním procesorům x86 mají nicméně procesory ARM jeden
deficit: ve schopnostech instrukcí SIMD, které pracují jen
s 64 či 128bitovými vektory, kdežto x86 již poskytuje
256bitové AVX a AVX2 a výhledově se dostáváme
k AVX-512 s dvojnásobným vektorem. V připravované
aktualizaci architektury označneé ARMv8-A nicméně ARM hodlá
srovnat krok (respektive spíše „dohnat a předehnat“)
a pokročilé instrukce SIMD doplnit rozšířením nazvaným
SVE.

SVE znamená „Scalable Vector
Extensions“ a ona škálovatelnost v názvu není jen tak
pro nic. SVE má pokrývat operace typu SIMD se šířkou vektoru až
2048 bitů, což by například pro běžné 32bitové hodnoty (FP32)
znamenalo 64 čísel zpracovávaných jednou instrukcí, pro menší
datové typy dvojnásobek nebo čtyřnásobek. SVE tím pádem bude
vstupenkou procesorů ARM do světa superpočítačů neboli sektoru
HPC, kde se uplatní skutečně masivní šířka vektorových
registrů.

Nicméně ARM zdá se chce, aby toto
rozšíření instrukční sady bylo univerzálnější, neboť
masivní zrychlení při použití instrukcí SIMD se hodí v celé
řadě oblastí, významně zejména v multimédiích. V běžných
procesorech pro spotřebitelskou sféru by ale takto široké vektory
neměly valné využití, pro řadu operací je optimální šířka
128bitů a již 256bitové instrukce nejsou využitelné vždy
(například je pro ně uzpůsoben formát HEVC, ale H.264 s menšími
bloky již méně). Z tohoto důvodu je rozšíření SVE
navrženo do jisté míry agnosticky k šířce vektoru,
a zkompilovaný kód má fungovat na celé škále vektorových
jednotek FPU s různou šířkou. Spodní hranicí má být
128bitová šířka, kterou bychom mohli nejspíše nalézt
v budoucích mobilních čipech, a horní již zmíněných
2048 bitů.

ARM uvádí, že chce problém
vektorizace na různé šířky instrukcí SIMD přesunout z rukou
překladače a programátora (v případě, kdy je kód
optimalizován ručně) do hardwaru. Instrukce SVE tak mají být
kompatibilní pro všechny šířky, a samotný procesor se má
starat, aby kód zpracoval ideálním způsobem pro svou jednotku
FPU.

To zřejmě znamená, že pokud je
jednotka úzká, budou se instrukce dělit a zpracovávat ve
více taktech, nebo naopak pokud je jednotka široká (oněch 2048
bitů), bude do ní posláno více operací najednou (pokud to
ovšem závislosti a skladba programu dovolí). Jak přesně je tato
kompatibilita realizována, ale ze zveřejněných popisů nevyplývá.
Patrně by to ale mohlo obnášet, že vektorové operace budou
pracovat v oddělitelných sekcích o určité základní
šířce, které se pak budou opakovat, například po oněch 128
bitech. To například pro sčítání nebo násobení nebude
problém, ale brání to efektivnímu použití permutací či
horizontálních operací, což nejsou právě neužitečné
instrukce. Podobně rozdělené zpracování nicméně používá
i AVX a AVX2, takže ARM s tímto problémem nebude
sám.

SIMD instrukce ARMv8-A SVE

První uživatel: superpočítače Fujitsu

Zdá se, že se prozatím nepočítá
s implementací SVE v rámci hotových licencovatelných
jader ARM Cortex. SVE tak bude dostupné zpočátku jen firmám,
které licencují čistě instrukční sadu a na jejím základě
vytvářejí vlastní architekturu jádra (například Qualcomm).
Prvním oznámeným uživatelem je japonské Fujitsu, což vám možná
rozsvítí žárovku. Nedávno bylo oznámeno, že tato firma hodlá
architekturu ARMv8 použít v nových HPC procesorech místo
dosavadních jader Sparc a její volba tak s instrukcemi
SVE začíná dávat smysl. Procesory, které firma chystá pro svou
novou generaci superpočítačů, budou tedy numerický výkon
realizovat právě pomocí nich. Objevit se mají v superpočítači
pro instituci RIKEN v roce 2020.

Fujitsu přejde ve svých HPC procesorech z archtiektury Sparc na 64bitový ARM

Jak to bude s dalším využitím
a zda se SVE objeví i v procesorech ARM pro „sprostý
lid“, zatím není jasné. Podpora nízkých šířek vektoru by
asi měla naznačovat, že se tyto instrukce dostanou i do
běžných ARMů. Zda to ale bude nějak brzy, to těžko říct.
Dostupné informace nezmiňují, jaké datové typy kromě čísel
s plovoucí desetinou čárkou (patrně v dvojité
a jednoduché přesnosti) budou dostupné, takže těžko říct,
jak užitečné by toto rozšíření bylo například pro
multimédia. Pokud ARM myslí i na celočíselné hodnoty, pak
by však sada byla dostatečně univerzální.

Zdroje: The
Register, AnandTech

Vstoupit do diskuse

Jan Olšan

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Sdílet

První uživatel: superpočítače Fujitsu

Autor článku

Jan Olšan

Témata:

Anketa

Má podle vás Mironet právo na odškodné?

Kvíz týdne

Intel bude mít mimořádně výkonné integrované GPU. Razor Lake-AX se může blížit GeForce RTX 5070

[AKTUALIZACE 15. 5.] Warhorse přispěje na opravu Pirkštejna za každou prodanou kopii Kingdom Come: Deliverance

Jak udělat screenshot? Snadný návod pro počítač, tablet i telefon

Sony vytáhlo novou Xperii za téměř 50 tisíc. Internet však neřeší výkon ani cenu, ale úsměvné AI fotografie

Před 11 lety zapomněl heslo k bitcoinové peněžence s 5 BTC, teď mu ho obnovil Claude.

Google zabíjí své Android emoji, jen aby se více podobal Applu. Nový 3D vzhled sbírá smíšené reakce

Hráči s Radeony RX 7000 i 6000 se dočkali. AMD jim dodá podporu AI upscalingu FSR 4.1

Jak se vyvíjí trh procesorů: Kolik procent má AMD a Intel a kolik jim už vzaly procesory Arm?

[AKTUALIZOVÁNO 14. 5.] Velké rozdávání her na Epicu. První dvě hry květnového výprodeje jsou tady

Kdo mi volal? Jak zjistit, komu patří neznámé telefonní číslo v roce 2026

ARM má odpověď na AVX. Instrukce SVE škálují automaticky od 128 do 2048 bitů

Sdílet

První uživatel: superpočítače Fujitsu

Autor článku

Jan Olšan

Témata:

Anketa

Má podle vás Mironet právo na odškodné?

Kvíz týdne

Nejnovější články

Intel bude mít mimořádně výkonné integrované GPU. Razor Lake-AX se může blížit GeForce RTX 5070

[AKTUALIZACE 15. 5.] Warhorse přispěje na opravu Pirkštejna za každou prodanou kopii Kingdom Come: Deliverance

Jak udělat screenshot? Snadný návod pro počítač, tablet i telefon

Sony vytáhlo novou Xperii za téměř 50 tisíc. Internet však neřeší výkon ani cenu, ale úsměvné AI fotografie

Před 11 lety zapomněl heslo k bitcoinové peněžence s 5 BTC, teď mu ho obnovil Claude.

Google zabíjí své Android emoji, jen aby se více podobal Applu. Nový 3D vzhled sbírá smíšené reakce

Hráči s Radeony RX 7000 i 6000 se dočkali. AMD jim dodá podporu AI upscalingu FSR 4.1

Jak se vyvíjí trh procesorů: Kolik procent má AMD a Intel a kolik jim už vzaly procesory Arm?

[AKTUALIZOVÁNO 14. 5.] Velké rozdávání her na Epicu. První dvě hry květnového výprodeje jsou tady

Kdo mi volal? Jak zjistit, komu patří neznámé telefonní číslo v roce 2026

Dále u nás najdete

Kritická chyba ve Windows je i po deseti letech stále nebezpečná

„Ženy neumějí investovat!" Mýtus, který v Česku padl

Na Vysočině věří globálnímu cloudu. Jak jste na tom vy?

Kyberhrozby v ČR mění tvář, průniky do systémů vytlačují DDoS

Lékaři zdarma vyšetří znaménka. Kdy a kam přijít?

Seyfor koupil podíl v českém výrobci ikonického softwaru

Jak vypadá nejstarší mobilní vysílač v Česku?

Nabité květnové vydání Computertrends 5/26 je tady

Experti na bezpečnost nastražují falešné pastičky na útočníky

Vývojáři jsou zahlcení: AI slop mění ekonomiku bezpečnosti

Pozor na tisk z Firefoxu, může vám uniknout heslo

Revoluce v síťovém provozu, upload drtí download

Na kvantové útoky není připravena většina blockchainů

Škoda na zaparkovaném autě: Poradíme, co dělat

Denisa se svou značkou Lahodný Benedikt vsadila na Instagram. Přišla o účet i obrat

V Praze lze erotické letáky rozdávat jen u skládky. Darling Cabaret to zkoušel obejít

Hackeři napadli oblíbený nástroj pro práci se strojovým učením

Nábytek jak z Alenky v říši divů. Zuzana vyměnila kancelář za prach a piliny

Na léčbu antiobezitiky si připravte až deset a půl tisíc korun měsíčně

Mythos je jen marketingový tah, tvrdí autor nástroje Curl