Samsung má ARM jádro, které může konkurovat Applu a Intelu. Exynos M3 slibuje vysoké IPC

16
Samsung Exynos 9
Samsung Exynos 9

Ve světě mobilních telefonů panuje zvláštní situace. Apple už před několika lety vyvinul silná jádra s vysokým výkonem na 1 Mhz. Jejich „IPC“ je někdy dokonce považováno za blízké jádrům Intelu, i když situaci dost možná zkresluje nedostatek skutečně reprezentativních a srovnatelných benchmarků. Zbytek mobilního trhu běžící na Androidu (nebo mobilních Windows) má ale k dispozici jen podstatně slabší jádra ARM Cortex. Tyto nerovné podmínky co do procesorového výkonu by ovšem možná nyní mohl prolomit Samsung.

Samsung se cestou vlastních procesorových jader vydal zhruba před dvěma lety s architekturou Exynos M1. Tyto první kroky byly poměrně nenápadné, tým vyvíjející jádra CPU evidentně nejprve věci oťukával a nesnažil se o ambiciózní architekturu na první pokus. Zdá se ale, že jeho chvíle přijde s jádrem Exynos M3, které se má letos objevit v Exynosu 9810. Samsung k němu už dřív sdělil, že má mít až dvojnásobný jednovláknový výkon a nyní máme doklady, že nemusí jít jen o plané sliby. Vnitřnosti jádra budou totiž razantně posílené. Bez diskuze asi jde o tzv. „velké“ či „široké“ jádro, které by mělo výrazně navýšit IPC procesoru. Možná ne nepodobně tomu, jak zvedlo výkon jádro Zen v procesorech AMD.

Výrazně širší architektura

Informace o architektuře jádra Exynos M3 se nyní dostaly na svět skrze překladače GCC a LLVM, kam Samsung přispívá a nyní zaslal model jádra. Podle toho se inženýři Samsungu „rozšoupli“ prakticky ve všech ohledech. Již na počátku ve „frontendu“ je o 50 % zvýšena kapacita dekódování. Zatímco Exynos M1 a M2 měly čtyři dekodéry, M3 přidává dva další a umožňuje tedy dekódovat šest instrukcí za takt. Takto mimochodem začínala i cesta velkých jader Apple.

Ještě radikálněji Samsung zvětšil tzv. reorder buffer, což je fronta, v které se přeorganizovává pořadí instrukcí pro provádění instrukcí mimo původní pořadí (out-of-order). Čím větší tato fronta je, tím větší „okno“ má procesor pro přehazování operací a tím více může kód zoptimalizovat, čímž out-of-order CPU zvyšuje svůj výkon. Někdy se mluví o „vyextrahování“ příležitosti k paralelnímu zpracování instrukcí ve výpočetních jednotkách jádra. Exynos M3 má reorder buffer o velikosti 228 položek, což je zvětšení více na dvojnásobek (Exynos M1 a M2 má jen 96 položek). Mimochodem by mělo jít o srovnatelnou hodnotu jako u jádra Skylake, pro které Intel uvádí velikost „out-of-order window“ jako 224 položek.

Popis architektury Exynos M3 v patchích pro LLVM
Popis architektury Exynos M3 v patchích pro LLVM

Více ALU

Procesor má také větší počet pipeline v samotné vykonávací části, i když zde na první pohled není navýšení tak razantní, pipeline je dvanáct místo devíti v předchozích návrzích. Ovšem dopad by měl být značný, Samsung posílil ALU, FPU i load/store. U celočíselné části má jádro dvě jednoduché ALU pipeline, což zůstává beze změn. Pro složitější operace jako násobení jsou přítomné dvě komplexní ALU, které zvládají i jednochudé instrukce, takže celkově jsou ALU čtyři (v Exynosu M1/M2 byly jen dvě jednoduché a jedna komplexní, tudíž výpočetních zdrojů je podle operace o 33 % nebo o 100 % víc). Posílena je také celočíselná dělička, dělení se zrychlilo ze 21 na 12 cyklů.

Operace s pamětí (cache) budou také mít lepší výkon. Dříve Samsung používal kombinaci jedné jednotky pro načítání (load) a jedné pro ukládání (store). Exynos M3 ponechává jednu store pipeline, ale pipeline load jsou dvě, takže čtecích operací lze provádět dvojnásobek za cyklus. Jednotky pro větvení zůstávají dvě. Jednotlivé pipeline v celočíselné a load/store části mají zřejmě oddělené schedulery, zatímco jednotka FPU, která zpracovává i SIMD instrukce Neon, je částečně oddělená a má vlastní unifikovaný scheduler. Prakticky stejně je to i v jádru Zen od AMD.

Schéma jádra Exynos M3 s šířkami jednotlivých fází vykonávání, sestavené webem AnandTech
Schéma jádra Exynos M3 s šířkami jednotlivých fází vykonávání, sestavené webem AnandTech

Výkonnější FPU

Právě FPU možná Samsung posílil nejvíce. Jádra Exynos M1 a M2 měla dvě pipeline pro floating point a SIMD instrukce, Exynos M3 přidává třetí. Pro jednoduché operace to znamená 50% navýšení dostupných prostředků. Ovšem dříve byla propustnost pro některé instrukce jen jedna operace za cyklus, kdežto nyní mají všechny tři pipeline provádět SIMD součty i násobení, takže u těchto operací se kapacita zvedla o 200 %. Toto výrazně zvyšuje výkon například pro multimédia (bude se hodit k dekódování videa ve formátu AV1, pro které zatím nejsou vyhrazené akcelerátory). Výkon dál podpoří to, že latence sčítání/odčítání byly sníženy ze tří na dva cykly (násobení má latenci čtyři cykly). Latence byla snížena také u floating-point dělení (z 15 na 12 cyklů). Výkon kryptografie AES má být nyní dvojnásobný, provádí ji dvě ze tří pipeline, SHA umí stále jen jedna.

Delší pipeline, vyšší spotřeba?

Exynos M3 má také hlubší pipeline, než užší jádra Cortex. Zatímco ta by měla mít 11 stupňů a předchozí jádra Exynos 13 stupňů, Exynos M3 obnáší ještě o dva stupně více. To na jednu stranu znamená, že chybně odhadnuté větvení má větší výkonnostní postih, na stranu druhou ale hlubší pipelining umožňuje vyšší frekvence. Připomeňme, že Exynos 9810 má údajně dosahovat takt až 2,9 GHz. Architektura ale určitě bude mít další optimalizované generace, u kterých nejspíš vyškáluje výš. Prediktor větvení byl údajně také vylepšen, což je ale něco, co se děje prakticky u každé nové architektury procesoru.

Samsung Exynos 9 Series 9810
Samsung Exynos 9 Series 9810

Některé další změny, jako možné optimalizace zefektivňující použití dostupných prostředků či konfigurace pamětí cache zatím neznáme. Tato zlepšení mohou v součtu také zlepšovat výkon. I čistě z rozmnožení výpočetních jednotek a „rozšíření“ jádra se ale zdá, že zvýšení IPC třeba i někde okolo 50 % by skutečně mohlo být na stole. Ono dvojnásobné zlepšení výkonu v jednom vlákně je pravděpodobně realizovatelné. Zvýšením taktu z 2,3 u předchozího SoC na 2,9 GHz dodává teoretické zrychlení o 26 % a Samsung by pak potřeboval ještě 60% zvýšení IPC. Onen dvojnásobek asi bude platit pro úlohy, kde se bude Exynosu M3 dařit nadprůměrně, jak už to v marketingu chodí, ale obecně řečeno toto jádro rozhodně bude velmi rychlé. A Samsung pravděpodobně na tento začátek bude dále navazovat, takže v budoucnu lze čekat ještě výkonnější architektury.

Kromě výkonu ovšem rozšiřování jádra může zvyšovat spotřebu. Energetická efektivita pravděpodobně nestoupne stejně jako samotné IPC. Je pravděpodobné, že třeba při jednovláknovém boostu bude Exynos M3 mít vyšší spotřebu než starší jádra, Cortexy, nebo třeba jádra Kryo v co do spotřeby dost podařeném Snapdragonu 835. Při zátěži všech jader kvůli tomu možná SoC bude muset běžet na o něco nižších taktech než „malá jádra“. IPC by to stále mělo vynahrazovat, nicméně to znamená, že nárůst vícevláknového výkonu asi nebude tak razantní, jako u jednovláknového.

Rychlé procesory Samsungu se možná ukáží i v mobilech jiných firem

Působištěm Exynosů byly tradičně mobily Samsungu, takže na první pohled by se ve světě Androidu nezměnila situace tolik – podobně jako u platformy Apple by tyto rychlé procesory byly dostupné jen v mobilu jedné firmy. Ovšem svítají naděje, že by tomu tak být nemuselo. Podle zprávy webu DigiTimes údajně Samsung plánuje Exynosy začít prodávat ve větší míře i jiným výrobcům telefonů. Cílem je rozšířit si tržní záběr a příjmy. Samsung by tedy teoreticky mohl v některých telefonech nahradit čipy MediaTek nebo i Qualcomm. Právě Exynos 9810 by se svým vysokým výkonem v jednom vlákně (a tím i v benchmarcích) mohl být lákadlem, které by řadu firem mohlo přesvědčit k změně dodavatele. A tím by se tato silná jádra mohla v ekosystému Androidu stát častějším zjevem.

Ohodnoťte tento článek!

16 KOMENTÁŘE

  1. Nejasal bych, Exynos prakticky vylucuje customROM a velmi ztezuje root. Dneska se da slusne provozovat jen Snapdragon (root a LineageOS), to znamena, ze mate sance telefon pouzivat vic nez dva roky na aktualnim Androidu nebo aspon s opravenyma bezpecnostnima chybama, coz u Exynosu nehrozi.

    • A že všechny Exynos verze Samsung telefonů a tabletů disponují custom ROMy a Lineage podporou budeme ignorovat? 😀
      Zlatý Exynos proti Snapdragonům – pro jejich mírně vyšší (někdy i více vyšší) poměr výkon / spotřeba.

    • Ono, toto je pořád jiná kategorie než desktopové CPU, takže jde nejvíc o pokrok pro smartphony, přesto kategorie nízkopříkonových 5-6W CPU pro konvertibilní notebooky a „ultrabooky“ je při takovémto vývoji na dosah.
      Přesto myslím, že zatím např. ty notebooky se Snapdragonem nebudou mít moc úspěch. A i do budoucna ta překážka s x86 aplikacema jen tak nezmizí, na druhou stranu pro řešení ve stylu chromebooků to může být dost blízká budoucnost.

      Já osobně ARMu v noteboocích (a nedej bože v desktopech) vůbec nefandím. Takže doufám, že AMD s Intelem dotlačí současná konkurence k rychlejšímu vývoji a nenechají ARMová řešení aby jim šlapala na paty ve výsostně X86 vodách (a přál bych si, aby do x86 pokusila vlétnout Nvidia, ale to je asi nereálné).

      • x86 respektive x86-64 je svazane patentama, ktere Intel a AMD sdili, nikdo jiny nema sanci.

        ARM tvrde stiha predevsim Intel v jejich Atomove rade notasu. Ovsem vykon Atomu je tak tragicky, ze je to nepouzitelne tak jako tak. Na Core i-U a na RyZen Mobile se ARM absolutne necape. Taky si myslim, ze ty ARM notasy neuspejou teda mimo chromaky, ktery jsou dobry leda jako hracka pro deti.

        • Všudypřítomnost SF (pro řadu lidí často jejich první osobní počítač) dá vyrůst generacím pro které při jejich stylu využití nemusí být Android/iOS chápán jako omezující (svět PC/NTB) jim bude cizí/vzdálený. Náročné úlohy zpracování může převzít časem cloud, poskytující pro dané činnosti násobně více výkonu než průměrný NTB/PC. Rozvoj komunikací pak může setřít rozdíl mezi lokálním/vzdáleným zpracováním.

          • S tím docela souhlasím.
            Můj (čistě osobní) odhad je takový, že se postupně notebooky jako takové rozdělí, v poměrně dohledné budoucnosti, na dvě výrazně odlišné skupiny.

            První zůstane věrná klasickému desktopovému prostředí s plnou verzí Windows. Hlavními zástupci budou herní notebooky, pracovní stanice a korporátní třída notebooků vedená ThinkPady a třeba Delly. Určitě v této skupině budou i třeba nějaká 2in1, a podobná zažízení, ale spíše vyjímečně, a kdo bude chtít takovýto notebook v mainstreamové cenové skupině, bude mít asi postupně o dost menší výběr, než dnes. Nedivil bych se vyšším příplatkům za ony plné Winy…

            Druhá skupina přejde na systémy ve stylu Chrome OS, nebo Win 10 S, které se sice v tuto chvíli zásadně liší, ale směr vývoje je stejný. Vymizení desktopového prostředí a „svobodné instalace čehokoli“, přechod buď na výhradě prohlížečové prostředí, což je cesta Chrombooků a vzhledem k rozvíjejícím se možnostem prohlížečů, cloudu, atd, nemusí být vůbec slepá. A nebo „applovská“ cesta Win 10 S a směřování do Storu a omezeného, ale „blbuvzdorného“ prostředí. Nevím za jak dlouho, ale jsem názoru, že toto se v budoucnu stane klasickým mainstreamem pro mnoho lidí a zde právě mají šanci se prosadit i ARMové procesory.

            A přesně jak píšete, toto asi bude cesta „smarphonových generací“, kdy děti dnes umí s mobilem, nebo tabletem daleko dříve než dostanou do ruky myš.
            Já jsem vyrůstal na Win 95 a 98, standartní desktopové prostředí je pro mě něco úplně základního. A ač jsem pořád mladší generace a o IT svět se zajímám od mala, jsem asi v tomto docela staromódní, protože jsem i po letech nepřišel smartphonům nijak zvlášť na chuť. Kromě funkce „mobil“ mi smartphone slouží prakticky jen jako nouzový internetový prohlížeč (častě stejně jen wi-fi hotspot pro notebook) a mobilní appky mě moc nechytly. Takže v tomto jsem „stará škola“, všude možně tahám klasický notebook, když chci fotit vytáhnu zrcadlovku, tablet ani 2in1 nemám a neplánuji kupovat.

          • Právě tam bych si hrozně přál, aby s VIA nějaký větší hráč spolupracoval (hlavně financoval) a Nvidia by se nabízela (případně možnost dostat tudy k patentům), ale jak říkám, asi spíš nepravděpodobné.
            Pokud bude VIA sama bez velkého investora, tak to budou mít hodně těžké, ale fandím jim 🙂

          • Nezapomnel jsem, proste je ignoruju do doby nez s necim skutecne vybehnou ven. Ja tomu, ze mse muzou vratit proste neverim, mohou prekonat vykon/spotreba Atomu, ale tezko se chytnou proti klasice CoffeeLake nebo RyZen.

          • Nuž tak veľkého investora už získali, ZHAOXIN .
            V podstate už rada KX-5000 bola vydaná( up to 8C@2Ghz,DDR4,PCI-E 3.0 x16) a na 2019 plánujú 8C@3Ghz a podľa ich vlastný slov sa majú dotiahnuť na AMD Zen :)) Či o bude pravda alebo len zbožné prianie uvidíme ale vzostup je jasný a ja im fandím.

      • Koukal jste se na ten obrazek z anandtechu? Pokud ano, pak zjistite, ze se M3 naramne podoba treba Intel Sandy Bridge. A SB neni tak spatny svab. IIRC moderni intel zvetsil sirku ze 6 na 8. Ohledne sirky je tedy M3 v pohode, otazka je jak to bude s vyspelosti pametoveho systemu, cachi a branch prediction. Pokud bude dobry, nevidim duvod proc by nemohl jit i na desktop.

        • Sám víte, že to není tak jednoduché.
          Před reálnými testy se nedá mluvit o vyspělosti oné architektury ve smyslu, že by třeba byla třeba alespoň teoreticky použitelná pro vysokopříkonové procesory, s příkonem po OC přes 100W, to je jiná liga a ta architektura není ani pro tento účel vytvářena.
          A i pokud by ona architektura skutečně takto použitelná byla, představit si PC hry nebo některé desktopové aplikace na ARMu, je v tuto chvíli docela sci-fi kvůli samotné x86 instrukční sadě, na kterou je toho příliš mnoho vázáno.