Test Rocket Lake a AVX-512: jak ho zapnout v x265 a jaký je výkon a spotřeba?

50
intel rocket lake avx 512 x265
intel rocket lake avx 512 x265
-
Zdroj: Foto HWCooling.net, koláž Cnews.cz

Podívali jsme se na to, jak moc pomáhá u procesorů Rocket Lake jejich podpora AVX-512, když enkódujete video. Věděli jste, že x265 ve výchozím stavu AVX-512 vůbec nepoužívá? Ukážeme si, jak ho zapnout, co vám to získá a jak to zamává se spotřebou (a teplotami).

Nová 11. generace procesorů Intel Core Rocket Lake přinesla do mainstreamového desktopu jako novinku také instrukce AVX-512, které předtím byly jenom ve Xeonech a na platformě X299. Jednou z věcí, kde AVX-512 slibuje lepší výkon, jsou multimédia. Podívali jsme se na jedno využití: enkódování HEVC videa v x265. Možná to nevíte, ale x265 ve výchozím nastavení AVX-512 nevyužívá. Ukážeme si, jak ho zapnout a co to udělá.

Běžné testy enkódování v x265 na procesorech Rocket Lake už máme v našich testech, kde testujeme v HandBrake s defaultním nastavením, což dělá množství webů. U procesorů s AVX-512 ale je ten problém, že od doby, kdy byly do x265 optimalizace pro instrukce AVX-512 přidané (2018), je program nemá ve výchozím nastavení aktivní. Když tedy HandBrake nebo i přímo x265 pustíte jen tak, nepoužijí se a ani Rocket Lake z nich neprofituje, používá jenom AVX2 (a nějaké další instrukce jako BMI2, AVX a samozřejmě různé verze SSE).

Můžete si to ověřit v logu, kde x265 udává informaci „using cpu capabilities“ s výčtem instrukčních rozšíření, které program použije. Na Rocket Lake by měl ve výchozím nastavení vypadat takto:

x265 [info]: using cpu capabilities: MMX2 SSE2Fast LZCNT SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2

Proč x265 nepoužívá AVX-512 samo od sebe? Je to proto, že tyto optimalizace pokrývají jen některé operace enkodéru a ve výsledku je zrychlení v FPS relativně nízké – nečekejte nic zdaleka blízkého 100% zrychlení, které by teoreticky mohl 2× širší SIMD vektor dosáhnout v izolovaných operacích. Současně se zpracováním 2× více hodnot v jedné instrukci ale také AVX-512 zvyšuje spotřebu. Proto Xeony při použití těchto instrukcí snižují takty, což má dopad na výkonnostní zrychlení, které lze dosáhnout.

Když se do x265 tyto optimalizace dostaly, zjistilo se, že na Xeonech nezvýší výkon o tolik, o kolik se sníží frekvence. A kvůli tomu proto bylo rozhodnuto nechat je ve výchozím stavu vypnuté – x265 je tedy nepoužije, dokud to nasilu nepovolíte (můžete si o tom přečíst zde). A zdá se, že toto nastavení od té doby přetrvalo. Vývojáři doporučovali zapnout AVX-512 tehdy, když například enkódujete 4K s velmi pomalými nastaveními. Ovšem pokud váš procesor je přetaktovaný na pevnou frekvenci nebo z jiného důvodu takty při AVX-512 nesnižuje, měli byste obecně zaznamenat zrychlení. Toto by snad měl být i případ procesorů Rocket Lake, které by aspoň na Z590 deskách měly držet takty vysoko i při AVX-512.

Jak AVX-512 zapnout?

Použití AVX-512 se zapíná parametrem ‑‑asm avx512. Ten použijte, pokud spouštíte přímo x265.exe. Pokud ale používáte nějaké GUI nebo frontend, musíte zjisti, jak se z něj tento parametr dá x265 předat.

V HandBrake se to dělá v nastaveních Video enkodéru – zvolíte x265 a dole v poli „Advanced Options“ můžete vidět parametry pro příkazovou řádku, které se x265 předávají. Už by jich tam pár mělo být. Vy musíte udělat to, že na konec přidáte dvojtečku (bez mezer), která odděluje jednotlivé parametry, a za to přidáte „asm=avx512“. Bez uvozovek, viz obrázek.

Zapnutí AVX 512 u x265 v Handbrake
Zapnutí AVX 512 u x265 v Handbrake (Zdroj: Cnews.cz)

Po tomto už by pohled do logu měl ukazovat, že se x265 používá i AVX-512. Řádek o insturkčních rozšířeních by měl říkat toto:

x265 [info]: using cpu capabilities: MMX2 SSE2Fast LZCNT SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2 AVX512

Když spustíte Handbrake jednou s touto možností přidanou a jednou bez ní, zjistíte, jak moc Rocket Lake z AVX-512 dokáže profitovat při enkódování HEVC přes x265.

Jak můžete vidět, u modelů Rocket Lake, na nichž jsme toto zkoušeli, AVX-512 navýšilo výkon v našem enkódovacím testu o +7,5 %. Trošku výš ustřelilo Core i5-11400F, kde bylo zrychlení o 9 %. Podle toho, co tvrdí dokumentace, by možná přínos mohl být o něco lepší na úplně nejpomalejších presetech. 512bitové vektorové operace mají tedy v enkódování programem x265 relativně omezený účinek, zdaleka nedochází k lineárnímu navýšení výkonu proti 256bitovým vektorům (AVX2).

Proč tomu tak je? AVX-512 je používáno v různých funkcích s ručně napsaným SIMD kódem, které provádějí analýzu pro potřeby intra a inter predikce, ale ne vždy tato analýza probíhá na tak velkých blocích dat, aby se dal větší vektor účinně využít. Navíc se často nezrychlí 2× celá funkce, ale jen nějaké její kroky. Moderní video komprese se neskládá z výpočtů s jednoduchou strukturou, které by škálovaly s počtem vláken a šířkou SIMD  do alelujá. Obecně by v těchto SIMD funkcích mělo x265 strávit okolo poloviny času, zbytek je kód v C++, bez ručního asembléru (například entropy coding), který AVX-512 nemá jak zrychlit. Ačkoliv tedy jednotlivé instrukce AVX-512 mají dvojnásobný výpočetní výkon na jeden cyklus procesoru (100% nárůst výkonu), po všech těchto ředěních vám zbude tento zisk okolo 10 %.

Toto ovšem v této oblasti softwaru není nic, nad čím by se dalo mávnout rukou. Jak si můžete všimnout v interaktivním grafu, zatímco osmijádrová Core i7 a i9 generace Rocket Lake obecně nejsou schopná se v mnohovláknovém výkonu vyrovnat desetijádrovému o generaci staršímu Comet Lake Core i9-10900K, tak AVX-512 toto mění a v x265 najednou dokáží osmijádra výkon staršího desetijádra dorovnat. Na Ryzen 9 5900X to už ale zdaleka nestačí, víc jader v jeho případě je větší výhoda, než AVX-512 na menším počtu.

x265 encoding avx 512 on vs off g4
Průběh spotřeby procesorů během enkódování v x265 (Zdroj: Cnews.cz/HWcooling.net)

Výkon navíc má ovšem ten háček, že ještě víc poskočila nahoru spotřeba. Bohužel nám z měření vyšlo, že její navýšení je neúměrně velké, se zapnutým AVX-512 stoupl příkon o 28 % (u Core i7-11700KF) nebo dokonce o 29 % (i9-11900K). A to přitom spotřeba při enkódování v x265 už tak nebyla nějak nízká. AVX-512 ji ale z 215–225 W dostane na cca. 270–290 W. Core i5-11400F mělo celkově spotřeby výrazně nižší, ale nárůst je také velký, ze 123 W na 159 W, což je dokonce o 30 %. Toto jsou pravda čísla na 12V kabelu, v nichž je nejen spotřeba CPU, ale ještě ztráta na napájecí kaskádě, která vznikne při krmení procesoru. Tato ztráta snad ale v našich testech nebude moc významná, používáme desky s hodně naddimenzovaným napájením, kde by měla být dobrá efektivita konverze elektřiny (tj. menší tepelné ztráty).

Spálená elektřina a teplo nutné uchladit je to ovšem tak jako tak. Také je pikantní, že Rocket Lake zde dosáhlo spotřeby, která je 2× proti Ryzenům 9 5900X a 5950X. Na tom se potvrzuje problém horší efektivity 14nm procesu, který třeba testování ve hrách milosrdně skrývá.

Každopádně výsledek je, že zapnutí AVX-512 na procesorech Rocket Lake zhoršuje v x265 jejich energetickou efektivitu, a to ne úplně málo, o nějakých 20 % (pokud by se zahrnula spotřeba disků, desky a RAM, tak by to nicméně vyšlo méně zle). Stejné enkódování tedy budete mít hotové o něco rychleji, ale spotřebujete víc elektřiny. Také při tom samozřejmě můžete působit víc hluku z chlazení, pokud tedy už i bez AVX-512 větráky nejely na 100 %.

Toto zhoršení energetické efektivity neplatí ale paušálně. Pokud by aplikace měla třeba 50% nárůst výkonu (což se u nějakých numerických výpočtů stát může) pak by se energetická efektivita i s takovýmto nárůstem spotřeby zlepšila.

Teploty Rocket Lake při enkódování také nejsou zrovna nízké, v našem testu zapnutí AVX-512 zvedlo teplotu o 16–17°C, procesory i7 a i9 se dostaly na 93–95°C. Je možné, že v některých skříních, pokud nemáte airflow řešený ideálně, by se CPU mohla přehřát a throttlovat.


Co je docela pozoruhodné, jsou frekvence. Dost možná to jde na účet i tomu, že výrobce desky agresivně nastavuje BIOS, ale procesory Rocket Lake přes vysoké teploty vůbec nesnižovaly frekvence, když jsme v x265 instrukce AVX-512 používali. Programátoři budou mít radost, protože už nemusí hlídat, zda AVX-512 zvýší výkon dost na to, aby se tento efekt zcela neztratil nebo dokonce nepřevážil snížením taktů, což je asi nejvíce kritizovaná věc na dosavadních implementacích AVX-512 od Intelu. U Rocket Lake to minimálně v našem testu nenastávalo (i když na jiných deskách, třeba v OEM počítačích, by to možná dopadlo jinak, pokud by se zohledňovaly limity PL1, PL2 a Tau, tak by se asi hodně změnily podmínky). Core i7-11700KF se drželo taktu 4,6 GHz na všech jádrech bez AVX-512 i s ním a Core i9-11900K jelo také bez ohledu na AVX-512 na svých all-core maximech, tedy 4,7 GHz. Totéž Core i5-11400F: také jelo na stejném maximálním all-core boostu 4,2 GHz, ať se dělo, co se dělo.

Na násobičích se tedy spotřeba a tepelná zátěž navíc neprojevila a těch 7,5 % výkonu navíc, které jsme naměřili, je tedy výkonnostní zlepšení při identickém taktu.

To je nicméně také důvod těch vysokých spotřeb, původní architektonický záměr u AVX-512 se snížením násobiče/frekvence (a díky tomu napětí) asi počítá, právě kvůli energetické efektivitě (akorát jsou na tom pak bity aplikace s malým nárůstem výkonu).

Dilema spotřeba × výkon

Pokud tedy na procesoru Rocket Lake budete enkódovat s x265, vzniká trošku dilema, zda upřednostňovat o něco vyšší rychlost za cenu tohoto zhoršení spotřeby a efektivity. Pro řadu z vás to asi ale může být akceptovatelné. Ostatně, k něčemu podobnému dochází při přetaktování, také obvykle získáte nějaká procenta výkonu, ale spotřeba se zhorší o dost víc, než jaké je zrychlení.

Pokud vám tedy při enkódování ale bude chladič moc hučet, nebo to chcete raději pomaleji, ale s menší spálenou energií, pak můžete AVX-512 samozřejmě nechat vypnuté.

Zapnutí/vypnutí AVX-512 v x264

Všechno zde napsané jinak asi platí i pro x264, kde naše testy také u Rocket Lake zaznamenaly dost vysokou spotřebu, zřejmě také s přispěním energetické náročnosti 14nm implementace AVX-512 v kombinaci s nesnižovanými frekvencemi. U x264 jsme ale neměřili, kolik výkonu AVX-512 přidává. Mohlo by to být trochu víc než u x265, ale zrychlení nejspíš pořád nebude větší než nějakých 10, maximálně 15 %.

Rozdíl proti x265 je, že v x264 se AVX-512 používá vždy automaticky. Výkon i spotřebu navíc tedy už máte zahrnutou v defaultním nastavení. Pokud enkódování s x264 chcete trošku umravnit co do spotřeby a nevadí vám, že to bude trošku pomalejší, můžete zkusit obrácený postup, tedy avx-512 ručně vypnout.

Parametr je stejný, a to ‑‑asm, ovšem tentokrát napíšete ‑‑asm AVX2. Tím omezíte používaná SIMD rozšíření na všechna až po AVX2. AVX-512 je tímto vyloučeno (parametry víceméně funguje tak, že udává nejvyšší rozšíření, které může program použít, a AVX512 je vyšší než AVX2). Pokud používáte Handbrake, je to podobné – udělejte totéž, jako v návodu na zapnutí AVX-512, ale zde přidáváte ne asm=AVX512, ale asm=AVX2.


Ještě jedna poznámka: při našem testování se s Handbrake dělá zvláštní věc – po připsání parametru asm=avx512 se nám zvýšení výkonu nechtělo projevit, dokud jsme aplikaci po jeho přidání nerestartovali a naopak (po znovuspuštění aplikace se výkon a spotřeba vždy zvýšily). Nedává to moc smysl, protože x265 by mělo dostat parametr hned i bez potřeby zrestartovat Handbrake, ale upozorňujeme na to, pokud by se tato anomálie děla i vám. Může jít o nějaký bug v Handbrake (problém jsme měli, když jsme přepínali mezi výchozím profilem pro x265 a upravenou verzí s přidaným parametrem asm=avx512).

Procesor Rocket Lake, Intel Core i9-11700KF. Jeden z modelů, kde můžete s AVX-512 experimentovat, nebo třeba vyvíjet software (Zdroj: HWCooling.net)

Bude Sapphire Rapids-X/Skylake-X mít lepší zrychlení?

Jak asi také víte, pokud se o AVX-512 zajímáte, Rocket Lake (nebo třeba také Tiger Lake v noteboocích) nemá implementaci AVX-512 s plnou rychlostí, na rozdíl od serverových procesorů a CPU pro platformu X299. Neměřili jsme teď, jaké přinese AVX-512 zrychlení na platformě X299, ale nemuselo by být o moc větší zlepšení výkonu.

Ona pomalejší verze AVX-512 v klientských procesorech se totiž od té plnotučné v serverových Intelech neliší zas tak moc. Serverová CPU mají navíc jednu 512bitovou jednotku FMA, takže instrukce FMA mohou vykonávat s dvakrát vyšším výkonem proti AVX2, zatímco klientská verze používá jen již existující 256bitové jednotky FMA (které má už i obyčejné Skylake) a má v těchto operacích poloviční výkon.

Ale tento rozdíl se týká zřejmě jen floating-point operací FMA, které mají význam třeba pro vědecké výpočty. Video enkodéry a další multimediální software jako x265 by měly typicky používat operace s celočíselnými daty a v těch má omezená klientské verze AVX-512 stejně vysoký výkon jako serverová, operace jako 512bitové sčítání integerů umí tři nebo čtyři za cyklus. Tudíž i tato klientská verze AVX-512 v x265 získává lepší výkon a naopak, od té serverové nemůžete čekat o moc víc, protože pro celočíselné operace prostředky navíc nemá (tedy s výjimkou větší L2 cache).

Ovšem příští generace architektury Intelu mohou samozřejmě zisky z AVX-512 zvýšit.

Má pro vás smysl používat AVX-512, i když je nárůst výkonu výrazně menší, než nárůst spotřeby?

Test Rocket Lake a AVX-512: jak ho zapnout v x265 a jaký je výkon a spotřeba?
Ohodnoťte tento článek!
4.6 (92.63%) 19 hlasů

50 KOMENTÁŘE

  1. Tu zvýšenou spotřebu by člověk tolik neřešil, kdyby Intel nežral moc už v základu.

    A zvýšení o <10% ve velmi specifických operacích je špatný vtip s ohledem na to, jak moc Intel AVX-512 propagoval proti AMD v marketingu.

  2. Z těch grafů hlavně vyplývá, že je nejlepší koupit na podobnou práci AMD a ne Intel. Konkrétně Ryzen 9 5950x je i pŕes absenci avx-512 mnohem rychlejší než i9 se zapnutým AVX-512 a spotřebu má přitom nižší než ta i5 s avx-512. Škoda, že v anketě tahle moznost chybí.

    • k té tvé poslední … druhá možnost v ankete
      k té tvé první … na tohle nepotřebuješ grafy, každý ví … otázka je, co je ta „podobná práce“ … pokud člověk nedělá nic, než enkódování, voba je jasná, pokud enkóduje hodinu do týdne, je to podobná práce, ale jen hodinu týdně …

  3. Zajimavy clanek. avx512 bych nezatracoval, preci jen intel se svym rucne optimalizovanym asemblerem dokaze hodne, viz 32 particle movement benchmark s AVX: https://www.anandtech.com/bench/product/2787?vs=2675

    Procaky v porovnani:
    Intel Core i9-11900K (8C/16T, 125W, $539) – (Rocket Lake) 3.5G Base, 5.3G Turbo
    AMD Ryzen 7 5800X (8C/16T, 105W, $449) – 3.8G Base, 4.7G Turbo

    Vysledek:
    intel: 32211
    amd: 5624

    protoze ale zdrojaky nejsou k dispozici clovek si nemuze overit zdali avx2 kod neni prilis pesimisticky (neoptimalizovany).

    • Tenhle test AnandTechu (3DPM 2.1 AVX2/AVX-512) je anomálie a pokud můžu říct, je to asi problém softwaru.
      Myslím, že se tam naráží na to, že kód používá nějakou operaci, na kterou má AVX-512 speciální instrukci, která v AVX2 není. Má to snad být nějaká 64bitová konverze mezi INT a FP, jestli si dobře pamatuju, ale nějak se mi nedaří to doheldat. A celý ten výkonnostní rozdíl dělá snad jediná tahle operace. Takže by to byl spíš mikrobenchmark (a zůstává ta otázka, jestli je správně napsaný).

      Ian Cutress říká, že to někdo ručně optimalizoval, i když to podle těch výsledků úplně nevypadá. IMHO by nejspíš ta operace šla ručně rozepsat na kód v AVX2/AVX/SSE* a pak by rozdíl byl maximálně 2-3×.*

      Je dobré pamatovat, že to není nějaký software, který by se normálně používal, ale diplomka autora/redaktora, do které byl potom přidaný ten kód AVX-512 a AVX2 někým jiným. Je hodně otázka, jestli to do testování patří. Normálně by tenhle aspekt nevadil, ale v kombinaci s tím, jak se to chová…

      Jako příklad: AnandTech to použil k porovnání jader Skylake a Cannon Lake a vyšlo mu, že je Cannon Lake třicetpětkár rychlejší: https://images.anandtech.com/graphs/graph13405/105622.png

      Je pravda, že to pořád ukazuje výkon té jedné specifické operace (pokud tedy není ta větev kódu, kterou to používá na procesorech bez AVX-512, špatně napsaná). Ale v programech, které budete používat, tohle zrychlení nikdy neuvidíte.

      ——————————————-
      Rozhodně jinak souhlasím s tím, že se AVX-512 nemá zatracovat.
      Doufám, že bude brzo ve víc procesorech než teď (AMD snad v Zen 4, i když tam to ještě nemusí mít ideální výkon, spíš to asi poběží stejně rychle jako s AVX2 – no teda kromě toho 3DPM, tak asi taky bude lol výsledek jako na Intelu). Protože jako užitečné rozšíření to určitě je, AVX-512 zase rozšíří možnosti optimalizace aplikací a je proto třeba, aby bylo v co největší základně procesorů a vývojáři měli motivaci to používat.
      Jen teda podle tohohle benchmarku se neorientujte 🙂

      Pokud chcete test, který ukazuje přínos AVX-512 víc realisticky, tak bych navrhoval yCruncher v jednom vlákně, kde je vidět, že AVX-512 dosahuje výrazně lepší výkon, než má jádro Zen 3 nebo Skylake bez AVX-512 (v multithreadu už to zdá se moc vidět není, asi proto, že výkon procesoru je pak omezený propustností paměti, a tudíž se už zrychlení nemá šanci projevit?).
      Viz https://www.cnews.cz/test-amd-ryzen-9-5950x-32vlaknovy-procesor-na-ktery-intel-nema-odpoved/32/ (druhý graf, „single threading“)

      *
      Třeba v x264/x265 myslím takovýhle případ, že by neexistence nějaké instrukce v předchozích procesorech vedle k podobným průlomovým zlepšením, nikdy nenastal (taková ta 2-3x zrychlení *dílčích funkcí* jo, ale pak to ve výsledku dá pár až několikprocent). Tohle spíš připomíná jiný případ. Když zkusíte spustit x265 a procesoru, který má jenom SSE2 a chybí mu SSE4, tak tam bývalo a nejspíš pořád je asi 3-4× zpomalení proti tomu, jaký by ten procesor měl zhruba mít výkon. A je to proto, že hodně SIMD assembleru je napsaná s předpokladem, že má CPU minimálně SSE4, takže se na CPU bez SSE4 nespustí a běžíte jenom s C++ kódem. x264 tohle nedělá protože je starší a všechny SIMD funkce jsou pokryté i pro procesory s SSE2.

  4. Super clanek a test, diky!
    Jinak se tak nejak ukazuje, ze mistni odbornik na kodeky a encodovani videa se malinko spletl. Takhle to ted vypada, ze Raketa neni uplne raketa ve vykonu, zatimco v prikonu doslovne – a to prave v jim vyzdvyhovanem pripadu – video encodingu. Ale mozna zase autor testu udelal chybu, ze netestoval Intel CPU na 5,3 all-core 😉 Mam ale spis pocit, ze mistr CeKacko 53 se ted sam schovava v garazi, kterou tu stale castuje jine 😀

      • To IMHO není pravda, jenom je to kombinace toho, že

        a) x265 má jen omezené zrychlení, i když těch +8-9 % výkonu podle mě s přihlédnutím k tomu charakteru kódu taky není málo (a z části to může být i tím, že AVX-512 nemusí být použité úplně všude, kde by se to při maximálně brutální optimalizace dalo udělat)

        b) implementace Intelu na 14nm procesu. Ten procesor prostě příliš žere a Intel ho nechává běžet na neoptimálních frekvencích a napětích.

        Myslím, že na 10 nm, tj. Ice Lake-SP (třeba těch Xeonech W-3300) a na Tiger Lake by ta efektivita mohla dopadnout už o dost líp.

        Jinak co tak vidím, tak lidi, co se věnují optimalizování kódu na procesorech x86, mají prakticky vždycky nebo ve velké většině případů AVX-512 rádi a chtějí ho.

        • Upřímně řečeno, nedokážu si představit reálnou situaci, kdy se vyplatí nést náklady nižší frekvence a zároveň vysokého hrubého příkonu výměnou za dostupné AVX-512 instrukce (tím netvrdím, že nic takového neexistuje, ale já jsem poctivě hledal, a takový scénář nenašel. Nejvíc co se blíží, je právě ten Handbrake)

          Další věc je, že AVX-512 podporují jen Intely, a to ještě ne všechny. A jak jsem už psal – řekněme 10-15% navíc za cenu srovnatelně vyšší spotřeby – to mi připadne jako l’art pour l’art.

    • A kolikrát se ozveš, když tu tupej C.k. Vylhánek blije každodenní dávku hejtovacího hnisu na AMD? To jen napíšeš, že je to vlastně vtipnej troll a ať ho necháme být, ale u trollingu na Intel je to najednou problém..
      Navíc tohle použití dělá z RL opravdu 300W těžko uchladitelný přímotop.. takže posměšky jsou dost na místě.

      • pokud dobře čtu, nikdo Intel na tohle nedoporučuje, takže jaksi nechápu … co se týče CK, kde kdo ho má plnou hubu když tady je, i když tady není … ne jednou jsem se ozval i proti němu, to bys ale musel přes tu rudou vidět …

        • Jednou z 500 jsi se ozval jo? Ale když někdo napíše něco proti Intelu, doslova pokaždé vyletíš jak triggnutý čertík z krabičky…
          Leta jedu spokojeně na Intelu a NV což určitě víš, ale jooo, jsem rudoch, to víš že jo. Místní modrý gerojové totiž kritiku do vlastních řad blbě snáší. 😀

          • kdyby to byl článek o tom, jaká je to bomba, neřeknu ani ň … vůbec nechápu, o čem píšeš … tady(u článků o Intelu, ne jen pod tímhle) to většinou vůbec není o tom, že někdo napíše něco proti intelu, jen nonstop výsmech, je jedno, o čem článek pojednává … víckrát jsem tady psal, že celá „rocket“ paráda je jeden velký zbytečný omyl, snyd kromě posledního 11400f na hraní je zbytek řady zbytečný … nevím, co víc bych k tomu, jako modrý geroj, měl napsat … jakože Intel nasrááááát, nikdy více? Nebo?

            • Ano máš pravdu.. vůbec nechápeš.
              Zjednodušeně: troluje C.k. AMD – nereaguješ, troluje kdokoliv Intel – brečíš v diskusi.

            • mám to chápat jako ty? Troluje ck, brečíš v diskuzi, troluje kdokoliv od amd, nereaguješ … v čem jsme tak jiní?

            • Můj troling je oprávněný, viz 300W 95C a nesmyslná snaha Intelu hnát starý výrobní proces ad absurdum. C.k. píše povětšinou jen naprostý bláboly.

            • troling je „oprávněný“ vždy jen z jednoho důvodu … trolit … žádný jiný důvod není

    • gogo1963 9.8.2021 at 15:16
      Mozna to jako posmesek (ode me) muze znit, ale neni. Ja jsem za Intel rad a to dokonce i v pripade RL. Dokonce jsem uvazoval o porizeni v pripade, ze AMD APU bude nedostupne. Co se tyka toho 5700G, tak bylo za cenu, za kterou bych mohl poridit treba tu i7-10700 i s deskou, jen to iGPU je pouze zobrazovadlo (ja jsem potreboval trochu vic).
      Ode me to byl trochu stouch do vsech tech vylhanych od od otravneho toxickeho CeKacka, ktery tu pel ody na RL a jak jsou tyto CPU bezkonkurencni na encoding a podobne nesmyly. Kdyz je realny vysledek s peknou analyzou venku, tak je zalezly nekde v garazi, kterou tu neustale urazi lidi. Mozna je na dovolene, ale to nic nemeni na trapnosti a lzivosti jeho trapnych prispevku.
      Co se tyka AVX-512, za me je to take rozhodne dobre, jen to uplne neskaluje s prikonem, to bychom se ale obecne mohli bavit o efektivite kdejakeho „top“, „high-end“ produktu, ktery ma vyhnany vykon za cenu nelinearne rostouciho prikonu a ceny (coz v tomto pripade AVX-512 je).
      Ad zast k vyrobci – tohle jde mimo me uplne. Jsou spolecnosti, ktere maji politiku, se kterou se nestotoznuji, nebo treba jen politiku jistych produktu. Jako priklad bych uvedl Nvidii a jejich pristup k opensource ovladacum, resp. jak doslova kaleji na tyto principy. Na druhe strane bych ale na praci nedoporucil nic jineho, nez Nvidia GPU, protoze AMD ovladace jsou neskutecny nefunkcni srot.
      A jeste jedna vec, vas „AMD aristokracie“ (za kterou se ja osobne rozhodne nepovazuji a ani bych nechtel byt spojovany s jakoukoliv firmou typu AMD, Intel, Nvidia) prece nemusi vzrusovat, mate svoji dobre fungujici i7, tak jste v klidku, ne? 🙂

      • pokud vím, ck enkoduje přes nvenc, což není zrovna ideální způsob, ale když mu to vyhovuje … nepamatuji se, že by tady vyvřeskoval něco o tom, jak je AVX512 nej nej … to už má lepčí encod přes quicksync .. možná jsem nečetl všechno …
        … a s tím „vzrušováním“ … no … kdopak tady pod články o cpu-gpu řádí od modrých? CK, Hnízdo, Crha, Gogo, Vlka už to nebaví, nedivím se … občas probleskne někdo navíc, Radek fandí Intelu jen jako akcionář … zbylých 90%, je to vidět třeba i v anketách, je z tábora géniů … schválne to ani nedávám do uvozovek, aby se někdo neurazil …

        • AVX512 mohla byt featura, ktera mohla delat RL aspon trochu zajimavym oproti konkurenci. Evidentne se to moc nepovedlo a zapada to do nepovedeneho obrazu RL CPU jako celku. Oproti CL neni vyjma trochu vyssiho vykonu, zajimavy prakticky v nicem (snad vyjma podpory AV1) a CL jej valcuje i cenou.
          To ze tady CK emental mozna nepel ody presne na RL AVX512 je celkem podruzne. Otravoval tady ise svymi priblblymi nesmyslnymi mentalitami nescetnekrat.

          • Moc nerozumím vašemu povzdechu, že AVX512 mohlo dělat RL zajímavým proti konkurenci. Z čeho usuzujete, že ho to zajímavým nedělá? Z toho, že implementace h.265 ho není schopna pořádně využít? Tak už to u algoritmů chodí, že ne vždy se hodí všechny instrukce či datové typy.
            Z mého pohledu, jako z pohledu bývalého programátora, může být implementace AVX512 zajímavá kvůli psaní programů, které AVX512 budou využívat. Bez procesoru, který to umí, se to programuje dost blbě.
            Jinak na nějaké výpočty RL není. Tam je bez diskuze lepší pořídit si buď 5900x či 5950x nebo ještě něco lepšího ze serverového světa.

            • pokud mi 7,5% vykonu navic, prida uz tak k tragicke spotrebe dalsich 25%..je to velmi nezajimave. Ta veta je vysvetleni samo o sobe. Ale dobre..
              Pokud by tech 7,5% vykonu navic spotrebu nezvysilo, ale snizilo, bylo by to zajimave, pokud by ji zvysilo o 7,5%..da se nad tim aspon zavrit obe oci (vzhledem k uz tak vysoke spotrebe). Ale 7,5->20 je principielne nepouzitelne. Krome toho vyuziti pro H265 je v pricipu jedine, ktere ma pro „plebs“ nejaky smysl. Nejake specialni vedecke nebo jine vypocetni algorytmy, ktere mozna existuji si na tom asi hned tak nekdo poustet nebude.
              Krome toho, to neni asi jediny priklad. Nekde v diskusich na diit, David Jezek hledal vykon AVX512 v nejakem intelackem SW a stalo to take v principu za prd.

            • Radek Holeček, tombomino
              Ja myslim, ze mate pravdu oba, ale take mluvite o malinko necem jinem.
              Moje chapani je, ze Radek mluvi o specializovany instrukcich / funkcich navic, ktere programator muze a nemusi vyuzit. Jak moc efektivni to je ted, potazmo do budoucnosti je jina diskuze. Programatorovi tato funkce treba muze ve specifickem pripade ulehcit zivot nebo dat rozvoj vylepsene implementaci.
              tombo ma zase na mysli efektivitu / realny dopad na BFU, kde v produktu pro desktop ma zapnuti AVX512 horsi vysledek (efektivita), nez bez.
              Za me oba dva validni nazory. Me treba AVX512 v RL tesi (programator nepotrebuje drahy Xeon na uceni se / zkouseni si) a s ohledem na testy je i dobre, ze v standarnim nastaveni je AVX512 vypnute. Takze zrovna toto je pro me + pro Intel.

            • takže pravdu má Radek, nikoliv Tombo … Radek píše o „fičůře“, ne o jejím použití v handbrake s RL, Tombo jen o rocket lake, v podstatě papouškuje, co právě četl v článku (opakovaně) … to není názor 😀 akorát se s nějakým ztotožňuje, ale kompletně mimo pointu …

            • Na co je mi Gogole featura, kterou nema smysl pouzit?
              A jnak k papouskovani a k tomu, co je a neni nazor, se radeji moc nevyjadruj. Mohl by ti narust u toho rovnou zobak..to se tak papouskum nekdy stava..

            • tombo, chtěls dělat chytrého, udělals ze sebe vola … to se taky stává … tobě je ta featura k ničemu, taky ti ji tady nikdo nenabízel, to ti ovšem nebrání plácat kolem toho kraviny třeba i týden v kuse …

            • Tak ja moc necekam, ze moje komentare pochopis Gogo, tudiz mne neprekvapuji ani tvoje neadekvatni mimodelozni reakce.
              Tak zatim se aspon drzis, ale jak dlouho..

            • 😀 nemyslím si, že by byl problém s chápáním tvých komentů … naopak … tvůj problém je, že se k něčemu upneš a pak nevidíš, neslyšíš, jedeš svoje … ale jsou horší věci …

            • gogo1963 10.8.2021 at 13:15
              “takže pravdu má Radek, nikoliv Tombo … “

              Podle me oba maji validni pohled na AVX512. Ten tombuv – Vzpominate jak se tu zeleni fanatici posklebovali AMD pro jejich funkce v GPU, ktere “nikdy nikdo nevyuzije”? Tak presne tohle je AVX512 (Jak u tech AMD GPU, tak u AVX512 mam na mysli pohled BFU).

            • ale jo 😀 akorát BFU ani netuší, co jeho CPU umí, neumí … a na to Tombovo pošklebování jsem si už zvykl … narážel jsem jen na to, že Tombo psal o něčem úplně jiném, než Radek … „bílý“ sníh, resp. Lucie „Bílá“ asi nebude to samé … nevím, jestli si rozumíme 😀

            • gogo1963 11.8.2021 at 3:16
              To mi pripomnelo text jedne pisnicky: „Nejedy ten zlty sneh!“ 🙂 Ale jinak jsem to psal hned na zacatku, ze mluvi kazdy o necem trosku jinem.

            • @Alich
              Je od tebe hezke a slechetne, ze Gogovy odpovidas a vysvetlujes.
              Ja tohle davno vzdal a nemam na to ani chut 🙂

            • Tombo, 😀 copak jsi vzdal? Nejsem to já, kdo potřebuje cokoliv vysvětlovat … že ty meleš často úplně od věci a pak děláš, že tos nebyl ty … když ty vyčítáš někomu něco, co jsi sám udělal chvilkju předtím … to jsou tvoje domény … ty přimrdlé řeči o tom, jak já ničemu nerozumím a jak tebe nebaví něco mi vysvětlovat, jsou víc, než komické … Alichovi můžeš jen děkovat, že ho rodiče dobře vychovali, když tu tvoji neziskovkářskou blábolivou existenci nesmete pod stůl a snaží se komunikovat s tebou, jako s rovným (v tom ho docela obdivuji) … nechtěl bys vědět, co si o tobě opravdu myslí … a já taky ne 😀

            • tombomino 11.8.2021 at 18:19
              Za me neni co “zvladat”. gogo ma svuj styl a je vyrazna osobnost. Tak to beru a problem s nim nemam 🙂

              gogo1963 11.8.2021 at 18:54
              Nic spatneho. Stejne tak jako o vas. Vetsinou se snazim porozumet ve smyslu “ocekavej dobre umysly”. Na druhe strane jsem tu ve ctyrech pripadech selhal – aroganci s hlouposti, demagogii a lez, psychopatizmus a nakonec zakerneho netaktniho srabika tolerovat nedokazi a hlavne nechci. O ktere 4 se jedna urcite z mych prispevku poznate..

  5. Tak trošku mi uniká pointa, tak buď ta aplikace umí využít AVX-512 a je pro něj napsaná a zpracovává pro ně data. Takových aplikací bude asi zatím velmi málo. A nebo se jedná o nějakou hybridní technologii, která to sice umí využívat, patlá několik výpočtů do sebe, což je popsáno v tomto článku. A pak se diví, že to nefunguje, topí to a má to nízkej výkon. Lamborgini umí taky jezdit 300kmh a má výkon stovky koní, ale kamion za to stejně nezapřáhneš. Podle mě celej ten test, je totálně mimo, hlavně že tábor červených tady nad tím skotačí jak indiáni okolo táborového ohně. Jediná firma co tady vyrábí přímotopy je AMD, viz prohlášení Lisy, že 100°C je v pohodě a procesorům nevadí. Viz AMD Polaris 83°C+ nefungující odběr a přes limit základní desky odebírající výkon, apod…