Slovensko-americké Tachyum uvádí své „zázračné“ procesory Prodigy. Výroba začne za rok

14
Emulátor procesoru Tachyum Prodigy běžící na FPGA 1600
Emulátor procesoru Tachyum Prodigy běžící na FPGA
-
Zdroj: Tachyum

Tachyum už léta slibuje jinou a výrazně rychlejší alternativu k procesorům od Intelu nebo AMD. Teď se snad už konečně ukáže, zda je hype podložený.

Pokud podrobně sledujete počítačové novinky, mohli jste se už nejspíš doslechnout o projektu procesorů Tachyum Prodigy. Zajímavý je i proto, že jde o procesorový startup se slovenským zakladatelem. Tachyum je nicméně známé i tím, že toho hodně oznamovalo léta dopředu, zatímco jeho procesory, které podle marketingu měly být mimořádné, byly stále jenom na papíře. Teď však opravdu směřují k vydání, byť ne s okamžitou dostupností.

Tachyum založil v roce 2016 a od té doby mu šéfuje Radoslav Danilák, rodák z Prešova, který ovšem prošel návrhem čipů ve firmách Toshiba, Nvidia nebo Sandforce (které spoluzakládal). Firma Tachyum oznámila již před lety jako svůj hlavní produkt procesor Prodigy, který měl za cíl prolomit (tehdejší) relativní stagnaci serverových procesorů. A také měl být díky efektivnější architektuře odpovědí na omezení, která pomalu přináší zpomalující se vývoj výrobních procesů.

Prodigy má v krátkosti být při stejném výkonu výrazně menší a jednodušší čip, což má mít výhody v energetické efektivitě a přinést výhody v momentě, kdy se kvůli omezenému škálování výrobních procesů stane rozhodujícím faktorem to, která architektura z omezeného počtu tranzistorů vytěží nejvíc. Zdá se, že Prodigy na to jde cestou trošku připomínající Itanium a principy VLIW procesorů, což je mezi výkonnými procesory dnes řekněme unikátní přístup.

Jak už jsme nadhodili, firma oznámila svůj procesor již velmi dávno a často vydávala tiskové zprávy oznamující jeho příchod dlouho dopředu. Vzhledem k velmi ambiciózním výkonnostním cílům ve spojení s nestandardním VLIW přístupem proto u mnoha pozorovatelů panuje spíš skepse. Prodigy se nyní ale má konečně dostat do výroby, takže se snad dočkáme odpovědi na otázku, zda byl „hype“ reálný.

Tachyum Prodigy se 128 jádry jde do výroby

Firma nyní oznámila, že se chystá na začátek výroby procesoru Prodigy T16128, jenž by podle ní měl být ničím menším než nejvýkonnějším na světě. Má přitom být vysoce flexibilní v tom smyslu, že má poskytovat výkon pro standardní CPU úlohy, ale také vysoký numerický výkon v FP64 výpočtech jako GPU, a navíc ještě SIMD či tensorový výkon pro AI aplikace jako specializovaný akcelerátor AI. Tachyum to balí do označení „Univerzální procesor“.

Tachyum Prodigy T16128 ilustrace
Tachyum Prodigy T16128, ilustrace (Zdroj: Tachyum)

Před dvěma lety Tachyum v plánech uvádělo 64jádrový procesor na 7nm procesu, nicméně to asi bylo přeskočeno. Vypadá to, že nyní chystaná architektura je spíš už nějaká nová vylepšená verze proti oné první 7nm generaci, která nakonec do výroby nešla. Firma místo toho dosud avizovala jen dostupnost simulované zkušební platformy, která ale běží na FPGA (jde o desku se čtyřmi FPGA simulujícími osm jader Prodigy, plus další desku simulující I/O a paměti).

Prodigy T16128 by mělo již používat 5nm proces (nevíme, zda od TSMC, nebo Samsungu) a má, jak již bylo řečeno, 128 jader s 64bitovou architekturou vlastního návrhu i vlastní instrukční sady. Procesor má mít údajně 16kanálový řadič, což by znamenalo „šířku sběrnice“ (pokud použijeme terminologii GPU) 1024 bitů. Podporovaná má být až rychlost DDR5-7200, což by dodávalo propustnost až 900 GB/s. Tolik kanálů DDR5 také znamená, že bude podporovaná vysoká kapacita pamětí, až 8 TB na socket. Pro disky a periférie bude procesor poskytovat 64 linek PCI Express 5.0.

Speciální architektura má umožnit toto CPU provozovat na velmi vysokých taktech – model Prodigy T16128 by prý měl běžet až na 5,7 GHz. Zřejmě právě při tomto taktu uvádí Tachyum výkonnostní čísla.

Emulátor procesoru Tachyum Prodigy běžící na FPGA
Emulátor procesoru Tachyum Prodigy běžící na FPGA (Zdroj: Tachyum)

Podle Tachyum má Prodigy T16128 dosahovat výkon až 90 TFLOPS ve vědeckých výpočtech (patrně je řeč o FMA s dvojitou přesností FP64), ale nevíme úplně jistě, zda to není údaj třeba pro čtyřprocesorovou sestavu. V AI výpočtech (to se zřejmě bavíme o výkonu v maticových výpočtech) bude prý výkon tohoto procesoru až 12 PFLOPS.

Výrobce také uvádí, že v mnohojádrovém benchmarku SPECrate 2017 má výkon být až 4× lepší než u 40jádrového procesoru Intel Xeon Platinum 8380 (Ice Lake-SP) nebo 3× lepší proti 64jádru AMD Epyc 7763 (Zen 3/Milan). Výkon v AI výpočtech FP8 má prý být až šestkrát vyšší než u nejnovějšího počinu Nvidie H100 (s architekturou Hopper) a v FP64 třikrát vyšší. Ale zase nevíme, zda to není případ nějakého srovnávání hrušek a jablek. Jak toto vše dopadne, teprve uvidíme ve chvíli, kdy se Prodigy opravdu podaří dostat na trh.

Vedle tohoto ústředního modelu budou nabízené i ořezané verze. Prodigy T864 má být 64jádro s 64MB L2+L3 cache. Prodigy T832 bude mít 32 jader a 32 MB L2+L3 cache. Paměťový řadič je u těchto modelů jen osmikanálový s podporou DDR5-6400 (400 GB/s) a řadič PCIe Express 5.0 má jen 32 linek. Architektura jader je však u všech tří modelů patrně stejná a asi by měly být založené na stejném 5nm čipu.

Emulátor procesoru Tachyum Prodigy běžící na FPGA čtyři programovatelné pole emulují každé dvě jádra Prodigy
Emulátor procesoru Tachyum Prodigy běžící na FPGA, čtyři programovatelná pole emulují každé dvě jádra Prodigy (Zdroj: Tachyum)

Out-of-order architektura s širokým SIMD

Architekturu jádra již Tachyum částečně prezentovalo v roce 2020, ale nevíme, zda mezitím nebyla změněná, tehdy šlo o onen původně plánovaný 7nm čip. V roce 2020 například bylo uváděno, že jádro bude mít 16kB L1 datovou a 16kB L1 instrukční cache, 256kB L2 cache a 64jádrové CPU by mělo 32 MB L3 cache. Nyní se ale v datasheetu pro 5nm Prodigy T16128 uvádí 64kB+64kB L1 cache a 128 MB celkové L2 + L3 cache, což by mohlo být například 512 kB L2 cache na jádro a 64 MB L3 sdílené cache pro celé 128jádro.

Oficiální údaje o Tachyum Prodigy T16128
Oficiální údaje o Tachyum Prodigy T16128 (Zdroj: Tachyum)

Co zůstalo, je zřejmě 4-wide architektura jádra se čtyřmi ALU, která má údajně být typu out-of-order. V každém jádru by pak měly být dvě SIMD jednotky s šířkou 1024 bitů (tedy dvakrát širší než AVX-512 nebo ARM SVE u Fujitsu A64FX). Toto by mohl být další znak toho, že Tachyum už uvádí vylepšenou architekturu místo té prvně navržené, v roce 2020 se hovořilo o 512 bitových jednotkách. Tyto SIMD jednotky podporují vědecké výpočty v FP64 pro použití v superpočítačích, ale budou podporovat s úměrně vyšším výkonem i menší datové typy FP32, TF32, Bfloat16, Int8 a FP8.

Tip: Nový nejrychlejší superpočítač: Fugaku s procesory ARM dává 415 PFLOPS i bez GPU

Kromě univerzálního SIMD ale bude v jádrech také akcelerátor AI (neuronových sítí), tedy něco jako tensorová jádra v GPU od Nvidie. Tyto akcelerátory mají efektivní šířku 4096 bitů. Je možné, že jejich výkon bude zvýšen pomocí sparsity technik, podobně jako to dělá Nvidia.

Procesor má být vyráběn v pouzdru typu LGA (nebude tedy napevno pájený na desku) o rozměru 64 × 84 mm, bude tedy v obou dimenzích o několik milimetrů větší než procesory AMD Epyc nebo Threadripper pro socket SP3/TR4/sTRX4. Podporovány budou dvousocketové i čtyřsocketové sestavy. Pokud mají tato CPU v určité míře konkurovat specializovaným akcelerátorům a GPU, pak asi největší smysl budou mít ony 4S desky, aby v paralelismu dokázaly akcelerátorům (u nichž je normou několik GPU na jeden server) konkurovat.

Zatím nevíme TDP, ale dalo by se asi čekat někde v rozsahu 200–400 W, méně dnes v serverech nedává moc smysl z hlediska efektivní hustoty výkonu na určitý zabraný prostor.

Oznámení teď, ale výroba až příští rok

Toto oznámení je ze strany Tachyum opět ve značném předstihu před reálnou dostupností. Firma uvádí, že výroba těchto procesorů začne v roce 2023. Přinejlepším se tedy reálného prověření této architektury dočkáme příští rok. Do dalšího to snad nesklouzne, ale i tato možnost tu asi po předchozích zkušenostech zůstává. Je asi na místě pořád krotit očekávání, protože Tachyum slibuje velmi vysoké cíle, byť jde pořád jen o startup firmu. Zklamání asi není vyloučeno a obecně vůči slibům firmy často panuje podezřívavost.

Emulátor procesoru Tachyum Prodigy běžící na FPGA část emulující IO a paměťový subsystém
Emulátor procesoru Tachyum Prodigy běžící na FPGA, část emulující IO a paměťový subsystém (Zdroj: Tachyum)

Prodigy bude mít také svůj úkol komplikovaný v tom, že jde o novou architekturu, na kterou bude všechen software nutné portovat. Mnoho projektů bude mít podle Tachya nativní podporu (Linux, FreeBSD, GCC, Apache, SQLite, MongoDB, MariaDB, PHP, Perl, Pysthon, Tuby, TensorFlow, PyTorch a další), ale zatím na tomto poli není vidět mnoho výsledků. Přitom optimalizace a výkon kompilátorů bude platforma potřebovat jako sůl, protože bude dohánět několik dekád optimalizací pro procesory x86. Navíc pokud je ve hře architektura typu VLIW, mělo by na kompilátoru ležet větší břemeno než obvykle.

Tachyum bude mít i softwarové nástroje umožňující běh nenativních aplikací (pro x86, ARM a RISC-V), ale u těch zase bude snížený výkon. Přitom výkon potenciálně vyšší než u standardních procesorů x86 (případně ARM) má být vůbec ten důvod, proč exotickou platformu Prodigy použít – samozřejmě pokud hardware naplní to, co je slibováno. Na této emulaci ale v serverech mohou běžet nekritické komponenty, zatímco hlavní důležitá aplikace bude provozovatelem portována.

Je asi také možné, že pokud Prodigy uspěje, bude používáno na úzce definované konkrétní aplikace velkými hyperscalery a podobnými klienty, takže venku ve světě nakonec ani nemusí být nikde moc vidět. Pak by ani softwarová podpora často nemusela být ve veřejných repozitářích open source projektů.

Zdroje: Tachyum, Tom’s Hardware

Slovensko-americké Tachyum uvádí své „zázračné“ procesory Prodigy. Výroba začne za rok
Ohodnoťte tento článek!
4.7 (93.33%) 12 hlasů

14 KOMENTÁŘE

  1. do vyroby uz ide od 2018, kedy mal byt v 2019 na trhu, odvtedy uz len stale pridavaju dalsie jadra, zvysuju frekvenciu a vykon, prechadzaju na novsi vyrobny proces a posuvaju vyrobu o rok, medzitym do toho hlupi investori leju miliony, ktore uz nikto nikdy neuvidi. Zatial nikto nevidel nic realne, iba tlacove spravy o tom ako maju fpga prototyp, ako tam vraj nabootoval linux a ako vraj maju naportovane vsetky kompilatory/aplikacie, cele emulacne prostredie, ale ze by to emulacne prostredie zverejnili, aby sa vobec vsetci stihli na tu novu architekturu pripravit, to nehrozi.
    Neviem ako si predstavuju, ze o rok pride na trh uplne nova architektura a vsetci ju zacnu hned kupovat bez toho, aby si aspon pripravili kompatibilitu svojich aplikacii na emulatore?
    Cisty podvod

  2. jo a cela firma ma 25 zamestnancov, 25 ludi (vratane managementu) dokazalo navrhnut dokonaly procesor, vykonnejsi ako vsetky ostatne cpu a gpu dokopy, s minimalnou spotrebou a este k tomu pre neho napisat dokonaly kompilator a naportovat linux a freebsd. Dalsie, co vyrobia, bude asi univerzalny liek na rakovinu, a potom pojdu rovno prefackat boha.

  3. Ja to nechapem, same hejty :-/
    Namiesto toho, aby ste boli radi, ze niekto sa snazi vytvorit daco nove, tak ste projekt uz odpisali.
    Podla mna si nikto z nas nevie ani predstavit, co to obnasa vytvorit nove CPU a ekosystem okolo toho.

    Ja osobne im drzim palce…..a aj ked sa z toho nakoniec vykluje DOA projekt, tak nech. Aspon tam bol pokus. Ale urcite by som nehejtil projekt, ktory este zivy je.

    • sorry ale nikto sa tu nesnazi vytvorit daco nove, su to len prazdne sluby bez akehokolvek realneho dokazu, ze by aspon ciastocne nieco mali, je to zase len cista zlodejina, ktora nam sposobi akurat tak medzinarodnu hanbu
      zjavne ani oni si to nevedia predstavit, inak by uz v 2018 neslubovali hotovy produkt na rok 2019, pricom po dalsich 3 rokoch sa absolutne nikam neposunuli, len este dalej prepalili tie absurdne sluby

      • Mne to vobec neprislo take, ze nic nemaju. Ako ste k tomu prisli?
        A posuvanie/odkladanie produktu? No neviem, Intel to robi minimalne od 2015.. a to hovorime o firme s trzbami viac ako 70 miliard dolarov rocne. Takze pri „garazovej“ firme mi to nepride ako podvod.

        Ale ak ste vy do tohto projektu investovali vela penazi, tak beriem spat… ako investor mate pravo hejtit.

        • a uz ste videli, ze nieco maju? okrem tlacovych sprav
          bola nejaka verejna prezentacia realneho produktu?
          bol zverejneny popis instrukcnej sady?
          boli zverejnene zdrojaky uprav linuxoveho kernelu aby mohol bezat na novej architekture?
          boli zverejnene zdrojaky upraveneho qemu, o ktorom tvrdia, ze ho maju, ktore dokaze emulovat tuto architekturu?
          ak rok pred uvedenim komercneho produktu nezverejnili ani emulator (co intel pri vydavani novych verzii avx robi niekolko rokov vopred), pomocou ktoreho by si zaujemcovia mohli aspon otestovat kompatibilitu svojho softwaru, tak nemaju absolutne ziadnu sancu na uspech, pretoze macku vo vreci si nikto nekupi

          • Prepacte, ja som nikde nepostrehol, ze vam to museli prezentovat. Ak ste investor, tak je asi najvyssi cas im to povedat, ze nech vam to ukazu/prezentuju. Podla mna investori by mali byt informany, co a ako sa deje s ich peniazmi.

            Je to sukromny projekt, nikto nevieme, ake su dohody s investormi, alebo ci sa boja dat daco von, aby ich konkurencia (s milion krat vacsim rozpoctom) nepredbehla. Kto vie.. nevidime do toho. Ale stale to neznamena, ze je to podvod. Ked utecu s peniazmi a neozvu sa, tak potom vam dam za pravdu. Dovtedy nie.

            • lol, ty si nebodaj zamestnanec? 😀
              alebo tieto kecy tu davas zadarmo?
              cize oni robia najvykonnejsi superprocesor aky kedy existoval, ale daju ho iba investorom, pretoze je zbytocne ho ponuknut na realny trh, kde by na tom zarobili miliardy.
              Nie som investor, pretoze nie som idiot, ale ponukali mi tuto moznost a aj som videl ich interne prezentacie iba pre investorov a su to este vacsie sracky, ako to co pustaju verejne. Nehovoriac o tom, ze sa tam tvaria ako keby svojim produktom chceli nahradit cely HPC segment na celom svete, ale to sa asi neda pokial to budu tajit este aj po vydani a daju to iba zopar „vyvolenym investorom“.
              Inak podla tych ich prezentacii, to ze vydanie stale odkladaju o rok, stoji 50 tisic ludskych zivotov rocne, ktore mali ich superprocesory zachranovat. Takze nechapem ako sa dokazu pozerat do zrkladka, ked maju na svedomi takuto genocidu.

            • @DougQuaid:
              Ach jaj, haters gonna hate, vsak? 🙂
              Nie, nie som zamestnanec, len sa mi nepaci, ked niekto to uz musi hejtovat. Vy by ste urcite aj Steava Joba hejtovali, ked este pajkovali prve Apple zariadenie v garazi 😀

              Vsak trosku pokory neuskodi.

              Mimochodom, napr. z clanku z minuleho roka (rozhovoru) aj je spomenute:

              „Tieto výsledky zverejníte?
              >
              Výsledky sú aktuálne stále predmetom zmluvy o mlčanlivosti. Pretože aj keď sa partnerom objavia nejaké zlé výsledky, teda že sme výkonom pozadu, naši inžinieri to následne vedia odladiť. Čiže, keď sa testovanie skončí a ak budeme s publikovaním výsledkov súhlasiť, budú ich môcť zverejniť.“

              zdroj: https://zive.aktuality.sk/clanok/4p291ly/preco-intel-ci-amd-nedokazu-to-co-slubuje-slovensky-tachyum-vysvetluje-jeho-sef-rozhovor/

  4. Má to naprosto stejný postup jako ostatní scamy, například Nikola Truck.

    Příští rok budeme mít toto, po roce to nemají a slíbí ještě víc a tak dokolečka, dokud se penízky od pomatenců sypou.

    (Nevím zrovna, jaký přeslibovací období ta firma zrovna má)

    Strašně rád bych se pletl, ale…