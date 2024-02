Minulý měsíc nám proklouzla novinka, ke které se ještě musíme vrátit. Jak jste možná zaregistrovali, čínský výrobce procesorů MIPS Loongson oznámil letos vyvinutí úplně vlastní instrukční sady LoongArch (a přechod na ni). Minulý měsíc byly odhalené už i první procesory, které tuto novou architekturu mají: čtyřjádro Loongson LS3A5000 a serverový LS3C5000L s 16 jádry. Objevily se i první benchmarky, které jsou ale dost neslavné.

Je zajímavé, že značení se moc nezměnilo proti předchozím MIPS Loongsonům (různé verze generace 3A), což asi naznačuje, že přes přepracování instrukční sady se evolučně navazuje na předchozí design a nenastal nějaký velký předěl a nový start.

Nová architektura má ovšem různé inovace, například konečně umí dynamickou změnu napětí a frekvence (boost), běžnou v procesorech x86 už víc jak deset let. Také by měly mít lepší spotřebu v nečinnosti díky schopnosti vypínat nepotřebné části čipu.

Procesory Loongson jsou podobně jako v předchozích generacích i s novou (či předělanou) instrukční sadou LoongArch vyvinuté dva, jeden pro klientské (PC, notebooky) použití, jeden pro servery. Ten pro PC má označení Loongson LS3A5000 a čtyři jádra na taktu 2,3–2,5 GHz. CPU obsahuje řadič pamětí s dvěma kanály pro DDR4–3200, jenž podporuje ECC. Také by měla být integrovaná čtyři rozhraní HyperTransport 3.0 pro propojení s dalšími CPU do víceprocesorové sestavy. HT se nejspíš používá i pro připojení čipsetu. Tato technologie (která byla otevřená) je převzatá od někdejších AMD Opteronů a Loongson i dříve používal čipové sady AMD.





Serverová verze Loongson LS3C5000L má 16 jader a frekvenci 2,5 GHz. Zdá se, že ale oboje je založené na stejném křemíku, takže toto 16jádro je slepené ze čtyř klientských čtyřjader pomocí oněch rozhraní HT. Mohlo by tedy asi mít také celkem osm kanálů paměťového řadiče DDR4–3200 s ECC. Je to tedy podobné řešení jako AMD Epyc první generace, i když samozřejmě těžko říct, jestli třeba nebude hůř optimalizované (technologie propojení je z doby Opteronů).

V obou procesorech je použitá 64bitová architektura označená GS464V, která má čtyři celočíselné jednotky (ALU), dvě load/store jednotky a dvě FPU/SMID jednotky, které pracují s 256bitovými vektory, což by znamenalo, že jsou architektonicky srovnatelné s AVX/AVX2 u procesorů x86. Ale jestli budou fungovat podobně dobře, to těžko říct.

Procesor podporuje čínské lokálně vyvinuté šifrování a hashování SM2, SM3 a SM4 s výkonem až 5Gb/s a také zřejmě další (takže asi bude umět i standardní AES, SHA a podobně). Integrovaný je i nějaký druh bezpečnostního koprocesoru nebo jednotky či TPM.

Tyto procesory budou logicky používat operační systém Linux s ním spojený softwarový ekosystém (patche s podporou by měly mít mimo jiné projekty standardní knihovny jazyka C musl, qemu, gcc. Na Linuxu už proběhly i první benchmarky. Čtyřjádrová verze Loongson 3A5000LL se objevila v databázi Phoronix Test Suite na OpenBenchmarking.org.

Je asi možné, že jde ještě o neoptimalizované výsledky, protože podpora v systémových knihovnách, jádru a překladačích (jakož i v samostatných programech) nebude ještě moc zralá a třeba na existenci ručně psaného optimalizovaného kódu v assembleru se může rovnou zapomenout. I tak to ale asi ukazuje, že výkonnostně pořád Loongsony zůstávají nekonkurenceschopné se současnou špičkou procesorů. To platí dlouhodobě, a nová instrukční sada na tom zatím moc nezměnila.

Význam tato architektonická linie asi má pro Čínu jen jako pojistka proti nedostupnosti západního hardwaru v případě sankcí nebo jako hardware pro nasazení, kde je nedůvěra v západní procesory kvůli teoretické možnosti nějakých schovaných backdoorů. Díky tomu asi stále má Loongson zajištěno financování a podporu. Ale je otázka, zda to tak bude věčně, protože nějaké agilněji vyvíjené a konkurenceschopnější procesory na bázi RISC-V by mu asi snadno mohly vypálit rybník a vzít důvod k existenci (a tím státní financování).

Politický aspekt těchto CPU se dokonce prý podepsal i na jejich kódových jménech. Klientská verze se interně označovala jako KMYC70, což má být oslavný odkaz na 70 let od zapojení Číny do Korejské války a serverová verze je zase CPC100 na oslavu výročí 100 let založení komunistické partaje v Číně.

Galerie: Instrukční sada LoongArch a procesor Loongson 3A5000

Zdroje: CNX Software, ITHome, Phoronix