Čínská počítačová nezávislost: Loongson vydává čipletové procesory s 64 jádry

5. 7. 2025

Sdílet

Procesory Loongson LS3C6000 Autor: Loongson
Procesory Loongson LS3C6000
Exkluzivně čínské procesory Loongson teď přicházejí na trh se serverovým řešením. Díky použití čipletů má až 64 jader a osmikanálové paměti, ale konektivita už je starší generace a celkový výkon je o pět let pozadu za dnešními lídry.

Většina procesorů pro počítače, mobily i servery se zkonsolidovala na architekturách x86 a Arm, do čehož se ještě v budoucnu může přidat RISC-V, jenž ale zatím působí jen v embedded řešeních. V Číně z toho ale existuje jedna z mála výjimek, kterou jsou procesory Loongson (další už je možná jenom IBM Power). Od těch nyní přichází nová generace pro servery, která je dosud nejvýkonnějším výhonkem této linie CPU s až 64 jádry.

Loongson v roce 2023 vyrobil novou generaci procesorů označenou LS3A6000 či zkráceně 3A6000, která přinesla novou generaci architektury LA664 s výrazně zlepšeným výkonem na 1 MHz (či jak se říká, „IPC“). Po těchto klientských CPU však loni firma oznámila výrazně výkonnější serverovou verzi LS3C6000 (či zkráceně 3C6000) a tyto procesory jsou nyní hotové a směřují na trh.

Právě v serverech s linuxovým ekosystémem by mohl Loongson mít v Číně větší uplatnění, na rozdíl od sektoru PC a notebooků, v jejichž softwarovém ekosystému se CPU s úplně vlastní instrukční sadou těžko může prosadit. Tato CPU jsou jediná na světě, založená na architektuře LoongArch (byť ta vznikla vývojem z architektury MIPS).

Čína má vlastní procesorovou architekturu LoongArch, CPU Loongson přejdou z MIPS? Přečtěte si také:

Čína má vlastní procesorovou architekturu LoongArch, CPU Loongson přejdou z MIPS?

Loongson LS3C6000

Loongson LS3C6000 má stejnou architekturu LA664, ale poskytuje výrazně víc jader. Tyto procesory jsou čipletové, mohou se skládat z jednoho, dvou či čtyř kusů křemíku, čímž jsou tvořené konfigurace s 16 až 64 jádry. Zdá se, že jejich styl propojení by mohl podobný první generaci procesorů AMD Epyc (7001 „Naples“) a Threadripper, kdy každý čiplet měl řadič paměti a PCI Expressu a byl vlastně samostatným procesorem, celé spojené CPU tak logicky fungovalo jako 2S či 4S systém v jednom pouzdru.

Loongson LS3C6000 používá ke spojení čipletů vlastní koherentní propojovací logiku (Loongson Coherent Link). Na rozdíl od AMD Infinity Fabric se nezdá, že by pro ni bylo jako fyzické vrstvy použito konektivity PCI Express (počet řadičů na snímku čipů nesedí). Čiplet má zřejmě vyhrazenou logiku a PHY čistě pro konektivitu Loongson Coherent Link – na snímku čipu, který byl zveřejněn, je takový blok vyznačen. Loongson dříve používal k propojení standard HyperTransport pocházející z někdejších serverových procesorů AMD Opteron, Loongson Coherent Link může být jeho potomkem.

Jeden čiplet obsahuje 16 jader LA664 s 32MB L3 cache, která je mezi těmito jádry sdílená (není už ale sdílená s jádry v dalších čipletech, data z jejich cache se musí přenést přes propojovací logiku). Jádra mají out-of-order 6-issue architekturu se 4 ALU, 4 AGU a 4 SIMD/FPU jednotkami, 64KB instrukční a 64KB datovou L1 cache a 256KB L2 cache. Podporují SMT, takže každé jádro umí současně zpracovávat dvě vlákna, čímž se zvyšuje mnohovláknový výkon. Instrukční sada LoongArch také poskytuje vlastní verzi 256bitových SIMD instrukcí, které lze asi považovat za obdobu AVX2 v procesorech x86.

Snímek čipletu procesorů Loongson LS3C6000

Snímek čipletu procesorů Loongson LS3C6000

Autor: Loongson, via: HardwareLuxx

Procesory mají podobně jako procesory x86 separátní bezpečnostní subsystém Loongson SE s jednoduchým vyhrazeným jádrem LA264. Ten podporuje čínské kryptografické standardy SM2, SM3 a SM4. Kromě PCIe ještě procesory poskytují rozhraní SPI, UART a GPIO pro další zařízení a periférie.

Procesory v jednočipletové konfiguraci (LS3C6000/S) mají typickou spotřebu 100 až 120 W a 16 jader / 32 vláken a frekvenci 2,2 GHz. Tato konfigurace používá čtyřkanálový řadič pamětí DDR4–3200 (jeden čiplet tedy fyzicky podporuje čtyři kanály, což je značná odlišnost od zmíněných Epyců 7001) včetně podpory ECC. I tato relativně malá konfigurace tedy obslouží větší kapacity RAM. Procesor poskytuje 64 linek PCI Express. Není ovšem zmíněno, jaké generace – pokud by to byl PCIe 4.0 nebo dokonce PCIe 5.0, nejspíš by se firma pochlubila, takže stále může jít o dnes už pomalý standard PCIe 3.0 s rychlostí jen 1 GB/s na linku.

Procesory Loongson LS3C6000

Procesory Loongson LS3C6000

Autor: Loongson, via: HardwareLuxx

Dvoučipletové modely (LS3C6000/D) mají 32 jader a 64 vláken na taktu 2,1 GHz s 2×32MB L3 cache a typickou spotřebou 180–200 W. Čtyřčipletové modely (LS3C6000/Q) pak poskytují 64 jader a 128 vláken s frekvencí 2,0 GHz a 4×32 MB L3 cache při typické spotřebě 250 až 300 W.

Dvoučipletové a čtyřčipletové konfigurace mají stejné schopnosti I/O. Poskytují 128 linek PCI Express a osmikanálový řadič pamětí DDR4–3200. Není tedy využita možnost provozovat čtyřčipletové modely s 16kanálovými pamětmi.

Zdá se, že Loongson nemá alespoň zatím modely používající čiplety s částí jader deaktivovanou, ani více odstupňovaných modelů s různou frekvencí. V relativně malém objemu výroby se možná nevyplatilo provádět binning jednotlivých vyrobených čipů. Procesory ale podporují dynamickou změnu frekvence a napětí a také clock gating, v nečinnosti mohou odpojit od hodinového signálu část jader (granularita je ale možná na úrovni modulů/čipletů, ne jednotlivých jader). Není ale zmíněný power gating, tedy kompletní odpojení od napájení, takže úspory energie nebudou tak velké jako u pokročilejších CPU s touto schopností.

Výkon konkuruje starým Intelům

Podle Loongsonu jsou tyto procesory konkurenceschopné proti starší 10nm generaci serverových procesorů Intel Ice Lake-SP z roku 2021 (je ale třeba říct, že ty samé byly pozadu za 64jádrovým Epycem 7002 od AMD z roku 2019). Nejvýkonnější 64jádrová konfigurace je porovnávána s Xeonem Platinum 8380 (nejvýkonnější verze Ice Lake-SP s 40 jádry a 80 vlákny). Nekonkurují tedy nejlepším dnešním procesorům pro servery, místo toho mají nabízet hlavně nižší cenu.

Pro Čínu pak může být důležité, že jde o vlastní lokálně vyvinuté řešení. Není úplně jasné, kde jsou tyto procesory vyráběné, ale dávalo by smysl, kdyby byl použitý křemíkový proces čínské foundry společnosti SMIC, takže i samotná výroba čipů by byla nezávislá na zahraničních dodavatelích jako je TSMC a Samsung.

hacking_tip

Firma Loongson nyní tyto procesory oficiálně oznámila, ale není jasné, zda se tím myslí i okamžitá dostupnost na trhu. Těmto menším hráčům někdy trvá poměrně dlouho, než jejich produkt skutečně lze koupit. K dostání asi procesory každopádně budou jen v Číně, export asi není pravděpodobný.

Zdroje: HardwareLuxx, Loongson

Autor článku

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →