Jedním z prvních čínských GPU, která vzbudila víc pozornosti a reálně se dostala na trh, aby na nich vůbec někdo mohl testovat hry a výkon, byly grafiky Moore Threads Technology. Mimochodem první GPU pro PC, která podporovala PCI Express 5.0, nebylo jim to však moc platné, protože nejen výkon, ale i kompatibilita s hrami byly mizerné. Teď ovšem firma zkouší reparát s novou generací. Bude její počin první použitelnou alternativou?
Moore Threads Technology tento měsíc pořádala konferenci pro vývojáře a další zájemce o svůj hardware (MUSA Developer Conference 2025). A na této akci představila novou architekturu GPU, které říká Huagang (pozor, toto je anglická transkripce a za správnost neručíme).
Podle dosavadních zjištění byla první generace GPU od Moore Threads ve skutečnosti založená na licencované architektuře PowerVR od Imagination Technologies. Je otázka, zda v tom Huagang pokračuje a jde jen o novou generaci IP od Imagination, nebo Moore Threads přechází na vlastní architekturu.
Nové herní GPU Lushan
Na architektuře Huagang mají být založené dvě GPU. Pro hráče bude zajímavý (teoreticky) čip Lushan, což má být klasické grafické GPU určené mimo jiné pro hraní. Lushan má podporovat DirectX 12 Ultimate včetně ray tracingu. Kromě toho by měly být podporované i mesh shadery a další technologie, které DX12 Ultimate zahrnuje, ale dost možná ještě nebudou podporované technologie z DXR 1.2, ty výslovně zmíněné nejsou.
Lushan by měl podle Moore Threads mít až 50× lepší výkon v ray tracingu, což je však ve srovnání proti předchozím GPU, které ho musely počítat „softwarově“ na shaderech. Výkon ve zpracování geometrie má být 16× lepší, texture fillrate má být 4× vyšší a atomický přístup 8× lepší.
Není jasné, zda se zde bavíme o nárůstu výkonu daném čistě architekturou při stejném počtu výpočetních jednotek, nebo mezi dvěma konkrétními GPU, kdy část nárůstu bude daná i vyššími takty a vyšším počtem jednotek v čipu.
Lushan má také přinést 64× vyšší výkon v AI – to bude asi řeč o teoretickém výkonu v TOPS/TFLOPS, vzhledem ke kulatému číslu. Podle schématu výpočetní bloky GPU budou obsahovat vektorové jádro (shadery), ray engine a tensor jádro. To znamená, že GPU by asi mělo mít nějaké maticové akcelerátory, nebo něco na způsob akcelerace AI v GPU od AMD (operace WMMA sice sdílejí hardware se shadery, ale dosahují vyššího AI výkonu).
Část tohoto nárůstu výkonu bude asi pocházet z podpory menších datových typů jako jsou INT4/FP4 a INT8/FP8.
Moore Threads také uvádí, že Lushan bude mít 4× vyšší kapacitu paměti, což by implikovalo 32 GB, jelikož první generace grafik Moore Threads MTT S80 nesla 8 GB paměti GDDR6.
Huashan pro umělou inteligenci
Druhý čip nazvaný Huashan (opět není úplně jisté, zdali je to správná transkripce z čínštiny) je určen pro umělou inteligenci, a to údajně jak pro inferenci, tak pro trénování AI modelů. Opět bude založen na architektuře Huagang, která má představovat novou instrukční sadu proti předchozím GPU firmy, s novým asynchronním programovacím modelem.
Huashan má dosáhnout 50% zvýšení „hustoty“ výpočetního výkonu a 10× lepší energetickou efektivitu na stejném výrobním procesu. Má podporovat výpočty s přesnostmi od FP4 (pro AI) až po FP64 (pro vědecké, případně asi i vojenské simulace a výpočty). Pro AI mají být také podporované formáty se smíšenou přesností MTFP6 a MTFP4. Podle Moore Threads má výkon čipu být někde mezi GPU Hopper (H100?) a Blackwell (B200?) od Nvidie, ale to je samozřejmě něco, co se teprve bude muset potvrdit. Zatím jsou zkušenosti takové, že v praktických zátěžích GPU Moore Threads hodně zaostávají za tím, co měla teoreticky slibovat.
Mají údajně být podporovány klastry s více než 100 000 GPU. Ale to se asi nehovoří o koherentním propojení čipů se sdílenou pamětí, spíše o klastru propojeném Ethernetem, Infinibandem či podobnou konektivitou. Jeden uzel (node) by prý ale mohl podporovat až 1024 GPU – nevíme však, zda to bude možné i reálně implementovat, nebo jde jen o teoretický limit architektury, na nějž ale reálné GPU nebude mít dost komunikačních rozhraní.
Už v nadcházejícím roce?
Moore Threads mluví o tom, že tato GPU jsou produktem roku 2026, ale je otázka, zda to třeba neznamená jenom tape-out, papírové uvedení nebo dostupnost vzorků pro zákazníky, zatímco skutečně ke koupi by tyto grafiky a AI akcelerátory byly až později. Každopádně bude zajímavé vidět, s čím nakonec čínská firma přijde, a zda se třeba už nebude dát mluvit o použitelném herním GPU.
Toho se zatím z konkurentů AMD a Nvidie podařilo dosáhnout jen Intelu. Zajímavé však bude sledovat Qualcomm, který vlastní GPU vyvíjí mnohem déle a snaží se integrovaná GPU Adreno ve svých procesorech etablovat jako herní platformu v ekosystému Windows. Zatím byly obě tyto firmy o dost úspěšnější než čínské pokusy, kterým nastavují pomyslnou laťku. Největší problém bude mít Moore Threads asi opět s ovladači a celým softwarovým ekosystémem, který je možná i větší bariérou, než samotný hardware.
Zdroj: VideoCardz

