Konečně konkurence pro Nvidii a AMD? Čínský vyzyvatel Moore Threads přestavil novou generaci GPU

Sdílet

Grafická karta Moore Threads MTT S80 Autor: Moore Threads
Grafická karta Moore Threads MTT S80
Moore Threads jako první čínská firma opravdu dostala na trh vlastní GPU na kterých se daly hrát hry – i když špatně. Teď tato firma představila novou generaci s novou architekturou – bude už druhý pokus vážnou konkurencí?

Jedním z prvních čínských GPU, která vzbudila víc pozornosti a reálně se dostala na trh, aby na nich vůbec někdo mohl testovat hry a výkon, byly grafiky Moore Threads Technology. Mimochodem první GPU pro PC, která podporovala PCI Express 5.0, nebylo jim to však moc platné, protože nejen výkon, ale i kompatibilita s hrami byly mizerné. Teď ovšem firma zkouší reparát s novou generací. Bude její počin první použitelnou alternativou?

Moore Threads Technology tento měsíc pořádala konferenci pro vývojáře a další zájemce o svůj hardware (MUSA Developer Conference 2025). A na této akci představila novou architekturu GPU, které říká Huagang (pozor, toto je anglická transkripce a za správnost neručíme).

Podle dosavadních zjištění byla první generace GPU od Moore Threads ve skutečnosti založená na licencované architektuře PowerVR od Imagination Technologies. Je otázka, zda v tom Huagang pokračuje a jde jen o novou generaci IP od Imagination, nebo Moore Threads přechází na vlastní architekturu.

Nové herní GPU Lushan

Na architektuře Huagang mají být založené dvě GPU. Pro hráče bude zajímavý (teoreticky) čip Lushan, což má být klasické grafické GPU určené mimo jiné pro hraní. Lushan má podporovat DirectX 12 Ultimate včetně ray tracingu. Kromě toho by měly být podporované i mesh shadery a další technologie, které DX12 Ultimate zahrnuje, ale dost možná ještě nebudou podporované technologie z DXR 1.2, ty výslovně zmíněné nejsou.

DirectX 12 Ultimate: Přichází nová generace herní grafiky. Co přináší a jaká GPU ji umí? Přečtěte si také:

DirectX 12 Ultimate: Přichází nová generace herní grafiky. Co přináší a jaká GPU ji umí?

Ray tracing ve hrách bez brutálně nízkých FPS? DXR 1.2 přináší novinky, které zlepší výkon Přečtěte si také:

Ray tracing ve hrách bez brutálně nízkých FPS? DXR 1.2 přináší novinky, které zlepší výkon

Lushan by měl podle Moore Threads mít až 50× lepší výkon v ray tracingu, což je však ve srovnání proti předchozím GPU, které ho musely počítat „softwarově“ na shaderech. Výkon ve zpracování geometrie má být 16× lepší, texture fillrate má být 4× vyšší a atomický přístup 8× lepší.

Není jasné, zda se zde bavíme o nárůstu výkonu daném čistě architekturou při stejném počtu výpočetních jednotek, nebo mezi dvěma konkrétními GPU, kdy část nárůstu bude daná i vyššími takty a vyšším počtem jednotek v čipu.

Lushan má také přinést 64× vyšší výkon v AI – to bude asi řeč o teoretickém výkonu v TOPS/TFLOPS, vzhledem ke kulatému číslu. Podle schématu výpočetní bloky GPU budou obsahovat vektorové jádro (shadery), ray engine a tensor jádro. To znamená, že GPU by asi mělo mít nějaké maticové akcelerátory, nebo něco na způsob akcelerace AI v GPU od AMD (operace WMMA sice sdílejí hardware se shadery, ale dosahují vyššího AI výkonu).

Část tohoto nárůstu výkonu bude asi pocházet z podpory menších datových typů jako jsou INT4/FP4 a INT8/FP8.

Lowendová grafická karta Moore Threads MTT S10

Lowendová grafická karta Moore Threads MTT S10

Autor: Taobao, via: PC Watch

Moore Threads také uvádí, že Lushan bude mít 4× vyšší kapacitu paměti, což by implikovalo 32 GB, jelikož první generace grafik Moore Threads MTT S80 nesla 8 GB paměti GDDR6.

Huashan pro umělou inteligenci

Druhý čip nazvaný Huashan (opět není úplně jisté, zdali je to správná transkripce z čínštiny) je určen pro umělou inteligenci, a to údajně jak pro inferenci, tak pro trénování AI modelů. Opět bude založen na architektuře Huagang, která má představovat novou instrukční sadu proti předchozím GPU firmy, s novým asynchronním programovacím modelem.

Huashan má dosáhnout 50% zvýšení „hustoty“ výpočetního výkonu a 10× lepší energetickou efektivitu na stejném výrobním procesu. Má podporovat výpočty s přesnostmi od FP4 (pro AI) až po FP64 (pro vědecké, případně asi i vojenské simulace a výpočty). Pro AI mají být také podporované formáty se smíšenou přesností MTFP6 a MTFP4. Podle Moore Threads má výkon čipu být někde mezi GPU Hopper (H100?) a Blackwell (B200?) od Nvidie, ale to je samozřejmě něco, co se teprve bude muset potvrdit. Zatím jsou zkušenosti takové, že v praktických zátěžích GPU Moore Threads hodně zaostávají za tím, co měla teoreticky slibovat.

Mají údajně být podporovány klastry s více než 100 000 GPU. Ale to se asi nehovoří o koherentním propojení čipů se sdílenou pamětí, spíše o klastru propojeném Ethernetem, Infinibandem či podobnou konektivitou. Jeden uzel (node) by prý ale mohl podporovat až 1024 GPU – nevíme však, zda to bude možné i reálně implementovat, nebo jde jen o teoretický limit architektury, na nějž ale reálné GPU nebude mít dost komunikačních rozhraní.

Už v nadcházejícím roce?

Moore Threads mluví o tom, že tato GPU jsou produktem roku 2026, ale je otázka, zda to třeba neznamená jenom tape-out, papírové uvedení nebo dostupnost vzorků pro zákazníky, zatímco skutečně ke koupi by tyto grafiky a AI akcelerátory byly až později. Každopádně bude zajímavé vidět, s čím nakonec čínská firma přijde, a zda se třeba už nebude dát mluvit o použitelném herním GPU.

Školení Linux

Toho se zatím z konkurentů AMD a Nvidie podařilo dosáhnout jen Intelu. Zajímavé však bude sledovat Qualcomm, který vlastní GPU vyvíjí mnohem déle a snaží se integrovaná GPU Adreno ve svých procesorech etablovat jako herní platformu v ekosystému Windows. Zatím byly obě tyto firmy o dost úspěšnější než čínské pokusy, kterým nastavují pomyslnou laťku. Největší problém bude mít Moore Threads asi opět s ovladači a celým softwarovým ekosystémem, který je možná i větší bariérou, než samotný hardware.

Nová generace GPU Intel je nejrychlejší integrovanou grafikou. Co přináší architektura Xe3? Přečtěte si také:

Nová generace GPU Intel je nejrychlejší integrovanou grafikou. Co přináší architektura Xe3?

Zamete Qualcomm s AMD v jeho vlastní disciplíně? Snapdragon X2 Elite má mimořádně silné GPU Přečtěte si také:

Zamete Qualcomm s AMD v jeho vlastní disciplíně? Snapdragon X2 Elite má mimořádně silné GPU

Zdroj: VideoCardz

Autor článku

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Kvíz týdne

Tyto konektory zná každý. Ale víte, co jejich zkratky doopravdy znamenají?
1/9 otázek