Nejnovější karty Nvidie postavené na architektuře Blackwell se potýkají s vážnou chybou při virtualizaci. Pokud jsou nasazené v prostředí KVM s GPU passthrough, po vypnutí virtuálního stroje dojde k PCIe resetu, grafika se zablokuje a hostitelský systém přestane reagovat. Jediným řešením je kompletní restart počítače.
Tisíc dolarů pro toho, kdo problém odhalí
Na problém upozornila cloudová služba CloudRift, která uvádí zásadní komplikace při provozu svých VM. Podobná hlášení přicházejí i od uživatelů Proxmoxu a fóra Level1Techs. Starší RTX 4090 ani akcelerátory H100 přitom podobným chováním netrpí.
Nvidia se zatím veřejně nevyjádřila, podle informací však chybu dokázala reprodukovat a hledá řešení. Společnost CloudRift, poskytovatel cloudových služeb pro grafické procesory, mezitím vypsal odměnu 1000 dolarů pro toho, kdo přijde s funkční opravou. Popřípadě tomu, kdo alespoň odhalí příčinu. Reakce komunity však zůstává vlažná a poukazují na to, že odměna není adekvátní a že za tuto částku si výše zmíněnou grafiku ani nepořídí.
Podle magazínu Tom’s Hardware může dočasně zmírnit situaci použití specifických verzí linuxového jádra, nejde však o spolehlivé řešení, které lze provozovat dlouhodobě. V produkčních nasazeních zůstává problém kritický. Pro uživatele, kteří plánují nasazení nových RTX 5090 a PRO 6000 do virtualizace, je současná situace jasným varováním – výkon je špičkový, stabilita však zatím pokulhává.
zdroj: Tom’s Hardware, CloudRift