Víc detailů k AMD FSR odhaleno: algoritmus je podobný Lanczosu a používá FP16, nové hry

37

Je tu naráz hned několik novinek k technologii upscalování her AMD FSR. Bylo vydáno demo, podpora přišla do nových her a kód byl otevřen. Víme tak, že používá akceleraci FP16 a anti-ringing aproximaci algoritmu Lanczos.

Když byla minulý měsíc do světa vypuštěná technologie upscalování her FidelityFX Super Resolution (FSR) od AMD, bylo přislíbeno, že to bude open source software. To také bylo dodrženo, AMD teď publikovalo FSR na webu GPUOpen. Díky tomu máme víc informací k tomu, jak upscaling funguje. Také byly oznámeny další hry, do kterých se FSR dostane, a demo, kde se technika dá zkoušet.

Minulý týden AMD zveřejnilo kód FSR na svém webu GPUOpen, kde sdílí open source grafické komponenty pro hry a další software. To jednak usnadní integraci do her včetně toho, že teď budou vývojáři moci kód upravovat (je pod licencí MIT). Kromě toho jsme s tím ale také získali nové poznatky o fungování této technologie.

První část filtru tvoří upravený Lanczos + anti-ringing

Z kódu vyplynulo, jaký algoritmus používá FSR k zvětšení rozlišení snímků. AMD ho nazývá Edge Adaptive Spatial Upsampling (EASU), přičemž vedle něj FSR aplikuje ostření nazvané RCAS (Robust Constrast-Adaptive Sharpening), EASU tedy není celé FSR.

Zařazení FSR do pipeline vykreslování hry Zdroj: AMD

AMD uvádí, že EASU používá upravený škálovací (převzorkovávací) algoritmus, který je aproximací algoritmu Lanczos s velikostí kernelu 2. O aproximaci jde proto, že je jednak upravený (zjednodušený) pro výkon tak, aby výpočetní nároky byly co nejnižší (neobsahuje žádné komplexní operace jako sin, výpočet převrácené hodnoty nebo odmocniny), což má umožnit použití FSR i v nevýkonných levných notebookových a jiných lowendových grafikách.

Komentář v kódu popisující použitý upscalovací algoritmus Zdroj TechPowerUp
Komentář v kódu popisující použitý upscalovací algoritmus (Zdroj: TechPowerUp)

Druhá modifikace přidává jednoduchou pojistku proti vzniku „ringing“ artefaktů (nebo také „haloing“), které klasický Lanczos produkuje. Algoritmus hodnotu výstupního pixelu omezí do rozsahu hodnot, který zjistí v okolí pixelu, přičemž jako toto okolí používá blok 2×2 vstupních texelů. Toto omezení vypočteného pixelu zajistí, aby nepřestřeloval (nebyl jasnější nebo tmavší), což by právě mělo zabránit ringingu. Jde tedy asi o něco podobného, jako anti-ringing pro škálování Lanczos, který používá MadVR.

Kód jinak uvádí, že celé škálování probíhá jedním průchodem, což je změna proti obvyklému postupu implementací na CPU (škálování se často provádí nadvakrát – nejdřív v jedné, pak v druhé dimenzi), opět asi kvůli výkonu. Škálování EASU je celkově vzato relativně jednoduché v porovnání s různými dalšími experimentálními postupy, které existují, což vysvětluje poměrně vysoký výkon výsledné implementace ve shaderech.

Výkon FSR, respektive výkon potřebný pro zvětšení jednoho snímku Zdroj: AMD

FSR používá výpočty FP16, ale nevyžaduje je

Je také potvrzeno, že AMD pro zlepšení výkon shaderů, které upscaling počítají, používá výpočty s přesností FP16. Ta by pro tento účel měla stačit a značně snižuje zátěž GPU, kterou upscaling přidává, protože novější GPU umí FP16 počítat s dvojnásobným výkonem. FP16 ale podporují až GPU Vega (kde byla tato funkce uvedena pod označením Rapid Packed Math) a novější, u Nvidie je umí karty GeForce s architekturou Turing a novější GPU.

GPU používající implementaci v FP16 a GPU používající záložní verzi s výpočty FP32 Zdroj: AMD

Aby FSR fungovalo i na starších GPU, má také záložní kód, který používá operace FP32, jejichž hrubý výpočetní výkon je ale proti FP16 teoreticky jen poloviční. To znamená, že na grafikách architektury Polaris, na GeForce generace Pascal nebo na ještě starších a oficiálně nepodporovaných GPU bude nárůst výkonu získaný pomocí FSR o něco nižší. GPU Intel by FP16 měla také podporovat, takže by na nich snad mohla být také aktivní rychlejší 16bitová verze FSR (ale toto asi záleží na implementaci a ovladačích). Poznámka: AMD v tabulkách uvádí, že Pascaly FP16 používají, ale nejspíš jde o chybu, protože Pascaly mají FP16 pomalé. V tabulce je také pro FP32 uvedená generace Maxwell, která snad neměla být oficiálně podporovaná.

Nové hry s FSR

Od prvotního odhalení FidelityFX Super Resolution se už trošku rozrostl i seznam her, v kterých se FSR dá použít. Prakticky vzápětí přibyla Dota 2 a dále hra Necromunda: Hired Gun. Tento týden se přidal také Resident Evil Village (patch 1.03) a hra Marvel’s Avengers. Do konce měsíce by pak mělo FSR být zprovozněno ještě ve hře Edge of Eternity. Celkově by pak mělo být her zatím třináct, později mají přibýt ještě asi dva tucty Necromunda a Avengers obsahují jak podporu pro DLSS, tak pro FSR, takže pokud chcete, můžete porovnávat.

Nové hry s FSR
Nové hry s FSR (Zdroj: AMD)

Nvidia DLSS má již zajištěnou přímo integraci do některých herních enginů, která implementaci usnadňuje. Toto by mělo nastat i s FSR, i když to, jak asi čekáte, není v tak pokročilém stádiu. FSR je dostupné v Unreal Engine 4 (4.26) jako patch. Vedle toho pak bude také přidáno do enginu Unity 21.2 HDRP, kde je zatím v speciální preview beta větvi.

Pro engine Unity bylo ukázáno i demo Spaceship (ovšem jen na videu), slibující až 1,9× zlepšení výkonu ve 4K v režimu Performance. Vedle toho má jednoduché samostatné demo také AMD, takže můžete FSR vyzkoušet, aniž byste museli kupovat nebo instalovat celou hru. Toto demo se dá najít třeba v archivu techPowerUpu.

FSR je prý velmi jednoduché přidat do hry Zdroj: AMD

Náznaky, že budou další verze?

Je asi docela dost pravděpodobné, že se FSR bude dále zlepšovat (ostatně podobně, jak Nvidia neustále pracuje na zlepšeních svého DLSS). V tomto smyslu by mohla být zajímavá zmínka, která se objevila v dokumentaci. AMD na jednom místě doporučuje ve hrách „čudlík“ k zapnutí značovat jako „FSR 1.0“, jako by bylo důležité upozornit na to, že hra používá konkrétní verzi technologie, která by se měla rozlišovat od případných jiných následujících. Je proto pravděpodobné, že minimálně v tuto chvíli AMD plánuje i nějaké budoucí vylepšené verze, které by se mohly jmenovat třeba 1.1, 2.0 a tak podobně.

AMD FSR 1.0 a DLSS ve hře Necromunda
AMD FSR 1.0 a DLSS ve hře Necromunda (Zdroj: VideoCardz)

Jak moc lepší budou, to teď samozřejmě nelze odhadnout. Je možné, že taková „verze 2.0“ třeba vznikne až v momentě, pokud AMD někdy zavede do herních GPU specializovanou akceleraci AI operací. Nebo by mohlo jít opět o obecný výpočetní algoritmus pro shadery, ale využívající nějak jiné/přídavné techniky, ať už „2D“, nebo temporální. Je samozřejmě třeba upozornit, že přidání výpočetní komplexity do hypotetického „next-gen“ FSR také zvýší nároky na hardware, takže by filtr výměnou za lepší obraz mohl přinášet méně výkonu navíc.

Galerie: AMD FSR už je open-source, nové informace a nové hry

Zdroje: AMD, GPUOpen, VideoCardz (1, 2), techPowerU

Víc detailů k AMD FSR odhaleno: algoritmus je podobný Lanczosu a používá FP16, nové hry
Ohodnoťte tento článek!
4.5 (90%) 16 hlasů

37 KOMENTÁŘE

  1. Ignorácia fenoménu AI zo strany AMD začína nadobúdať
    desivé rozmery. Použitie primitívnej metódy Lanczos
    by neznamenal špatný krok, za predpokladu využívania
    obdobne pseudo-kvalitnej metódy u konkurencie…
    nVidia sa ale vydala sofistikovanou cestou využitia
    technológie AI, čo samozrajme znamená neobmedzené
    možnosti v porovnaní s obyčajným dopočtom
    obrazových bodov.
    V súčasnosti nVidia trénuje sieť na ultra-high quality 16K…
    Až AMD zazvoní budíček a začnú sa zodpovedne venovať
    AI, konkurencia bude pár rokov napred.

        • Aby ses jednou nedivil ty Jožine. Známe, jak tvé velkohubé prohlášení zde na tomto webu dopadají. Zatímco si nVidia bude své uzavřené řešení syslit jenom pro sebe, tak kolem open řešení AMD se může objevit spousta vylepšení od komunity a ve výsledku to časem může být v mnoha směrech efektivnější. Tak slez zpátky na zem a val poklidit ovce a starou. Historie se totiž dost často ráda opakuje. Snad ti nemusím připomínat, jak tvá oblíbená firma umí zabít nadějné technologie, které se ji dostanou do pracek.

            • však zatím ještě bez dlss nikdo neumřel 😀 … že by tohle bylo nějak děsivé, se nedá říct … je to prostě k diskuzi, ne k trapárnám …v klidu …

            • Zatím ne, ovšem o rok to už bude inde…
              A k tomu open riešeniu s čím sa oháňa
              Wendule – komunita sa roky snaží dobehnúť
              nVidiu v kvalite podpory encodovania
              a furt je to kolotoč za psím ocasem…

            • gogo, kdyby to fandové AMD nezatracovali jako RT, tak nad tím mávnu rukou a řeknu, že bych sito na svým počítači taky nepustil. Reálně radši hru nebudu hrát, než abych se snížil ke snížení rozlišení pomocí DLSS, ale co mě irituje, jsou ty keci na internetu křížem známé pětice chrabrých rytířů AMDD, kteří všude obhajují AMD jak je skvělá a nVidii jak je špatná. Prostě maršálek, jen dává ochtunat vlastní medicínu, kterou všem ti chrabří rytíři rozlévají.

    • Tak niekedy pred cca 4 rokmi sa tu AMD predavalo Samsungu a ktovie este komu a bolo na periferii vykomu ako pri CPU tak aj pri GPU. Za tie 4 roky nema vykonnostny problem ani s Intelom a ani s NV, na to a akej zumpe boli to zvladli docela rychlo – su inovativni, Intel prechadza na ciplety, ktorym sa na zaciatku vysmieval a aj ta Nv premr(d/h)ala ten vykonnostny naskok lahkovazne rychlo – a tak zostalo uz len DLSS. Je celkom mozne je to FSR je len taka docasna zaplata a casom sa s niecim na AI vytasia, ktovie – zatial im karta celkom isla, aj ked tomu nahravali okrem ich sikovnosti rozne okolnosti.

  2. Chlapci, neuveríte kto Vás srdečne pozdravuje !
    Ale pekne po poriadku – veľmi znepokojene
    som čítal články najznámejších svetových
    médií, ktoré pravidelne, každú hodinu informovali
    o zdravotnom stave svetovej IT jedničky a
    zároveň naprostého profesionála-novinára
    s umeleckým menom červený DíDí…
    Ako iste viete, pár dní dozadu utrpel
    DíDí ťažký traumatický šok, ktorého pôvod
    neprajníci pripisujú únikom výkonu procesora
    Alder Lake…títo zlí ľudia ovšem netušia, že
    práve DíDí je oddaným fanúškom Intelu a
    samozrejme nVidie, proste hlupáci…
    Krajne znepokojený nastavšou situáciou
    som neváhal, zabalil červené pomaranče
    i zelené kiwi a poďho ratovať Maestra…
    Po vrelom zvítaní, sa maestro posťažoval
    na neobjektívnu infúzku modrastej farby,
    ktorá mu už tretí deň subjektivne kape
    do krvavo-červenej vznešenej žily…
    Maestro ohromne potešený červeným
    pomarančom a pohŕdavým pohľadom
    na zelené kiwi blahosklonne súhlasil s
    rozhovorom, ktorý Vám prinášam v plnom
    znení:
    Maestro, ako hodnotíte výkon Alder Lake ?
    Odpoveď: Subjektívny zúfalý pokus zdeseného Intelu…

    Úniky hovoria, že výkonom porazí AMD ?
    No, neoverená subjektívne fakta, no koment…

    Ak sa potvrdí výkonová prevaha Intelu ?
    To bude nefér, AMD nemá platformu DDR5…

    Za to predsa nemôže Intel, alebo áno ?
    Na vine je Intel, hádže na trh neodladené DDR5…

    Kedy bude platforma DDR5 odladená ?
    Až ju uvedie na trh AMD…

    Čo hovoríte na AI upscal nVidie ?
    Pitomost, AI nemá šancu uspieť…

    Ako hodnotíte FSR AMD ?
    Tak to je objektivne naprosto geniálny počin…

    Kto je tá pani, čo práve prichádza ?
    Maminka, nese mi kakauko…
    Honziku, vychlamtej kakauko, docent ChoCholoušek
    začína vizitu…

    Ako vidíte priatelia, maestro DíDí sa má už
    chvála bohu lepšie a určite ho poteší každý
    príspevok od dobrých ľudí s textom :
    „ Ahoj DíDí „

    • 😆 Tak tímhle:
      „Na vine je Intel, hádže na trh neodladené DDR5…
      Kedy bude platforma DDR5 odladená ?
      Až ju uvedie na trh AMD…“
      jsi mě dokonale pobavil. 😆 😆 😆 😆 😆
      smál jsem se tak, až jse probudil sousedy ve vedlejším baráku.
      😆 😆 😆 😆 😆 😆 😆

  3. Ty si ako môj švagor všetko je naj len podľa jeho preferencií bola to Nokia potom Samsung u teba len Intel a NVIDIA tie keci sa normálne nedajú čítať podľa teba b bolo naj aby AMD skrachovalo a Intel si za procak bral 1000+ ale samozrejme ty napíšeš pre mňa 1000 žiaden problém …

    • no … to jako podle mnohým je dneska Intel úplně zbytečný … co by se tedy stalo, kdyby zkrachoval Intel? To by pak procák nestál ani 1000, ani 2000, pravděpodobně by v obchodech bylo pusto, tedy kromě neodklizených koster zákazníků, kteří čekali a čekali, protože TSMC a jeho kapacity … nebo bys skládal comp s nějakým sempronem za 899 dolarů na 45nanometrech od Glo-fo …

      • Nechápeš o čo tu šlo ja tu chcem aj Intel aj AMD mne je jedno čo mám v PC za svoje peniaze chcem to naj ako 98,% ľudí tu a idem na túto stránku kôli novinkam a prečítať si názor iných ľudí a nie pri každom AMD článku čítať básničky ako puberťák…

        • PeStik, podľa tvojho prvého príspevku chceš hlavne
          čítať názory ľudí, ktorí velebia AMD…nevadí, že to
          bude lož, hlavne nech ti pohladia dušu…
          Nech sa páči:
          nVidia prišla z riešením DLSS, ktoré nemá budúcnosť…
          nVidia są naivne domnieva, że technológia na princípe
          AI prekoná konkurenčné riešenie FSR, čo je jasný
          nezmysel, pretože na konkrétnych ukážkach vidíme
          ďaleko lepšiu kvalitu FSR…
          AMD vyrukovalo s geniálnym riešením využívajúc
          najmodernešiu možnú metódu dopočtu pixlov
          a nielen to, AMD nezaspalo na vavrínoch a už tak
          bezkonkurečnú kvalitu a výkon znova vylepšuje
          perfektným nástrojom lokálneho kontrastu…
          AMD znova dokázalo technologicky poraziť
          roky zaostávajúcu nVidiu, čo je už v podstate
          dlhodobá záležitosť…AMD udáva smer….

          P.S. Pivko pošli vychladené !