
Určitě jste v amerických filmech a seriálech viděli kouzelné počítačové programy, které dokázaly z tmavých a malých obrázků z bezpečnostních kamer získat detailní fotku pachatele. To je samozřejmě pitomost. Není možné detaily přidávat, vhodným algoritmem ale lze obrázek zvětšit a doostřit tak, aby lidské oko vnímalo spojité linie a jemné barevné přechody. Zrovna nedávno jsme psali o nové technologii RAISR, která Googlu pomůže zvýšit rozlišení čtyřnásobně.
Výzkumný tým Google Brain však pracuje na další technologii, která se filmové magii přibližuje. Z barevné šachovnice o rozlišení 8 × 8 pixelů dokáže vyčarovat obrázek s 32 × 32 pixely, je tedy 16× jemnější. Opravdu přidává detaily, avšak pouze falešné.
Google pro zvyšování rozlišení využívá dvě neuronové sítě, které trénoval na sadě fotek ložnic a tváří celebrit. První síť porovnává zdrojový obrázek s rozlišením 8 × 8 px se vzorovou sadou tvořenou páry původních fotek a těch zmenšených rovněž na 8 × 8 px. Díky tomu program může vytvořit jakousi kostru, kde se na zvětšovaném snímku bude co nacházet. Druhá neuronová pak kostru vyplňuje detaily. Tady by měly být dlouhé hnědé vlasy, tady zelené oči, červené rty apod.

Výsledkem je Frankensteinovo monstrum složené z částí jiných těl podle pravděpodobnostního modelu. Fotka neodpovídá skutečnému objektu, ale i tak může vypadat dostatečně přirozeně (a také podobně), aby zmátlo lidské oko.
Vybraným uživatelům ukázal 40 párů fotek s rozlišením 32 × 32 px. Jedny byly původní snímky, druhé vznikly interpolací z 8 × 8 px. U fotek obličejů ukázalo 11 % uživatelů, že interpolovaný obrázek je původní, u fotek ložnic to bylo dokonce 28 %. Ideální skóre by bylo 50 %. Pak by nešlo určit, která z fotek je opravdu originál.

Technologie by v testované podobě těžko našla uplatnění v praxi, protože si až příliš vymýšlí. Nemohla by posloužit jako důkaz. Ale při interpolaci trochu lepších snímků než barevná šachovnice by mohla například být vhodným vodítkem při policejním vyšetřování.
Mimochodem, stojí za to si připomenout hezkou parodii na zvětšování obrazu z deváté série Červeného trpaslíka.
Vzorov je nekonecne mnozstvo. Vdaka tomu presnost rekonstrukcie bude vzdy problematicka.
Google ma svoje vzory. Mozgy ludi maju svoje vzory. Z toho vznikne len poriadny gulas.
Mně to připadá, že až bude policie hledat kriminálníky podle magie Google, tak pozatýká půlku Hollywoodu 🙂
Zajímalo by mě, jak by statisticky dopadlo porovnání s náhodně generovanými obrázky :-
Ruším raději účet na amateri.cz 😀
Jestli spis nejde o reverzi algorytmu, ktery ty kostickovane obrazky produkuje..