Hlavní navigace

CAPTCHA – past na roboty, ale také lidi

4. 5. 2011

Sdílet

Zdroj: Redakce

Sofistikovaná čmáranice

CAPTCHA je akronymem pro „Completely Automated Public Turing test to tell Computers and Humans Apart“ – jedná se tedy o plně automatický veřejný Turingův test (pojmenováno podle britského vědce Alaina Turinga, který test tohoto typu poprvé prezentoval v roce 1950) k odlišení člověka od počítače. Vedle tohoto vysvětlení, jež roku 2000 uvedli akademici z Carnegie Mellon University Luis von Ahm, Nicholas J. Hopper a John Langford, se CAPTCHA někdy rozděluje na „CAPTure CHAracters“ (přečti znaky).

CAPTCHA
Několik různých druhů CAPTCHA, foto: SSW

Nejrozšířenější CAPTCHA staví na předpokladu, že umělá inteligence špatně čte obrázky. Pokud jí tedy předložíte zdeformované písmo v obrazovém formátu, navíc třeba na komplikovaném pozadí, nezvládne rozlišit jednotlivá písmena, zatímco člověk většinou ano. Principem obrázkové CAPTCHA je tedy neschopnost počítače převést obrázek na text, přičemž však obráceně tento proces zvládne.

S tím, jak se umělá inteligence vyvíjí, je potřeba vytvářet stále sofistikovanější a komplikovanější obrazy, jelikož řada výzkumů již předvedla, že do budoucna nejsou CAPTCHA zdaleka tím největším oříškem pro A.I. (viz například zde). Proto se začalo experimentovat i s jinými než obrázkovými kryptogramy. Například s jednoduchými otázkami typu „jakou barvu má nebe?“ či různými matematickými příklady. Pro uživatele by řešení podobné šifry bylo pravděpodobně jednodušší než luštit zmíněné čmáranice, nicméně problémem takového systému je jeho špatná automatizovanost – generovat otázky totiž není jen tak.

Boj se spamem

Hlavním důvodem, proč se tyto Turingovy testy objevují, je všudypřítomný spam. Existují totiž programy, které atakují různé diskuse a šíří zde (většinou) reklamy. CAPTCHA před zveřejněním komentáře zabrání vstupu ne-člověka do diskuse či fóra. Stejně tak tato ochrana funguje před e-mailovým spamem, jelikož i zde stojí za nevyžádanou poštou boti. CAPTCHA má využití i pokud potřebujete sdílet určitou informaci (např. právě e-mailovou adresu), ale nechcete aby byla vyhledána spammery. V případě online hlasovaní je pak ochrana před boty přímo životně důležitou.

CAPTCHA

Tři pravidla správného CAPTCHA

Předně musí být CAPTCHA přístupná. Pokud vytvoříte takový kryptogram, který nepřečte ani lidský uživatel, je to ochrana značně nepraktická. Dále je třeba, aby se obrázek náhodně generoval. Stačí minimální změna, aby bot nepronikl. Zejména je ale třeba dát si pozor na chyby ve skriptu, jelikož tam je riziko dešifrování největší. CAPTCHA splňující tato pravidla pak zafunguje, i kdyby se objevila na několika stránkách najednou.

reCAPTCHAreCAPTCHA podporuje i hlasový výstup

Chcete-li získat pro svůj web CAPTCHA, nejste naštěstí vázáni na své programátorské schopnosti. Existuje hned několik serverů, které Turingův test nabízejí a to dokonce zdarma. Například projekt Googlu s názvem reCAPTCHA, jehož užíváním prý navíc pomáháte digitalizaci starých textů – šifru totiž vždy tvoří dvě slova, z nichž jen jedno je softwaru známé.

CAPTCHA je stále funkčním rozlišovačem člověka a robota. Zároveň také výzvou tvůrcům umělé inteligence. A výdělkem tzv. řešitelů, kteří se spammery nechávají najímat, aby obrázky překládali počítači na text. Pro nás ostatní zůstávají těmi otravnými čmáranicemi, které na nás pravidelně vyskakují, aby nám připomněly, že jsme stále ještě chytřejší než počítač.

Byl pro vás článek přínosný?