Seznam.cz: „Díky Googlu jsme tak dobří.“ (+ zajímavosti o vyhledávání)

Seznam není jen vyhledávač, to je zřejmé již od jeho počátků. Na čtvrtečním setkání s novináři se jeho zástupci trochu rozpovídali o vyhledávání, „souboji“ s Googlem a budoucnosti.

Google je na špici na celém světě, tedy kromě čtyř míst. V Rusku vede Yandex, v Číně Baidu a Korea má také svůj lokální vyhledávač Naver. Google se u rozsypaného čaje a háčkočárek nijak přehnaně nesnaží. Jedinou zemí, která používá latinku a Google v ní není nejpoužívanější vyhledávací službou, je Česko. A to se u nás snaží mnohem víc než v okolních zemích; důvodem je právě Seznam.cz.

A ten se nehodlá vzdát, dále bude investovat do vývoje vlastního vyhledávače a nabírat nové lidi (momentálně se na vyhledávači podílí 67 lidí). „Jakmile bychom přestali vyvíjet, skončíme.“ Zlom v Seznamu nastal 15. 3. 2005, kdy změnil typ vyhledávání z katalogu stránek (Kompas z roku 1997) na vlastní fulltext. Mezitím používal fulltext od Jyxa a Googlu.

Přesto stále nejde primárně o vyhledávač, dle slov Pavla Zimy, generálního ředitele Seznamu, jde především o celkový servis pro uživatele. Mapy, e-mail, zpravodajství, počasí… a v momentě, kdy návštěvníkům nestačí, je tu vyhledávací okénko.

Seznam více preferuje sémantické dotazy, tedy lidsky skloňované fráze zadané tak, jako by jste se ptali druhého člověka. Dotazy v prvním pádě známé z minulosti se totiž rozloží do více možností a nejlepší výsledek nemusí být na prvních pozicích.

Vzájemně prospěšný souboj

Seznamu i Googlu jejich vzájemná velká konkurence spíše vyhovuje. Jen díky ní můžeme být tak dobří, potvrdil generální ředitel Seznamu. Demonstroval to na příkladu Turecka, kde jsou výsledky vyhledávání Googlu poměrně špatné, ale protože na tamním trhu není konkurence, Google se nemusí tolik snažit. My jako uživatelé se díky tomu můžeme těšit z lepších map i Streetview, které na mapě Evropy vypadá jako invertované pokrytí 3G.

Slovenský trh překvapivě není tolik obsazen. Zoznam.sk již nemá s českým Seznamem nic společného a přes jazykovou podobnost na něm vede Google. Seznam se sice chystá Slovensku věnovat více než ostatním okolním zemím, ale frontální útok to nebude. Škoda.

Personifikace vyhledávání se nechystá

Seznam podle vlastních slov nechce nijak využívat aktivity uživatelů k získávání informací a ke zlepšování kontextu vyhledávání. Svým způsobem je to totiž zásah do soukromí, i když by tím uživatelé získají lepší výsledky a u Googlu jsme se s tím smířili.

Automatizované prohledávání emailů, sledování na co uživatelé Seznamu klikají a podle toho nabízet relevantnější výsledky, toho se u Seznamu nedočkáme. A je to možná dobře.

Seznam také zatím ještě nikdo nežaloval kvůli zásahů do soukromí.

Reklama

 

Seznam nemá vlastní mobilní platformu, a tak se musí snažit na těch ostatních. Nejlépe našlápnuto má asi na Windows Phone, kde je výchozím vyhledávačem na Nokiích. Je to sice zřejmě jen kvůli neochotě Microsoftu kompletně lokalizovat Bing, jenže ten nebude v češtině ještě hodně dlouho. Pro Seznam je tato pozice hodně důležitá. Také jejich aplikace Mapy.cz pro Android ušla velký kus cesty, ale… vám v ní jde udělat screenshot?

Zajímavosti:

  • Abyste mohli vyhledávat, musí Seznam neustále indexovat všechny weby. V současnosti stahuje kolem 1000 url za sekundu, které ještě před indexací ukládá celé do databáze; dříve je zahazoval.
  • Pomalu také dochází k prodlužování velikosti průměrného dotazy, nyní jsou to zhruba 2,3 slova.
  • Před Olympijskými hrami™ zavedli zjednodušeně řečeno častější indexaci zpravodajských serverů, jejichž obsah se také často mění.
  • 20 % uživatelů vyhledávače je současně na stránkách Seznamu přihlášeno pod svým účtem.
  • Seznam se snaží lépe namixovat výsledky u známého problému: hledám recenzi, ale nacházím jen e-shopy.

  • Za jednu sekundu je zodpovězeno 350 dotazů uživatelů.
  • Třetí verze robota ukládá stažené url dokumenty do databáze. Zabírají 35 TB a je jich jedna miliarda. Na začátku to bylo jen 30 milionů stránek, na které stačilo pár serverů.
  • Seznam.cz má nyní zhruba 500 serverů (300 pro hledání). Typická konfigurace je: 24 jader, 32 GB RAM, 2× 300 GB SAS disk.
  • Z dotazu správně posoudit, zda uživatel opravdu hledá porno a podle toho mu jej ve výsledcích buď nabídnout, nebo ne.

A takto vědecky můžeme zakončit povídání o Seznamu, který se právě stěhuje do nové vlastní budovy a hodlá být u nás ještě dlouho na špici. I když se mu to daří jen v některých produktech.

Perlička: ani stovky serverů nezabránily pádu prezentačního plátna :)

Reklama

Komentáře

nebyla by někde prezentačka online? Nebo ještě lépe záznam, alespon zvukovy ?:)

Bohužel, točil jsem jen škodolibě lidské neštěstí :)

btw: osobně beru jako velké plus tento "konkurenční boj", je pravda že uživatelé z toho dostanou nejvíc. nicméně mi na druhou stranu vadí, jak je seznam s (pře)indexováním extréééééééééémně pomalý. Google je v tomto naprostá jednička, do několika hodin. U seznamu čekáme i několik týdnů (opravdu).

Měli by zamakat na rychlosti, jinak za snahu palec nahoru =)

podle me je seznam na spici jen diky "hloupym uzivatelum" viz moje tchyne... nepozna rozdil mezi internetem, internetovym prohlizecem a seznamem... bezny uzivatel... jakmile je u nas a na nekterym pocitaci chce na internet a nekdo ji nahodou pusti k pocitaci (k tomu ze kteryho ted pisu se nesmi priblizit ani na tri metry, ani skrze zed blizko ktere ten pocitac stoji) a otevre prohlizec, je beznadejne v haji... jako domovska  stranka se ji otevre prazdnej list plnej odkazu (pouzivam tuhle blbinu v chrome, je to paradni) a mezi odkazy je na prvnim miste google... ona se z teto stranky nedostane nikam, vubec nikam...kdyz je nekdo pred ni na pocitaci a necha otevreny internet, neni schopna dostat se na zadnou stranku a ja blbec ji naucil ze existuje domovska stranka, tak hned krici na celej barak (jesteze bydlime v rodinem dome, z bytovky by me uz asi vyhodili) at ji nekdo najede domu (ano, neni dost chytra na to aby aspon restartovala prohlizec, kdyz uz... jo a hlavneze mam v chrome to tlacitko domu, ktery ma samozrejme i na svym notebooku a neni si schopna zapamatovat co to znamena)... tak ja ji vzdy najedu domu, ona je nastvana, protoze tu stranku co tam mam nezna, tak ji rikam ze chtela domu (opakujese to minimalnej ednou tydne, nikdy nenechavejte tchyni at si kupuje barak prilis blizko... a kdyz to udela, honem se pakujte, nez bude pozde) a ona ze chce seznam... kdyz ji tam teda z milosti najedu, najednou jako by ji chytla moudrost sveta a dokaze si sama najet na banku, zkontrolovat ucet, provest platby, jit na nejaky zpravodajstvi... jak to zavre, je zas tupa jak poleno... moje maminka je o 15 let starsi jak ona, dokaze sama instalovat programy, hraje webovky... a pouziva google...

Reklama