Hlavní navigace

Datacentra 2/2: Google je bezkonkurenčním králem

20. 12. 2010

Sdílet

Zdroj: Redakce

Google králem

Google králem

Určitě jste si všimli, že jsem v předchozím článku o datacentrech několikrát zmínil společnost Google. A není to náhodou. Google je totiž bezkonkurenčně největším vlastníkem a provozovatelem datacenter na světě. Pro srovnání: Zatímco Google vlastní více než jeden milion serverů, kupříkladu Facebook jich má „pouze“ 30 000. Společnost Intel vlastní okolo 100 000 serverů, Microsoft podle svých vyjádření několik set tisíc (podle některých odhadů 250 000, více viz samostatný rámeček).

Google je v tomto smyslu několikanásobně větší než jeho největší konkurenti. A vezmeme-li v úvahu pouze vyhledávací společnosti, pak je Google větší, než všichni jeho konkurenti dohromady! Tento internetový gigant vlastní v současné téměř 40 obrovských center, převážně v USA (odhadem 19) a Evropě (odhadem 15). Vždy byla ale datacentra Googlu opředena tajemstvím a záhadami. Společnost si totiž hlídá informace o své infrastruktuře jak dobrman kost.

Monstrózní chladící věže jednoho z obřích datacenter Googlu, které díky odpařování vody zajišťují chlazení serverových sálů

Motivací Googlu pro stavění datacenter byl proklamovaný hlavní cíl společnosti: zorganizovat všechny informace světa. Největší třešničkou na dortu je fakt, že Google si jako jediná velká softwarová či internetová společnost staví servery a datová centra sama. Od začátku totiž její zakladatelé bojovali s nedostatkem kapacity a výpočetní síly. Již v roce 2000 však podnikli odvážný krok, kterým předstihli konkurenci. Protože Google využíval pro stavbu svých serverů běžný hardware, pro který dokázal napsat velmi efektivní software, dokázal na hardwaru značně ušetřit.

K původnímu datovému centru umístěném v Kalifornii otevřel druhé stejně veliké centrum na východním pobřeží USA. To bylo záměrnou kopií toho prvního a poskytovalo tak tzv. redundaci. Dvojnásobná nadbytečná kapacita sloužila ke kompletnímu zálohování všech dat a kromě možnosti využívat tuto kapacitu na další vývoj hardwaru i softwaru zaručila stoprocentní ochranu funkčnosti. I kdyby se celé první datacentrum zhroutilo, geograficky vzdálená kopie ihned mohla to první zastoupit.

Dnes princip redundace využívá více společností, Google byl ovšem první, kdo si mohl tuto drahou záležitost díky vlastní levnější serverové architektuře v tak masovém měřítku dovolit a na dlouhou dobu i do budoucna tím předběhl všechny konkurenty. Levnější ovšem neznamená levné. Většina datacenter Google přišla jednotlivě na sumu 600 milionů dolarů, tedy 12 miliard korun!

Záhady a tajemství

Google nikdy příliš informací o svých datových centrech nepustil za dveře Googleplexu. Určitě to ale pomohlo předběhnout konkurenci. Hlavní rivalové, Yahoo a Microsoft, již také zjistili, že datová centra jsou budoucnost a kdo má větší datovou i výpočetní kapacitu a umí ji proměnit ve webové služby, bude vládnout informačnímu světu.

Náskok Google se jim ale nedaří ani vyrovnat, natož tak předběhnout. Nejen geniální algoritmus pro vyhledávání, který Google v nejpřísnějších utajených podmínkách vyvíjí, ale i síla hardwaru činí prozatím vyhledávání ze stránky Google.com jednoznačně nejlepším. Celou řadu let drželi zakladatelé Googlu Sergej Brin a Larry Page podobu a technologii svých vlastních serverů pod pokličkou. Každého zvědavého novináře či odborníka vždy usměrnila a tajemství udrželi v bezpečí.

Modulární systém serverů BladeCenter společnosti IBM

Teprve v roce 2009 inženýři této společnosti poodhalili roušku tajemství. A ukázalo se, že Google myslí i jedná velmi pragmaticky. Na rozdíl od nablýskaných designových mašin prestižních serverů IBM, Sun, HP či Dell vyhlíží typický server Googlu velmi stroze a nenápadně. Na první pohled by se klidně mohlo jednat o stroj mnohem starší. Opak je ovšem pravdou. Účel světí prostředky.

Největší serveroví giganti

Určit společnosti, které ve svých datacentrech provozují největší počet vlastních serverů není jednoduché. Nejen Google je totiž s informacemi tohoto typu skoupý. Například Microsoft a Yahoo tento údaj nezvěřejňuje, přestože se odhaduje počet jejich serverů nad 100 000. Podívejme se ale na přibližné počty serverů známých firem. Čísla jsou skutečně orientační, navládu Googlu ale není těžké odhalit.

Společnost Počet serverů Poznámka
Google více než 1 000 000  
Microsoft více než 200 000 odhad v roce 2008, nové datacentrum Microsoftu v Chicagu má přidat až 300 000 serverů
Intel 100 000  
1&1 Internet 70 000 jeden z největších poskytovatelů hostingu na světě
OVH 65 000 nejoblíbenější webhosting v Evropě
eBay více než 50 000 (odhad)  
Yahoo více než 50 000 (odhad)  
IBM více než 50 000 (odhad)  
Facebook 30 000  
Time Warner Cable 25 000  
AT&T 20 000 největší operátor v USA

 

Geniální servery z garáže

Geniální servery z garáže

Typický server Googlu není uložen v uzavřené skříni, je sestaven na obyčejné nelakované plechové podložce. Standardní základní deska pro dva procesory je mírně upravena tak, aby neobsahovala zbytečné konektory a rozhraní. Otevřená koncepce umožňuje více spoléhat na chlazení proudícím vzduchem. Geniální je originální patentovaný systém napájení, který při odhalení šokoval všechny odborníky. Zdroj vyvinutý Googlem je zapojen přímo do záložní baterie, ta je pak teprve připojena k základní desce a diskům. Každý server se může spolehnout na vlastní záložní napájení, zdroj je velmi účinný, méně se zahřívá a nevyžaduje proto tolik výkonné chlazení.

Místo dieselových agregátů a obřích záložních baterií může každý server běžet při přerušení energie, případně přerušení energie v určitém bloku datacentra a spoléhat na vlastní zálohu. Přestože odhalené fotografie serverů poukazují na procesory Intel, Google využívá i architekturu od AMD. Jak můžete vidět na fotografii, server vyhlíží spíše jako dílo garážových nadšenců, a nikoli přístroj roky zdokonalovaný nejlepšími techniky Googlu. Když už byste se ale podívali na několik desítek těchto serverů naskládaných v typickém racku (čti [reku]), pochopili byste sílu, kterou vládne.

Google odhalil koncepci svých vlastních serverů až v roce 2009 a pro všechny představoval koncept napájení přes záložní baterii velké překvapení

Geniální je zde i koncept uzavřených buněk (připomínajících maringotku), do kterých jsou racky se servery rozděleny. Každou buňku tvoří samostatný přepravovatelný kontejner, který obsahuje desítky racků po obou stranách, uprostřed je ulička, při vstupu do buňky je přepážkou oddělený pracovní stůl se židlí pro technika. Jednotlivé buňky jsou i díky záložnímu systému zcela nezávislé. Datové centrum skládané z těchto buněk je pak bez problémů škálovatelné. Podobnou modulární architekturu využívají i někteří další výrobci serverů.

Právě jednoduchá konstrukce však Googlu umožnila a stále umožňuje vyrábět obrovské množství serverů levně a udržet při tom vysokou efektivitu celého datového centra (zejména díky menší spotřebě). Kvalita datového centra se posuzuje pomocí jednoduchého výpočtu. Poměr elektrické energie spotřebované na provoz centra (zejména chlazení) a elektrické energie vynaložené skutečně na výpočty a správu uložených dat. Efektivita Googlu patří k nejvyšším na světě. Obrovskou výhodou vlastních serverů je také absolutní nezávislost na cenách serverů zvučných jmen.

Vlastní hardware také dovoluje softwarovým inženýrům lépe navrhnout a optimalizovat aplikace. Nedávno Google představil vlastní technologii, která dvojnásobně zvyšuje rychlost sestavování indexu pro vyhledávání. Nově vzniklé stránky se tak místo tří až šesti měsíců plně zaindexují a zařadí do vyhledávání za jeden až tři měsíce. Zejména při indexování zpravodajství a sociálních sítí je doba aktualizace indexu kritická. V internetovém byznysu tohoto kalibru dnes platí přímá úměra mezi kapacitou datových center dané společnosti a možnostmi služeb, které může uživatelům nabídnout. Ačkoli je Google chápán jako převážně softwarová společnost, právě gigantický počet vlastních běžících serverů určuje jednu z hlavních konkurenčních výhod.

Přední panel serveru společnosti HP. Tzv. File server slouží primárně k ukládání dat, proto zde můžete vidět hned několik zásuvných diskových modulů

CS24

Webové služby obecně konzumují datovou i výpočetní kapacitu jako nenasytný otesánek a nároky rostou exponenciálně. Služby jako YouTube, FaceBook, Flickr, Google Docs, Evernote, Hotmail a další by bez kolosálních datových center vůbec nemohly existovat. O vyhledávání nemluvě. Až usednete ke svému počítači a otevřete webovou stránku, vzpomeňte si, že jste právě zaměstnali některý ze serverů v datovém centru, který pro vás pracuje, aniž byste o něm běžně přemýšleli. A někde tam jsou také uložena - nejen vaše - videa, fotky, e-maily, poznámky, dokumenty apod.

Provokativní myšlenka na konec: ke všem těmto datům má přístup majitel datových center. Týká se to osobních i neosobních informací stamiliónů uživatelů. Věřme tedy, že se Google bude řídit svým vlastním heslem „Don′t be evil“ (nebuď zlý), na kterém založil v USA před mnoha lety svou obrovskou marketingovou kampaň.

Byl pro vás článek přínosný?