Haswell mezi námi – recenze Intel Core i5-4670K a i7-4770K

0

Představení Haswellu

Současně s tímto článkem a samozřejmě v souladu s datem uvedení Haswellu byste měli na sesterském Cnews/Notebooky vidět už článek Honzy Olšana. V něm se dozvíte nejen o „těch zajímavějších“ Haswellech určených pro mobilní počítače, ale především všechny podstatné inovace v architektuře. Jelikož je tento článek především praktickým testem nových Core i7 a i5, připomeneme si už s předstihem známou architekture jen ve zkratce. A na první herní testy grafiky v Haswellu – pro desktopové Core nejčastější HD Graphics 4600 – si pak počkejte na pondělí. V tento den bude také možné už mluvit o dvoujádrových Haswellech.

Intel se už celé roky drží svého modelu tick/tock, jen tentokrát není tock alespoň co se desktopových procesorů týče tak citelný. Už od prvních procesorů Core (Conroe/Merom) se nemění základní prvek (14stavová instrukční pipeline) i některé další základní prvky prováděcích jednotek. V každém kroku tock však dochází ke spoustě menších či větších změn, ať už se jedná o vyrovnávací paměť, instrukční sady, velikosti bufferů, predikci větvení, správu napájení nebo třeba paměťový řadič, jež vedou k lepšímu výkonu procesorů na takt. V kroku tick pak přechod na pokročilejší výrobní proces s menší velikostí tranzistoru zase umožní dosahovat vyšších frekvencí (nebo stejných frekvencí při nižším příkonu).

 

Z architektury Ivy Bridge tak byl zachován 22nm výrobní proces s tranzistory Tri-Gate, základní prvky prováděcích jednotek, většina cache i FPU, paměťový řadič, většina instrukční sad i bufferů. Seznam nejdůležitějších změn a vylepšení však není malý:

  • nové balení LGA 1150 a k němu příslušná patice
  • instruční sady HNI (Haswell New Instructions zastřešuje AVX2 a FMA3)
  • instrukce TSX (Intel Transactional Synchronization Extensions)
  • přidána čtvrtá ALU
  • možnost změny základní frekvence (BCLK) v určitých krocích podobně jako u Sandy Bridge-E v LGA 2011
  • nová a silnější grafická jádra s podporou DirectX 11.1 a OpenGL 4.0
  • vylepšené předvídání skoků a větvení kódu
  • větší velikosti bufferů
  • zvětšené části L1 cache (data store/load) a L2 cache (unified TLB)
  • nový úsporný stav C7 (jako C6, ale vyprázdní se i L3 cache)

Podrobněji se o nich dozvíte ve zmíněném článku na Cnews/Notebooky, nebo si můžete projít galerii obsahující prezentace Intel (především z jarního IDF).

                  

Nové procesory, nová patice – to alespoň v desktopu znamená také nové čipové sady. Čipsety osmé série rozšiřují nativní podporu portů USB 3.0 i SATA 6 Gb/s. Pokud na nějakých deskách najdete ještě starý dobrý slot PCI, tak pro něj ale musí výrobce základní desky osadit přídavný čip (řadič).


 

Rozdíly mezi špičkovým Z87, hlavně po využití grafiky určeným H87, „pracovním“ Q85 či levnějším B85 ilustrují následuchící schémata:


 

 

Jak už jsem zmínil, v toto sobotní dopoledne jsou uvedeny pouze čtyřjádrové procesory Haswell. Přehled všech v současnosti už jistých modelů pro desktop vidíte v tabulkách pod tímto odstavcem. Všimněte si, že kdybyste náhodou chtěli výkonnější grafiku než HD 4600 (třeba Iris Pro 5200 nebo GT3), nemáte s deskou bez napevno osazeného procesoru šanci:

Tím se pěkně plynule dostáváme k parametrům obou testovaných procesorů. U těch je velmi sympatické, že co do frekvence (i s Turbo Boost 2.0) zcela přesně odpovídají svým předchůdcům. Tedy Core i5-4670K kopíruje nastavení i5-3570K a dražší Core i7-4770K se podobá i7-3770K. Srovnání efektivity Haswellu a Ivy Bridge na stejné frekvenci tak bude v testu zahrnuto automaticky.

      

  

Přestože jsem Haswelly testoval v základní desce Gigabyte Z87X-UD3H, nemohl jsem nevyfotit zřejmě poslední „extrémní“ retailovou desku Intelu – DZ87KLT-75K (KinsleyT). Alespoň vidíte kompletní dodaný testovací kit a jste-li příznivci desek Intel, můžete zamáčknout slzu.


 

Parametry vybraných procesorů ve srovnání

Výrobce  Intel  Intel  Intel  Intel  Intel 
Řada  Core i5 Core i5 Core i7 Core i7 Core i7 
Model  3570K 4670K 3770K 4770K 3820
Frekvence  3,4 GHz  3,4 GHz  3,5 GHz 3,5 GHz 3,6 GHz 
Turbo  3,8 GHz  3,8 GHz  3,9 GHz 3,9 GHz 3,9 GHz 
Počet jader  4 4 4 4 4
Počet vláken 4 4 8 8 8
Kódové označení  Ivy Bridge Haswell Ivy Bridge Haswell Sandy Bridge-E 
L1 cache  4× 64 kB  4× 64 kB  4× 64 kB  4× 64 kB  4× 64 kB 
L2 cache  4× 256 kB  4× 256 kB  4× 256 kB  4× 256 kB  4× 256 kB 
L3 cache  6144 kB  6144 kB  8192 kB  8192 kB  10 240 kB 
Paměti DDR3-1600 DDR3-1600 DDR3-1600 DDR3-1600 DDR3-1600
Paměťových kanálů 2 2 2 2 4
Max. kapacita RAM 32 GB 32 GB 32 GB 32 GB 64 GB
Sběrnice 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI)
BCLK 100 MHz 100 MHz 100 MHz 100 MHz 100 MHz
Násobič  34 34 35 35 36
Výrobní proces  22 nm high-k  22 nm high-k  22 nm high-k  22 nm high-k  32 nm high-k 
Velikost jádra  160 mm²  177 mm²  160 mm²  177 mm²  294 mm² 
Počet tranzistorů  1,4 mld. 1,4 mld. 1,4 mld. 1,4 mld. 1,27 mld.
TDP  77 W 84 W 77 W 84 W 95 W 
Instrukční sady SSE4.1/4.2, AES-NI, AVX SSE4.1/4.2, AES-NI, AVX, AVX2, FMA3 SSE4.1/4.2, AES-NI, AVX SSE4.1/4.2, AES-NI, AVX, AVX2, FMA3 SSE4.1/4.2, AES-NI, AVX
Virtualizace VT-x VT-x VT-x VT-x VT-x, VT-d
Integrovaná grafika HD 4000 HD 4600 HD 4000 HD 4600
PCI Express 3.0, 16× 3.0, 16× 3.0, 16× 3.0, 16× 2.0, 40×
Patice  1155 1150 1155 1150 2011
Výrobce  Intel  Intel  Intel  Intel  Intel 
Řada  Celeron Pentium  Pentium  Core i3 Core i5
Model  G1610 G860 G2020 3220 3350P
Frekvence  2,6 GHz 3,0 GHz 2,9 GHz 3,3 GHz 3,1 GHz 
Turbo  –  –  –  –  3,3 GHz
Počet jader  2 2 2 2 4
Počet vláken 2 2 2 4 4
Kódové označení  Ivy Bridge Sandy Bridge  Ivy Bridge Ivy Bridge Ivy Bridge
L1 cache  2× 64 kB  2× 64 kB  2× 64 kB  2× 64 kB  4× 64 kB 
L2 cache  2× 256 kB  2× 256 kB  2× 256 kB  2× 256 kB  4× 256 kB 
L3 cache  2048 kB 3072 kB  3072 kB  3072 kB  6144 kB 
Paměti DDR3-1333 DDR3-1333 DDR3-1333 DDR3-1600 DDR3-1600
Paměťových kanálů 2 2 2 2 2
Max. kapacita RAM 32 GB 32 GB 32 GB 32 GB 32 GB
Sběrnice 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI)
BCLK 100 MHz 100 MHz 100 MHz 100 MHz 100 MHz
Násobič  26 30 29 34 31
Výrobní proces  22 nm high-k  32 nm high-k  22 nm high-k  22 nm high-k  22 nm high-k 
Velikost jádra  160 mm²  131 mm²  160 mm²  160 mm²  160 mm² 
Počet tranzistorů  1,4 mld. 504 milionů  1,4 mld. 1,4 mld. 1,4 mld.
TDP  55 W 65 W  55 W 55 W 69 W
Instrukční sady SSE4.1/4.2 SSE4.1/4.2 SSE4.1/4.2 SSE4.1/4.2, AVX SSE4.1/4.2, AES-NI, AVX
Virtualizace VT-x VT-x VT-x VT-x VT-x, VT-d
Integrovaná grafika HD HD HD HD 2500
PCI Express 2.0, 16× 2.0, 16× 2.0, 16× 2.0, 16× 3.0, 16×
Patice  1155 1155 1155 1155 1155
Výrobce  AMD  AMD  AMD  AMD  AMD 
Řada  Athlon X4 A10 FX  FX  FX 
Model  750K 5800K 4300 6300 8350
Frekvence  3,4 GHz  3,8 GHz  3,8 GHz 3,5 GHz 4,0 GHz
Turbo  4,0 GHz 4,2 GHz 3,9–4,0 GHz 3,8–4,1 GHz 4,1– 4,2 GHz
Počet jader  4 4 4 6 8
Počet vláken 4 4 4 6 8
Kódové označení  Trinity Trinity Vishera Vishera Vishera
L1 cache  4× 16 + 2× 64 kB  4× 16 + 2× 64 kB  4× 16 + 2× 64 kB  6× 16 + 3× 64 kB  8× 16 + 4× 64 kB 
L2 cache  2× 2048 kB  2× 2048 kB  2× 2048 kB  3× 2048 kB  4× 2048 kB 
L3 cache  –  –  8192 kB  8192 kB  8192 kB 
Paměti DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866
Paměťových kanálů 2 2 2 2 2
Max. kapacita RAM 64 GB 64 GB 32 GB 32 GB 32 GB
Sběrnice 5 GT/s (UMI) 5 GT/s (UMI) 5,2 GT/s (HT)  5,2 GT/s (HT)  5,2 GT/s (HT) 
BCLK 100 MHz 100 MHz 200 MHz 200 MHz 200 MHz
Násobič  34 38 19 17,5 20
Výrobní proces  32 nm  32 nm  32 nm  32 nm  32 nm 
Velikost jádra  224 mm²  224 mm²  319 mm²  319 mm²  319 mm² 
Počet tranzistorů  1,18 mld.  1,18 mld.  ~1,6 mld. ~1,6 mld. ~1,6 mld.
TDP  100 W  100 W  95 W 95 W 125 W 
Instrukční sady SSE4.1/4.2, AES-NI, AVX SSE4.1/4.2, AES-NI, AVX, FMA3 SSE4.1/4.2, AES-NI, AVX, FMA3 SSE4.1/4.2, AES-NI, AVX, FMA3 SSE4.1/4.2, AES-NI, AVX, FMA3
Virtualizace AMD-V AMD-V AMD-V AMD-V AMD-V
Integrovaná grafika HD 7660D
PCI Express 2.0, 20× 2.0, 20×
Patice  FM2 FM2 AM3+  AM3+  AM3+ 
Výrobce  AMD  AMD  AMD  AMD   
Řada  A8  Phenom II X4  FX  FX   
Model  A3870K 965 BE  6100 8120  
Frekvence  3,0 GHz 3,4 GHz  3,3  GHz  3,1 GHz   
Turbo  –  –  3,6–3,9  GHz  3,4–4,0  GHz   
Počet jader  4 4 6 8  
Počet vláken 4 4 6 8  
Kódové označení  Llano  Deneb  Zambezi  Zambezi   
L1 cache  4× 128 kB  4× 128 kB  6× 16 + 3× 64 kB  8× 16 + 4× 64 kB   
L2 cache  4× 1024 kB  4× 512 kB  3× 2048 kB  4× 2048 kB   
L3 cache  –  6144 kB  8192 kB  8192 kB   
Paměti DDR3-1866 DDR3-1333 DDR3-1866 DDR3-1866  
Paměťových kanálů 2 2 2 2  
Max. kapacita RAM 64 GB 32 GB 32 GB 32 GB  
Sběrnice 5 GT/s (UMI) 4 GT/s (HT) 5,2 GT/s (HT)  5,2 GT/s (HT)   
BCLK 100 MHz 200 MHz 200 MHz 200 MHz  
Násobič  30 17 16,5 18  
Výrobní proces  32 nm  45 nm SOI  32 nm  32 nm   
Velikost jádra  224 mm²  258 mm²  319 mm²  319 mm²   
Počet tranzistorů  1,18 mld.  758 milionů  ~1,6 mld. ~1,6 mld.  
TDP  100 W  125 W  95 W  125 W   
Instrukční sady 3DNow!+, SSE4A 3DNow!+/Pro, SSE4A SSE4.1/4.2, AES-NI, AVX SSE4.1/4.2, AES-NI, AVX  
Virtualizace AMD-V AMD-V AMD-V AMD-V  
Integrovaná grafika HD 6550D  
PCI Express 2.0, 20×  
Patice  FM1  AM3  AM3+  AM3+   

 

Testovací konfigurace a návod na interaktivní grafy

Testovací konfigurace

AMD FX-8120 vs. Intel Core i5-3570K

Testovací sestava pro jednotlivé procesory se liší jen v nutném minimu. Změny se kromě procesoru samotného týkají v případě různé platformy samozřejmě také základní desky, ty stejné paměti od Kingstonu jsou potom nastaveny dle schopností procesoru (na nejvyšší oficiálně podporovanou frekvenci). 

Operační systémy:

  • Microsoft Windows 7 Enterprise x64, SP1
  • Ubuntu 12.04.1 LTS, 64-bit

Společné komponenty:

  • grafická karta: Gigabyte GeForce GTX 680 OC, 2 GB (GV-N680OC-2GD)
  • systémový disk: Intel X25-M, 160 GB
  • zdroj: Enermax Modu87+, 800 W
  • chladič procesoru: Noctua NH-C12P
  • paměti: 2× 4 GB Kingston HyperX T1 DDR3-2400 (KHX24C11T1K2/8X)

Platforma LGA 1150:

  • základní deska: Gigabyte Z87X-UD3H
  • nastavení pamětí: 1600 MHz, 8-8-8-24-1T @ 1,5 V

Platforma AM3+:

  • základní deska: Gigabyte GA-990FXA-UD7
  • nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

Testování CPU EHW 2012

Platforma LGA 1155:

  • základní deska: Gigabyte Z77X-UD5H
  • nastavení pamětí: 1600 MHz, 8-8-8-24-1T @ 1,5 V

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

Testování CPU EHW 2012

Platforma FM2:

  • základní deska: Gigabyte GA-F2A85X-UP4
  • nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V

AMD A10-5800K test

AMD A10-5800K test

AMD A10-5800K s Gigabyte GA-F2A85X-UP4

Platforma FM1:

  • základní deska: ASrock A75 Pro4
  • nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V

V ovladačích grafické karty jsem vypnul vertikální synchronizaci a kvůli opakovatelnosti měření také adaptivní správu napájení v 3D režimu.

Testování CPU EHW 2012

Testování CPU EHW 2012

Za zapůjčení grafické karty děkujeme společnosti Gigabyte

Testování CPU EHW 2012

Kingston Za zapůjčení pamětí DDR3 děkujeme společnosti Kingston

Za zapůjčení zdroje děkujeme společnosti Enermax

Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution

 

Jak na interaktivní grafy 2.0

  1. Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace. 
  2. V základním nastavení jsou pruhy seskupeny dle úhlopříčky monitory a dále seřazeny dle naměřené hodnoty (vzestupně, či sestupně pak podle toho, je-li zrovna vyšší = lepší či naopak). Toto můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, seskupením třeba podle matrice apod.
  3. Po najetí myší na některou z položek (třeba na HP ZR24w) se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek (v tomto případě procesorů).
  4. Budete-li chtít nějakou položku (monitor) v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
  5. Cenu a další základní parametry (například rozlišení či úhlopříčku) můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
  6. Zámek základu (monitor, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad procesorem (či jeho pruhem v grafu), který chcete uzamknout.
  7. Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problém smažte i příslušné cookies.
  8. Interaktivní grafy 2.0 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou podporovány, verze 10 zatím také ne) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
  9. V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.


Video a hudba

Video

x264 benchmark HD v5.0 64-bit

x264 benchmark testuje výkon procesoru při převodu videa v rozlišení 1080p s použitím kodeku x264. Benchmark je ke stažení na TechARP.com, nově používáme výsledky z obou průchodů.

x264 FHD benchmark v1.0.1 64-bit

FHD benchmark také používá bezplatný x264, počítá už s 64bitovými systémy a má příjemnější rozhraní. Benchmark si můžete stáhnout třeba z Guru3D (181 MB), archiv stačí rozbalit a už můžete testovat. Na rozdíl od x264 HD benchmarku nepotřebujete ani instalovat Avisynth. O výsledky se můžete podělit už v připraveném vlákně v našem diskuzním fóru.

Windows Media Encoder 9

1GB full HD video pořízené Frapsem ve hře Empire: Total War je převáděno do WMV9 720p, 5,5 Mb/s.

VirtualDubMod + XviD 1.3.2

VirtualDubMod slouží pouze jako rozhraní pro převod 1GB full HD videa ze hry Empire: Total War do .AVI s kodekem XviD. Profile @ Level je nastaveno na XviD HD 1080, dále jeden průchod a kvalita na 4,00 (1,00 je nejlepší kvalita, 31 nejhorší). Je zapnuta autodetekce a volba použitelných instrukčních sad (podporovány jsou jak SSE až do SSE4, tak 3DNow! 2), z voleb post-processingu nic vybráno není.

XMedia Recode 3.1.2.5 H.264

Oblíbený freewarový převaděč všech možných formátů videí používám v jeho portable verzi. Opět znásilňuji 1GB Full HD video z Empire: Total War, tentokrát je cílem v programu předdefinovaný profil YouTube 1080p s H.264. V nastavení kvality pak volím místo jednoho průchodu průchody dva (2-pass, cílový průměrný bitrate 8000). Zvuková část je převáděna do AAC.

Shrnutí

Hudba

WAV do MP3: LameEnc 3.99

Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu MP3. Použita je poslední stabilní verze LameEnc, VBR a kvalita extreme. LameEnc využívá instrukční sady MMX, SSE a SSE2.

WAV do AAC (Advanced Audio Coding): iTunes přes qaac (CoreAudioTool 7.9.9.7)

Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu AAC.

WAV do ALAC (Apple Lossless Audio Codec) pomocí refalac64 0.51

Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu ALAC.

WAV do FLAC (Free Lossless Audio Codec) pomocí FLAC 1.2.1b

Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu FLAC.

Shrnutí


Bitmapová grafika, fotografie, rendering

Bitmapová grafika, fotografie

Autopano Giga 64-bit 2.6.4

Autopano mám nastaveno na využití maxima jader procesoru i pomoc GPU. Zdrojem je 57 fotografií (JPEG) o rozlišení 2848 × 4288 px, výstupem pak jeden soubor JPEG se slepeným panoramatem. Jako výstupní kvalita je zvolen HDR output (obsahuje anti-ghost).

Testování CPU EHW 2012

Oproti minulým letům nechává ve výpočtech pomáhat GPU. Nevím ale, jestli se při finálním renderingu panoramatu nějak významně uplatní. V globálním nastavení Autopano dávám maximum vláken, které je procesor schopen paralelně zpracovávat.

Hugin 2011.4 64-bit 

Také zdarma dostupný Hugin pracuje nad 57 fotografiemi panoramatu (fotky je třeba slepovat v ose X i Y) od uživatele Johnyn (děkuji!). Měřím čas od zarovnání obrázků až po kompletní náhled panoramatu v editoru.

 Testy CPU nastavení Testy CPU nastavení

Paint.NET 3

Pro testování výkonu ve volně šiřitelném bitmapovém editoru používáme rozhraní TPUbench a benchmark PdnBench.

RawTherapee 64-bit v3.0.1

Zdarma dostupnou alternativu k placeným editorům RAW (Adobe Lightroom, Apple Aperture) trápím celkem 100 soubory RAW ze tří fotoaparátů (TIFF, CR2, DNG). Ty převádím na JPEG v nejvyšší kvalitě s uchováním EXIFu

3.0.1 byla poslední stabilní verzí v době sestavování metodiky. Vyzkoušel jsem také vývojovou 4.0.9.50, ale na Core i5 se mi podařila konverze stovky souborů dokončit jen někdy, na platformě s AMD FX ani jednou. Vyzkoušel jsem také několik o trochu starších sestavení 4.0.8.x a 4.0.7.x, bohužel s podobným výsledkem. Výkonnostní optimalizace ve verzi 4.x jsou přitom slibné, stejná úloha, co ve verzi 3.0.1 trvala procesoru Core i5-3570K 5:19 (min:s), zabrala ve 4.0.9 už jen 4:29,4 (min:s).

Zoner Photo Studio 15 x64

V jednom sub-testu jsou prováděny dávkové operace nad 56 fotografiemi ve formátu JPEG, v dalším je převáděno 100 fotek ve formátu RAW (TIFF a CR2 z přístrojů Canon a Adobe DNG z DSLR Pentax) do JPEG.

Shrnutí

Rendering

Cinebench R11.5 64-bit

Poslední verze benchmarku výkonu v Cinema 4D. Výsledek při renderingu na jediném jádru uvádíme spíše jako teoretickou zajímavost.

 

 

Frybench 64-bit

Postup měření v programu Frybench je popsán v tomto článku. Vaše výsledky můžete ukázat a s dalšími konfiguracemi srovnávat zde: Frybench – výsledky.

POV-Ray v3.7 beta RC6 64-bit

Beta verze freeware raytraceru POV-Ray umožňuje využít vícejádrové procesory. Pro testy používáme jednu ze scén mezi příklady dodanými s programem: chess2.pov a rozlišení 1600 × 1200 px s AA 0.3 (800 × 600 px bez anti-aliasingu měřím už jen pro srovnání s minulými generacemi procesorů/testů).

Blender 2.63 64-bit

Pro testování v 3D modeláři Blender používám demo-projekt Helicopter (demonstrace Cycles, stažitelné v balíku dem pro 2.61 z blender.org).

Testování CPU EHW 2012

Bez změny nastavení (mimo snížení rozlišení na 800 × 600 px, abych nečekal na výsledek věčnost) spustím rendering (F12) a měřím čas.

LuxMark 2.0 64-bit

LuxMark 2.0 vám v jednoduchém rozhraní otestovat výkon vašeho procesoru (CPU) nebo grafické karty (GPU) na několika scénách vykreslovaných právě pomocí LuxRenderu. U grafické karty budete samozřejmě potřebovat mít dostatečně moderní (včetně ovladačů) – podpora OpenCL (potažmo GPGPU) je minimálním požadavkem. LuxRender je možné využít ve spojení se spoustou modelářů Blenderem či 3Ds Max počínaje a Poserem nebo SketchUpem konče. Více informací ve starší aktualitě o LuxMarku. V systému je nainstalován balík Intel SDK for OpenCL 2012 64-bit a AMD APP SDK v2.7 x64. Do shrnujících grafů započítávám výsledky v komplexní scéně „Room“.

Shrnutí

Do shrnutí z předešlého nepočítám jen Cinebench Single core a LuxMark medium.

 

Komprese a šifrování

WinRAR 4.20 64-bit

Používám zabudovaný benchmark (ALT + B) se zapnutou volbou multithreading. 

Pokud byste se na to náhodou chtěli zeptat, tak namátkou jsem  u procesoru Core i5-3570K vyzkoušel v registru Windows vypnout i Core parking. Výsledkem bylo mírné zhoršení výsledku (což se možná vešlo do běžné chyby měření). U procesorů bez HyperThreadingu dokonce ani kvůli WinRARu nemusíte Core parking nijak řešit.

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

7-zip 9.20 x64

I v 7-zipu využívám integrovaného benchmarku, v grafu je celkový výsledek počítaný z výkonu při kompresi i dekompresi.

WinZIP 16.5 + AES

Extrakce 3,5GB zaheslovaného archivu ZIP (šifrování AES, zkomprimovaná celá složky hry World of Tanks). Zatím se bohužel zdá, že výsledky jsou dost podle toho, jak se zrovna SSD vyspí. Dost nesedí hlavně výsledek Core i3-3220 (byť je to nejlepší ze tří měření).

Testy CPU nastavení

TrueCrypt 7.1a

Testy pochází z integrovaného benchmarku (Tools, Benchmark), velikost bufferu nastavena na 500 MB. Výsledek je průměrem šifrování a dešifrování.

V prvním grafu je spočtena průměrná rychlost ze všech dílčích testů TrueCryptu (tento jediný graf je taková počítán do dalších souhrnů):

Dílčí testy TrueCrypt 7.1a:

Shrnutí

 

Virtualizace (VirtualBox)

VirtualBox 4.1.20 + Ubuntu 12.04.01 x64

Ve VirtualBoxu přiděluji maximum dostupných fyzických jader a 2048 MB RAM.

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K
AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K
AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

Shrnutí

PCMark 7 a multi-tasking

Poslední verzi PCMarku jsem do metodiky zařadil především díky snadnějšímu srovnání s vašimi případně naměřenými výsledky a také proto, že nabízí ještě vcelku přesnou možnost změření výkonu při dvou paralelně prováděných úlohách (multi-tasking).

 


Následující dva testy jsou spouštěny současně:

 


Následující dva testy jsou spouštěny současně:

 

 


 


Následující dva testy jsou spouštěny současně:


 

Linux (Ubuntu 12.04.1 LTS 64-bit)

Ubuntu 12.04.1 LTS 64-bit

Po určitém rozvažování jsem se rozhodl testování v linuxové distribuci nakonec zařadit. Zvolil jsem asi tu „nejlidovější“ a musím říct, že návrat k mému kdysi primárnímu OS se mi docela líbil (přece jen kompletní start docela pěkně vypadajícího prostředí na testovacím HW za šest sekund má něco do sebe).

S vámi bych se chtěl pro začátek poradit, jestli byste uvítali výsledky z Linuxu zařazené mezi ostatní (například C-Ray v renderingu, RAMspeed v kapitole s rychlostí pamětí atd.), nebo takto vyseparovány do své kapitoly?

Phoronix Test Suite

Kompilace jádra

Vždy s parametrem -j počet_vláken (max. podporovaných procesorem).

7-zip 9.20 x64

Stejně jako ve Windows je uváděn jen celkový výsledek (komprese i dekomprese).

GtkPerf

Pro vyšší přesnost navyšuji výchozích 100 kol testů na 1000.

Shrnutí

Tento shrnující graf je sice velkou směskou, ale je zároveň mezivýsledkem účastnícím se na hlavním shrnujícím grafu, tak vám jej pro zajímavost předkládám také.

 

Teoretické testy, PI, prvočísla, Zlib, AES, Hash, VP8, fraktály

Deep Fritz 12 Chess benchmark

Benchmark simulující počítání šachových kombinací skutečného šachového programu Fritz má svoji zdarma dostupnou verzi. Já jsem ale použil benchmark přímo v programu Deep Fritz 12, který by měl být stejný až na jednu drobnost – umožňuje nastavit více než osm vláken (za tip děkuji Flank3rovi).

Testy CPU nastavení Testy CPU nastavení

SuperPI mod XS 1.5

Výpočet Ludolfova čísla na milion desetinných míst.

wPrime 2.0

Vícevláknová obdoba jednoduchého benchmarku SuperPI (samozřejmě se nepočítá Ludolfovo číslo, ale prvočísla).

Y-cruncher 0.5.5

Údajně nejrychlejší program pro výpočet Ludolfova čísla je vícevláknový a autor se chlubí tím, že předčí nejen SuperPi na jednojádru, ale také PiFast na dvoujádru či QuickPi na čtyřjádru.

AIDA64 v2.60

Následující sada testů v AIDA64 (dříve Everest, předtím jen AIDA32) jsou do jisté míry low-level benchmarky. Většina zatíží hlavně ALU, ty od VP8 níže pak FPU. AES je v podstatě testem přítomnosti instrukční sady AES-NI (+ velkou roli hraje propustnost paměti – v single channelu je výsledek sotva 60%).

Shrnutí

 

Rychlost pamětí

AMD FX i Ax podporují frekvenci až 1866 MHz, čehož jsem využil. Ani tak bohužel pro AMD není dosaženo na propustnost a latence níže taktovaných pamětí ve společnosti Ivy Bridge. RAMspeed v OS Ubuntu x64 potvrzuje to samé. Tento linuxový paměťový test však na rozdíl od AIDA64 dokáže těžit i ze čtyřkanálového přístupu procesorů LGA 2011.

Haswell (Core i5-4670K):

 

Haswell (Core i7-4770K):

 

Trinity (Athlon X4 750K):

Ivy Bridge (Celeron G1610):

Ivy Bridge (Pentium G2020):

Ivy Bridge (Core i5-3350P):

Vishera (FX-6300):

Ivy Bridge (Core i7-3770K):

Sandy Bridge (Pentium G860):

Pentium G860: detekce a testy

 Deneb:

AMD Phenom II X4 965

Piledriver:

AMD FX-8350 (Vishera) screenshoty

Trinity:

AMD A10 vs Intel Core i3

Bulldozer:

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

Sandy Bridge-E:

AMD FX-8350 (Vishera) screenshoty

Shrnutí

 

Hry

Není-li řečeno jinak, jedná se o průměrné snímkové frekvence (avg. fps). Téměř vždy jde o nejvyšší možné nastavitelné detaily, jen anti-aliasing zůstává vypnut.

Vysoké rozlišení

Jestli mi někdo bude brečet v diskuzi, že nemám „ful hádé“, tak mu už raději dopředu sděluji, že rozdíl (v Mpx) mezi 1680 × 1050 px a 1920 × 1080 px je malý a ještě více v optice testu CPU. Stejně uvidíte, že i při nastavení max. detailů (jen bez anti-aliasingu, který je opravdu čistě záležitostí GPU) je vliv rozlišení i třeba proti 800 × 600 px vcelku malý – vybrané testy jsou v případě použití GeForce GTX 680 opravdu hodně závislé na procesoru.

 

Call of Duty 4: Modern Warfare

Stále nejspíše nejhranější díl CoD (možná společně s dvojkou) testuji pomocí timedema obsaženého v již dále nevyvíjeném automatizovaném nástroji TpuBench. Detaily jsou nastaveny na maximum, anti-aliasing vypnut.

Enemy Territory: Quake Wars

V OpenGL ET:QW používám osvědčené timedemo a v nastavení dávám předvolbu Quality: High. Ta nastaví skoro vše na maximální hodnoty, jen osvětlení je na hodnotě Normal a anti-aliasing vypnut. Vypnuty jsou i soft particles, anizotropní filtrování je na hodnotě 8×. Přes konzoli hru zbavuji omezení snímkové frekvence. Jiný poměr stran může způsobit, že v rozlišení 640 × 480 px bude výsledek nižší než v 1680 × 1050 px.

Testy CPU nastavení Testy CPU nastavení Testy CPU nastavení    

Left 4 Dead

Zástupce enginu Source je otestován pomocí vlastního timedema, kvůli kterému musím opatrně konzervovat verzi hry (Steam má neustálé tendendce všechno navzdory předvolbám aktualizovat). Nastavuji maximální detaily, trilineární filtraci textur a jen anti-aliasing zůstává vypnut. Důležité je zapnutí multicore renderingu a vypnutí vertikální synchronizace.

 Testy CPU nastavení Testy CPU nastavení

The Elder Scrolls V: Skyrim

Pro testování jsem vybral dvě uložené pozice v lokacích Whiterun (pohled na velkou část měst a ještě i za hradby) a Riverwood (stromy, voda, vesnice – v ZIPu je ještě třetí pozice Ragged Flagon (podzemí Riftenu), kterou jsem pro testy CPU nevyužil). Po nahrání uložené pozice počkám, až se uklidní ukazatel se snímky za sekundu (načítání z disku, obyčejně je to ale tak dvě až tři sekundy po zmizení nahrávací obrazovky) a poté měřím deset sekund (nastaveno ve FRAPSu). Nahraji další pozici a postup opakuji. V grafu je hodnota průměrných fps spočtena jako průměr dvou desetisekundových měření. Použitá verze hry je 1.7.7.0.6, nejsou přidány žádné balíčky textur ani jiná rozšíření.

Testy CPU nastavení Testy CPU nastavení Testy CPU nastavení

Unreal Tournament 3

Letitý UT3, jehož engine je stále základem obrovského množství her, testuji pomocí průletu na VCTF-Suspense. Detaily jsou nastaveny na maximum (ve hře číslo 5, což obnáší i 16× AF), fyzika softwarová. Beru lepší výsledek ze dvou opakování.

World in Conflict

Oproti minulé metodice mohu díky dostatečně výkonné grafické kartě nastavit celkové grafické detaily na hodnotu Nejvyšší. To obnáší DX10 rendering a dokonce 4× MSAA. Vypnuta je pouze volba Voda odráží oblaka. Podobně jako ET:QW, i World in Conflict podporuje FOV a výsledky v nižším rozlišení s poměrem stran 4:3 mohou být vyšší než ty v 1680 × 1050 px s 16:10.

World of Tanks

V klientu verze 8.0 přehrávám replay v jedné z nejnáročnějších a současně na procesoru nejvíce závislých map: Ensk. S poměrně svižným stíhačem tanků SU-100 projedu velkou část mapy (problematické křoviny, většinu města). Často je používán sniper mód, především na začátku hry pak oddálení kamery a celkový pohled na spoustu objektů. Použit je Rendering Improved, Graphics Quality je nastaveno na Maximum, vše až na položku Enhanced Shadows je na maximálních možných hodnotách.

X-Plane 10

V náročném leteckém simulátoru používám benchmark skript spouštějící hru s parametrem –fps_test=1 (2, 3), ze tří různých testů pak dělám průměr. Ten je prezentován v grafu. V Setting, Rendering Options jsou prakticky všechna nastavení detailů v horních třech oddílech na maximu, počty objektů a cest na hodnotě „tons“. Detaily letiště ponechány výchozí, detaily odrazů na vodě jsou vypnuty stejně jako „HDR anti-aliasing“. Mraky nastaveny na rovněž výchozích 100 %. Přesná verze hry je 10.05r1.

 

Testy CPU nastavení

 

Nízké rozlišení

Druhá sada herních testů je prováděna v co nejnižším rozlišení, detaily jsou však typicky nastaveny na maximální hodnoty (kdyby náhodou CPU byl účasten na některých z nich).

Nastavení Skyrimu:

Testování CPU EHW 2012 Testování CPU EHW 2012 Testování CPU EHW 2012  

Výsledkem v grafu je průměr z výkonu ve dvou lokacích (Whiterun a Riverwood):

Shrnutí

Všechny herní testy se podílí na výsledném průměrujícím grafu z her, beru jak výsledky z nízkého, tak vysokého rozlišení. Minimální fps měřená ve World in Conflict a World of Tanks do toho samozřejmě nemotám.

Přetaktování a provozní vlastnosti (příkon, zahřívání)

Přetaktování

Na přetaktování mi jako obvykle nezbyl pořádně čas. Než jsem se k němu dostal, tak jsem kit s i7-4770K musel poslat dál, potrápil jsem tak jen rychle před odletem na Computex i5-4670K v Z87X-UD3H. Vyzkoušení možnosti změn BCLK podobně jako na LGA 2011 si nechám pro test některého z procesorů bez směrem nahoru otevřeného násobiče, v tomto případě stačilo jen v UEFI zvedat násobič frekvence procesoru, vypnout Turbo Boost a případně ladit napětí. S tím základním nebylo problém stabilně provozovat 4,2 GHz:

To ale není nijak zajímavé navýšení frekvence, takže jsem odzkoušel 4,5 GHz. K jeho zcela stabilnímu běhu bylo třeba zvýšit napětí na 1,4 V. Už to napovídalo, že se zřejmě nejedná o bůhvíjak dobrý kus pro přetaktování:

Problém byl však jinde. Ačkoli heatpipe chladiče Noctua zůstávaly vlažné, procesor v zátěži snadno přesahoval 90 stupňů Celsia a throttloval:

Abych tento kus tedy nějak slušně přetaktoval, musel bych sejmout jeho rozvaděč tepla. A opakuje se situace z Ivy Bridge – můžete si sice koupit bůhvíjak výkonný chladič, limitovat vás ale stejně bude teplovodivost kontaktu mezi procesor a jeho IHS.

Příkon (spotřeba) změřený izolovaně na EPS12V

V recenzích procesorů na EHW se můžete setkat kromě tradičního měření příkonu celé sestavy zásuvkovým wattmetrem také s izolovaným měřením příkonu na EPS12V.

Bočník měřící procházející proud sestrojil Honza Černý, napětí bylo kontrolováno běžným multimetrem VoltCraft VC-140.

Příkon (spotřeba) celého PC s daným CPU

wattmetr

Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce (i když i v tomto případě jsou podmínky díky použití desek Gigabyte ze stejné třídy v rámci možnosti co nejvíce srovnány).

Teplotní testy berte spíš jako velmi hrubou informaci. Použitým chladičem je sice Noctua NH-C12P a pastou pak Noctua NT-H1, přesto může dojít k ne vždy stejnému rozetření pasty a teplota okolí se může také mezi testy lišit až o tři stupně Celsia.

   

Důležité je také přímo nesrovnávat teploty CPU napříč různými platformami. Intel i AMD mají teplotní senzor pojat evidentně dost jinak.

Shrnující grafy

Kdo rád přeskakuje kapitoly, nebo prostě nemá tolik času, snad ocení právě tuto kapitolu. Všechny souhrnné (průměrující, zjednodušující, zkreslující – jak chcete) grafy z předchozích stránek pěkně pohromadě.

Shrnutí a verdikt

Po všech těch shrnujících grafech jako obvykle ještě jeden pořádně zavádějící (nejsou započítány výsledky z kapitol Teoretické testy, Rychlost pamětí a PCMark 7):

Podělíme-li celkový (průměrný) výkon procesorů jejich cenou, vypadne nám takovýto „index výhodnosti“:

Ten by ale platil jen v případě, že byste kupovali pouze samotné CPU. Jak by tomu bylo, kdybyste naopak kupovali celé PC? Zkusil jsem pro takový případ udělat modelovou sestavu se zhruba podobně vybavenými deskami pro zúčastněné platformy.

 

Monitor, klávesnici, myš a další možné periferie už jsem do modelu nezahrnoval. Samozřejmě je trochu problém v tom, že pokud bude někdo uvažovat o AMD A10, potom nejspíše nebude chtít nic víc než integrovanou grafiku HD 7660D. Do kalkulace by tak bylo lepší započítat levnější Athlon pro FM2, to ale bohužel není dost dobře možné – nejvýkonnější oznámený Athlon nemá tak silné CPU jako A10 (ale jako A8). Levnější Core i3 a Pentia zase budou lidé častěji párovat s deskami s čipsetem B75, nikoli Z77. Jistě chápete, že to nelze udělat pro všechny kombinace a odrážíme se ve zbytku komponent od jakési „střední třídy“.

Už při prvních pokusech o zavedení poměru výkon/cena celé sestavy jsme se v diskuzi dopracovali k tomu, že možná takovým optimem pro počítání výkon/cena by bylo vzít v potaz nikoli cenu celé sestavy, ale toho, co typicky upgradujete a spolu to nejvíce souvisí: tedy kromě procesoru ještě také základní desku a operační paměť.

Verdikt

Nebýt toho, že pro Haswelly potřebujete novou základní desku kvůli nové patici 1150, tak většina uživatelů desktopových PC novou generací procesorů Core asi vzrušena moc nebude. Hlavní nevýhodu jsem tak zmínil, ve zbytek hodnocení už může být veskrze pozitivní.
Namísto toho, aby Intel uvedl něco od základu nového jako v poslední době jen AMD se svými FX (Bulldozer), věnuje se alespoň v desktopu spíše vybrušování diamantů. Výsledek se dostavuje ale takřka v jakémkoli testu. Haswell je díky dílčím vylepšením v průměru o 8 % lepší než odpovídající Ivy Bridge. To samozřejmě majitele vyšších Core architektury Ivy Bridge nebo i Sandy Bridge vůbec nezajímá, z pohledu někoho, kdo upgraduje z ještě starších generací nebo kupuje nový počítač, je to však jasný ukazatel.
Je trochu škoda, že Intel nejspíše nijak nezlepšil teplovodivý kontakt mezi rozvaděšem tepla a procesorem, takže přetaktování Haswellu se bude podobat Ivy Bridge. Alespoňže těm, kdo nekoupí procesor s otevřeným násobičem (K, unlocked) svitla naděje v podobě možných změn základní frekvence (BCLK) jako u LGA 2011. 
Všechno je to takové drůbky, ale můžeme konstatovat, že vylepšení se povedlo, výrobci základních desek budou moci zase něco prodávat a na desktopu toho v současnosti s procesory stejně není nic moc potřeba vymýšlet.     

Procesory Intel Haswell pro desktop (Core i7-4770K a i5-4670K)

Plusy / mínusy
  špičkový výkon napříč všemi testy
  vysoký výkon na jádro, ještě zlepšený proti IB/SB
  dobrý poměr výkon/příkon
  zlepšení výkonu ve vícevláknových aplikacích, lepší propustnost pamětí
  silnější a schopnější integrovaná grafika
  snadné přetaktování s otevřeným násobičem
  dobrý poměr cena/výkon u i5-4670K
  pro hry takřka optimální procesor (platí hlavně pro Core i5-4670K)
  nová patice, nutnost kupovat novou desku 
  zlepšení nejsou pro majitele SB/IB dostatečně znatelná
  výše přetaktování limitována rozvaděčem tepla (zahřívání procesoru)
  nejsilnější integrované grafiky nejsou u žádného procesoru do patice 1150
  cena Core i7 není tradičně moc výhodná
Cena 8090 (i7-4770K) a 5590 (i5-4670K) Kč (vč. DPH)