Nebezpečné teploty u GeForce GTX 1070/1080 od Evgy. Požádejte o termální vložky

41

Netrvalo to dlouho, a máme tu
další průšvih v oblasti grafických karet. Zatímco
nestabilita
GP104 s pamětmi Micron
byla relativně nezhoubná a vyřeší
ji opravený firmware, problém, který se objevil u grafik
Evga, je závažnějšího charakteru. Postihuje modely GeForce GTX
1080 a GTX 1070 této firmy, u nichž návrh PCB způsobuje
přehřívání komponent, jež může vést i k jejich
shoření. Chyba tedy obnáší ne úplně triviální riziko.

Postižené jsou grafiky GeForce GTX
1070 a GTX 1080 s chladičem ACX (a pro pořádek je
třeba říct, že nejde o problém Nvidie, ale jen tohoto
výrobce). Karty zřejmě nemají správně vyřešené chlazení
napájecí kaskády kontaktem s pasivem chladiče. Pod zátěží
se PCB karet těmito komponentami silně zahřívá a zdá se,
že dost na to, aby v praxi mohlo dojít ke poškození karty.
Podle recenze
na webu Tom’s Hardware
, kde můžete vidět kartu rozebranou (viz galerie níže),
není důvodem, že by paměti a kaskáda neměly obvyklé
teplovodivé podložky. Ty zde jsou, ale zajišťují jen kontakt jen
s plátem kryjícím PCB, a ne již s pasivem samým. Což
není neobvyklý zjev, ale zdá se, že u těchto konkrétních
karet tím padá kosa na kámen.

Termovize karty Evga GeForce GTX 1080 FTW během Furmarku, bez backplate (Zdroj: Tom's Hardware)
Termovize karty Evga GeForce GTX 1080 FTW během Furmarku, bez backplate (Zdroj: Tom’s Hardware)

Uživatelé údajně mohou pozorovat
nestabilitu (což ale podle Evgy může být způsobeno
i nesouvisejícími závadami), v méně šťastných
případech se ale spálily součástky a karta se zničila.
Někteří uživatelé spálené karty doložili fotografiemi, takže
hrozba je asi reálná. I přehřátá napájecí kaskáda může
být sama o sobě ohrožena nevratným poškozením, jelikož se
stoupající teplotou jsou MOSFETy schopny zvládnout menší a menší
proudy, než selžou.

Tom’s Hardware uvádí, že regulátory napětí
se mohou dostat k 107–114°C (ovšem je třeba říct, že ve
Furmarku). Problém zřejmě nastane, pokud je ve skříni omezený
průvan, nebo je pokojová teplota vyšší, což zákonitě vede
k vyšší teplotě i zatěžovaných komponent. Zhoršit
situaci pak může i přetaktování.

 Problémy s přehříváním GeForce GTX 1080 a GTX 1070 značky Evga
 Problémy s přehříváním GeForce GTX 1080 a GTX 1070 značky Evga

 

Teploty mají vyřešit teplovodivé vložky

Evga problém tak docela nepřiznává,
i opakované testování dle ní ukázalo, že provedení karty
má dostatečnou rezervu. Bez ohledu na to ale nabízí řešení
vysokých teplot PCB. Ti, kdo si postižené karty koupili, dostanou
zdarma vložky pro přenos tepla, které zajistí chybějící
kontakt komponent (respektive plechu, který je kryje a podložky pod
sebou již má) s chladičem. Tím by se mělo nebezpečnému
přehřívání zamezit. Vložky by měly přijít na přední stranu
nad napájecí kaskádu, vedle toho ale další půjdou mezi PCB
a backplate. To zde má negativní vliv, nedovoluje totiž, aby
se PCB shora ochlazovalo průvanem.

Vložky (nazvané „Evga Thermal Pad
Mod“) si můžete vyžádat přímo na
webu firmy Evga
, musíte ale pro to být registrováni. Zda je
možné kartu vyměnit za opravený kus či reklamovat
prostřednictvím prodejců, vyjádření Evgy nezmiňuje. Ta jinak
tvrdí, že design karet není v rozporu s bezpečnými
specifikacemi a že opravné vložky jsou jen „pro ty
uživatele, kteří chtějí mít nižší teploty“. Bez ohledu na
to bych ale doporučoval si je sehnat a kartu opravit. Mezitím
bych asi pro jistotu asi pokusil omezit zatěžování nebo alespoň
zajistit co nejnižší teplotu vzduchu ve skříni/v okolí –
nebo grafiku dočasně podtaktovat pro snížení příkonu.

 

Kromě GeForce GTX 1070 a GTX 1080
s chladičem ACX, kterých se tento problém primárně týká,
firma snad podle webu techPowerUp uvažuje o distribuci vložek
i pro některé další modely. V tomto směru ale zatím
další informace nebo nějaké potvrzení nemáme.

 

Zdroje: Evga,
GamersNexus,
techPowerUp,
eTeknix

Nebezpečné teploty u GeForce GTX 1070/1080 od Evgy. Požádejte o termální vložky
Ohodnoťte tento článek!

41 KOMENTÁŘE

  1. Kdyby se konecne nekdo u nvidie podival na diskze po cem lidi uz roky volaj, tj aby konecne Nvidia zacla davat na sve grafiky teplotni cidlo na VRM napájecí kaskadu, mohlo se tomuto predejit..
    U AMD je to standard uz dlouhe roky, tj nechapu proc je u Nvidie problem. Jde o soucastku ktera stoji doslova centy, tj GPU to prodrazi zcela minimalne.

    • kaBelko, trochu se zamysli nad tou blbostí, co jsi napsal. Odkdy má výrobu nereferenčních karet na starosti Nvidia? To, že tam není teplotní čidlo, je jen chybou výrobců, kteří jej tam nedají, takže opravdu nechápu, jak za tohle může Nvidia, jakožto výrobce grafických čipů.

      • to teplotni cidlo nemaji ani referencni Nvidie + u AMD to teplotni cidlo maji referencky i nereferencky tak kde je problem?
        Takto by si kazdy majitel grafiky mohl zkontrolovat zda ma teploty OK nebo ne a pripadne to dal resit. takto zakaznik o nicem nevi dokud karta neodejde.. to ti pride jako lepsi reseni? Kort u karet kde se to muze prehrivat mene a proto karta odejde skoro ihned po skonceni zaruky? Jako tohle vsechno podstupovat kvuli tomu ze vyrobce usetri par centu na grafice? pritom u nvidie sou obecne marze vysoke takze nechapu proc by tam to cidlo nemohlo bejt taky kdyz u AMD je to roky dozadu standard.

        • No a ?

          Stále ide len o to že sa vyskytol problém pri grafikách jedného výrobcu – EVGA – vďaka jeho blbému návrhu ale podľa teba za to ako obvykle môže nVidia – navrhovateľ čipu 😀

          Ale dobre, hrajme sa podľa teba a teda POCHVÁĽME nVidiu že VŠETKY ostatné 1070/1080 od ASUS/MSI/GB/Zotacu/Grainwardu/Palitu a spol. nemajú problémy s chladením – vivat nVidia !

          …ale hej, takto pozitívne to už neplatí že ? 😀

        • A jistě jsou všechny Radeony od různých výrobců do jednoho vybaveny teplotním čidlem v napájecí kaskádě 😉

          Přestaň do toho míchat výrobce grafických čipů, tohle je jen na výrobcích samotných karet. Btw, napájecí kaskády mnoha Radeonů rovněž mívaly přes 100 °C a nikdy to nebyl problém (to není ironie, ale fakt, že to ničemu nevadilo, protože ty součástky takové teploty vydrží). A najednou tady vyskakuješ jak čertík z krabičky, protože Nvidia. Jo jo, objektivita hadra.

          • no vidis u AMD tu teplotu aspon vis 🙂 U nvidie nemas sanci to ani zjistit pokud nemas 20tis na thermokameru.. Pritom se pak zpetne pride na to ze naka serie tech 100-110°C hreje taky jenom se o tom drive nevedelo protoze karty nemaj cidlo na teplotu.

            To ste jako vsichni proti aby nvidia tyhle cidla zacla pouzivat taky nebo jak to mam chapat?

            • Kolikrát ti mám opakovat, že je to na výrobcích grafických karet, nikoliv na výrobci grafického čipu. To jsi tak natvrdlý? A tomu, že ty čidla nemají ani zdaleka všechny karty s čipem od AMD se také vyhýbáš, jak vidím. Ale co jiného od tebe čekat.

            • on nechápe, ani čí je, ne to, že teplotní čidlo VRM není v čipu … před časem, když jsem se pohoršoval nad tím, že VRM na POlarisech jde přes 100 stupňů, byl jsem upozorněn, že VRM snese mnohem vyšší teploty, než 150 stupňů. Na to jsem reagoval, že okolním komponentům to asi jedno nebude, sklidil jsem vesměs negativní hodnocení … platí tedy, u nvidie fuj, u amd normál ?

            • u Stachůje a jemu podobných oveček toto tzv. Stachovo měřítko (alergické na zelenou barvu) platí na 100%…

            • Samotné čidlo samozrejme nemáš v GPU, ale povedz mi kam by si to čidlo akože chcel pripojiť aby si mohol sledovať teplotu napr. v GPU-Z ? No jasné že musíš mať nejaký vstup prípadne rovno prevodník v GPU. Inak ti výrobca môže nahádzať aj 100 čidiel na kartu no čo z toho keď ich nemá kam pripojiť. Ak by to bola čisto vec výrobcu, tak môžem predpokladať že všetky karty od MSI radu Gaming majú meranie teploty VRM, kedže moja 290X ich má ? Alebo je tam rozdiel akej značky mám GPU či od AMD alebo nVidie ?

              Výrobcovia sa vždy prispôsobujú tlaku užívateľov. Ani AMD nemalo vždy podporu pre meranie teploty VRM, ak sa dobre pamätám odpálila to až veľmi podobná aféra kde sa VRM časť prehrievala na 110°C u referencie. Samozrejme takéto teploty sú nežiadúce, 150°C pri mosfetoch bude najskôr úplne maximum, dokonca pri skladovaní, no ako už písal autor článku jeho vlastnosti s rastúcou teplotou prudko klesajú, najme max prechodový prúd.

              Ak pôjdem ďalej do histórie tak ani samotné GPU neumožňovalo užívateľsky sledovať vlastnú teplotu, to prišlo až s neskorším pretaktovávaním.

              Samozrejme za tento konkrétny problém sú zodpovedný v EVGA. Môžme ale predpokladať, že ak by boli čidla VRM bežnou súčasťou kariet s GPU od nVidie, tak by si tieto teploty strážili lepšie, pretože každý užívateľ by si ich mohol bez problémov kedykoľvek skontrolovať. A určite sa zhodneme že “prehrievanie” žiadnej značke na lesku nepridá.

            • Jestli se nepletu, tak jsou teplotní čidla u GPU řešena úplně stejně jako u základních desek, tzn. samostatným I/O obvodem na plošném spoji grafiky, který s grafickým jádrem nesouvisí.

            • Máš nejaký screen GK kde je ten I/O vidieť ? Mne sa to nejako nezdá že by tie čidla riešili samostatnou cestou cez zbernicu PCIe. Logické by ešte bolo keby je prevodník čidla zakomponovaný v hlavnom ovládači VRM a z neho by sa už komunikovalo do GPU digitálne, ale aby sa pre tie čidla obsadzovali samostatné piny alebo nebodaj linky PCIe zbernice ?

              Na základných doskách je to myslím riešené tak ako píšeš, akurát ten obvod má viac účelov, myslím celkovo vychytávky čo sa dnes zvyknú dávať na dosku, t.j. ovládanie vetrákov, rôzne ledky, segment displaye a tak. Až ten sa potom napája na nejakú dátovú zbernicu (IRQ ?), najskôr asi do south bridgu.

              Jop mimochodom vetráky GK sú tiež riadené priamo z GPU cez nejaký PWM tranzistor nie ? Tak fakt nechápem prečo by si to komplikovali priamo cez PCIe. V konečnom dôsledku informácia o teplote VRM môže aj priamo slúžiť jej driveru, prípadne aj v súčinnosti s GPU ako tepelná ochrana VRM. Čiže v prípade zlyhania chladenia (zlý tepelný kontakt, výrobná vada) by to nemuselo dopadnúť ako na tých obrázkoch hore.

              Ak sa ale mýlim a máš nejaké vierohodné info o opaku rád sa poučím.

            • VRM jako celek se skládá z VRM řídícího obvodu a z tolika podřízených VRM obvodů s výkonovými FETy, kolik je napájecích fází. Přičemž obvykle každý z těch podřízených VRM obvodů může být řízen samostatně včetně měření teploty každé fáze zvlášť.
              Jak přesně je to řešené v rámci celé grafické karty, to řekl bych záleží, jako u všeho, na penězích – jaká je cílovka (cena) karty. Pro VRM, měření teploty, větráky, apod. může být využito relativně jednoduché napojení na GPIO GPU nebo použity externí specializované čipy napojené přes I2C sběrnici.

            • Trochu som pátral a ona tam tá obslužná zbernica jedna je, SM BUS (vľavo hore):
              http://cfile3.uf.tistory.com/image/1668D21E4A793AA1229E75
              Čiže tá možnosť pre výrobcov by tam mala byť.

              Nepodarilo sa mi však zistiť či sa na všetok takýto monitoring používa konkrétne táto zbernica, alebo je ich viac, t.j. základná doska má vlastnú, PCIe porty svoju a GK svoju vlastnú internú smerujúcu do GPU, z dôvodu maximálnej možnej šírky dátového prenosu. Ono je tam toho už celkom dosť : http://imgur.com/a/KLa2y
              Toto vedia určite tvorcovia programov ako AIDA, GPU-Z a pod.

              Pre účel sledovania napájacích parametrov, čiže prúdov ale aj teplôt, je štandardizovaná zbernica PMBUS >> Power Management BUS, či sa ale aj bežne takto označená používa v mainstream PC neviem.

              Ísť viacej do hĺbky by už bolo zrejme na samostatný článok.

  2. Lol a to jsem uvažoval že přejdu od Gigabyte na EVGA. Tak asi ne no.
    Navíc na fotce je 10 fázová napájecí kaskáda. Myslel jsem že to bude lepší než u Asus kterým má jen osm.
    EVGA pochybila testování když odemknula TDP limit. To je jasné. Ono odemknutí TDP limitu ani nemusí být žádoucí pro výkon u high-end karet.

    • tak o odemknuti nic nevim ale i tak pokud to udelali tak je to chvalihodne protoze tech defaultnich 10-12% co tam Nvidia povoluje je k smichu.. Bohuzel meli tomu ale uzpusobit chlazeni VRM kaskady a tohle nekdo proste podcenil.. Asi proste chteli zlevnit vyrobu, prece jenom Nvidia na EVGA celkem tlaci aby meli ceny nizsi nez FE edice ktera je jeste hur zpracovana tj tlak na EVGA je obrovsky v tom stlacovat cenu co to de..

      • Yep a navíc tam EVGA má karty s 8+6pin i dokonce 8+8pin. Je třeba ale vzít v potaz že taková karta bere z PCIE slotu jen 25W potom. Moje karta má taky přesměrované napájení do externího konektoru. Což si myslím že je rozumné.

        • tim ze nuti vyrobce aby mely ceny nereferencek pod urovni FE edici ktere jsou osekane az to neni hezky.. vyrobci maj pak celkem nuz na krku aby vyrobili kartu jeste v pozitelnym provedeni za jeste mene penez a stale na to vydelali.. to je proste sibenicni..

          Driv byly nereferencky vzdy drazsi nez ty referencni (logicky) protoze byly udelane lepe a meli lepsi chlazeni. Nvidia to jaksi “obratila” 🙂

          • No jasne. NVIDIA všetkých do niečoho núti a pritom klame a kašle na zákazníkov. To bude nejaká všemocná firma na ktorú nikto nemá a všetci sa jej boja. Asi tak si to v tvojej hlave predstavuješ? 🙂

            • Ale všimni si ako on tie výmysly dokáže otočiť proti nVidii a pritom si neuvedomuje že to čo hovorí by bolo vlastne pre nás zákazníkov super, lebo ak: “nuti vyrobce aby mely ceny nereferencek pod urovni FE edici” tak ak by mal aj hneť pravdu, super – veď tá úžastná nVidia tlačí na výrobcov aby svoje tiché nataktované nereferencie s 3ročnou zárukou predávali lacnejšie než toho odporného, nepodarené a zlého sku*vysyna Founder Edition 😀

              Ale náš obľúbený Honzov posluhovač urobí z toho že napr. luxusné GTX 1080 od MSI aka GAMING X/Asus STRIX/GameRock stojí menej než FE problém a na vine nieje nikto iní než nVidia 😀

              …a kaby tie nereferencie stáli 900€ tak by zase vrieskal že čo sú to za ceny 😀

  3. Z EVGA fóra – od EVGA_JacobF (EVGA Product Manager)

    11/1/2016 – Recently, it was reported from several sources, that the EVGA GeForce GTX 1080 FTW PWM and memory temperature is running warmer than expected during Furmark (an extreme stress utility).

    EVGA has investigated these reports and after extensive testing, below are our findings:

    On ACX 3.0, EVGA focused on GPU temperature and the lowest acoustic levels possible. Running Furmark, the GPU is around 70C +/- and the fan speed is running approximately 30% duty cycle or lower.
    However, during recent testing, the thermal temperature of the PWM and memory, in extreme circumstances, was marginally within spec and needed to be addressed.

    Conclusion: EVGA offers full warranty support on its products, with cross-ship RMA*, and stands behind its products and commitment to our customers.

    To resolve this, EVGA will be offering a VBIOS update, which adjusts the fan-speed curve to ensure sufficient cooling of all components across all operating temperatures. This VBIOS will be released in the next few days and users can download it and update their cards directly. This update resolves the potential thermal issues that have been reported, and ensures the card maintains safe operating temperatures.

    For those users who want additional cooling beyond the VBIOS update, EVGA has optional thermal pads available. This update is not required, however; EVGA will make it available free of charge to any customer who is interested. To request the thermal pad kit, please visit http://www.evga.com/thermalmod

    Any customer who is not comfortable performing the recommended VBIOS update, may request a warranty cross-shipment* to exchange the product to EVGA for an updated replacement.
    All graphics cards shipped from EVGA after 11/1/2016 will have the VBIOS update applied.

    *The EVGA EAR(Advanced RMA Program) and Cross Shipping options are available in the Continental United States, Hawaii, Alaska, Canada, EU, UK, Norway, and Switzerland. EVGA offers Standard RMA replacement options in the Middle East, Africa, India or outside of the before mentioned supported areas.
    ——————————————————–
    Q. If my Graphics Card is not an ACX 3.0 design is it affected?
    A. No, all other GPUs sold by EVGA including Founders Edition, Blower type, HYBRID, and HYDRO COPPER editions are unaffected.

    Q. Does the VBIOS fix the temperature issues?
    A. Yes, the VBIOS update will fix the temperature issues.

    Q. Is my card damaged from running at a higher temperature?
    A. No, but should any future warranty service be needed, EVGA stands behind its products.

    Q. What happens if my card is accidentally damaged during the optional thermal pad installation?
    A. EVGA will stand behind its customers with full warranty and cross-shipment.*

    Q. What if I am not comfortable updating my VBIOS?
    A. While EVGA has very user friendly ways to update VBIOS’s, if you still do not feel comfortable, we will support you with and advanced RMA and ship you a replacement card with the latest VBIOS.

  4. Já to ještě doplním o toto prohlášení Evga (http://forums.evga.com/GTX-1080-FTW-Black-screen-fans-spin-up-to-100-m2530081.aspx):

    EDIT BY EVGA (10/24/2016)
    Recently, there are many customers wanting to know more details about the EVGA GeForce 1080 FTW “Black Screen” issue and we believe we need to make a clear statement to clear all kinds of speculation.

    The EVGA GeForce GTX 1080 FTW “Black Screen” issue was fixed as of the first week of September and this has been confirmed by all users who have received the replacement units with the issue resolved. Also, all new production has been confirmed to not have this issue after the first week of September.

    This previous black screen issue was caused by On Semiconductor (VRM IC Manufacturer) VRM IC’s being out of spec, triggering the OCP (Over Current Protection) and will not cause any damage to your system. The percentage of the IC’s that were out of spec has been confirmed by On Semiconductor and is approximately 3% to 4%. Since then, EVGA and On Semiconductor have worked out the solution and RMA replacement action a couple months ago as we stated above. At this moment, all of the EVGA GeForce GTX 1080 FTW’s have been corrected and all products in the field are working properly.

    Pokud bylo uvedené procento VRM obvodů od On Semi mimo tolerance s OCP, otázka je, s čím ještě byly mimo toleranci, což při zvýšené teplotě VRM, na kterou si někteří zákazníci stěžují (a kterou Evga potvrdila s tím, že je v toleranci), mohlo vést ke spálení VRM na několika kartách.

    Nicméně Evga se k těmto problémům postavila čelem (což je o ní vcelku známé).