EDAC - Error detection and correction

Co to je?

EDAC v překladu znamená detekce a oprava chyb. V Linuxu EDAC obnáší sérii modulů, které využívají schopnost hardwaru detekovat chyby. V současnosti je podporováný hardware, který detekuje následující chyby:

  • chyby operační paměti (to je původní a nejrozvinutější část projektu) - mnoho počítačů podporuje RAM EDAC (především čipsety určené pro použití s aplikacemi s požadavkem vysoké spolehlivosti), ale je třeba mít RAM s ECC (Error-correcting code, kód opravující chyby)
  • chyby při přenosu přes PCI sběrnice - většina PCI mostů a periferií podporuje tuto detekci chyb

K čemu mi bude?

Bez EDAC modulů…

  • Když dojde k porušení dat na PCI sběrnici (např. když se data naruší během přenosu z/do síťové karty), ani o tom nebudete vědět, protože většina systémů nekontroluje paritní chyby PCI zařízení (některé systémy spustí nemaskovatelné přerušení, ale nebudete znát jeho příčinu).
  • Pokud máte ECC paměť a objeví se opravitelné ECC chyby, nejspíš se o nich nedozvíte. S EDAC se o chybových paměťových modulech dozvíte dříve, než se chyby stanou neopravitelnými a vy budete moci přijít o data - to zahrnuje také vypátrání paměťových modulů, které jsou chybné z výroby, dříve, než jsou dány do provozu (což vám ušetří čas a potíže).
  • Pokud máte základní desku s podporou ECC a BIOS ji korektně nepovolí, o problému se vůbec nedozvíte (dokud počítač nespadne s nevysvětlitelnými chybami paměti - nedojde ani nemaskovatelnému přerušení a peníze utracené za podporu ECC přijdou vniveč.

Reference

Volba v nastavení jádra: CONFIG_EDAC

Domovská stránka: http://bluesmoke.sourceforge.net/
Wiki o EDAC: http://buttersideup.com/edacwiki/

 
info/edac.txt · Poslední úprava: 2007/07/05 12:45 (external edit)
 
Recent changes RSS feed Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki