RAID disková pole: jaké jsou základní typy a v čem se liší?

Různá disková pole RAID se od sebe odlišují zcela zásadním způsobem, což ovlivňuje jejich výslednou charakteristiku i cenu. Některá jsou vhodná pro zrychlení zápisu nebo čtení, jiná zase poskytují téměř okamžitou obnovu dat v případě selhání hardware. Sofistikovanější typy RAID pak dokonce kombinují obě tyto výhody dohromady.

JAN MŮČKA
  • JAN MŮČKA

  • 12. 08. 2021
  • 9 min čtení
Zkopirovat do schránky

Zkratka RAID (Redundant Array of Inexpensive/Independent Disks) označuje disková pole, na nichž se ukládají data na dva a více nezávislých disků. Z několika fyzických uzlů se tím vytvoří úložiště, které operační systém serveru nebo počítače vnímá jako jednu logickou jednotku.

Díky redundanci umožňuje RAID (s výjimkou RAID 0) rychlou obnovu dat při selhání některého z disků. Před nechtěným smazáním dat ale neochrání. Pro lepší zabezpečení proto doporučujeme mít vedle RAID i standardní zálohování, a to ideálně v geograficky oddělené lokalitě.

Zálohovací systémy od MasterDC

Jsme specialisté na zálohování. K fyzickým či virtuálním serverům stavíme zálohovací systémy podle vašich potřeb. Zálohovat můžete klidně i do diskových polí RAID v geograficky oddělené lokalitě (Brno/Praha).

Více o zálohovacích systémech

Než se podíváme na konkrétní vlastnosti a fungování jednotlivých typů RAID, zmiňme ještě tzv. JBOD. Ten podobně jako RAID pracuje s více disky, které sjednocuje pomocí tzv. zřetězení do logického celku. Někdy bývá JBOD označován také jako podtyp RAID 0.

Jeho fungování je prosté – ve chvíli kdy se naplní první disk, začnou se data ukládat na další jednotku. Nevytváří se zde žádná redundantní data, využití technologie JBOD je tak vhodné čistě pro účely snadného rozšiřování externího úložiště serveru nebo počítače.

RAID 0

Diskové pole RAID 0 není RAID v pravém slova smyslu. Stejně jako JBOD totiž nevytváří redundantní data. RAID 0 se skládá ze dvou a více disků, na které se střídavě ukládají bloky dat (jeden soubor tak bývá rozdělený mezi více disků). V praxi to znamená, že v případě výpadku některého z disků dojde ke ztrátě dat a vzhledem ke způsobu ukládání bývají navíc často poškozeny všechny soubory.

Proč se tedy RAID 0 používá, když riziko ztráty dat vlastně zhoršuje než zlepšuje? Je to kvůli vyššímu výkonu. Tím, že se data střídavě ukládají na disky, zapíšou se rychleji, stejně jako se rychleji přečtou. Čtení i zápis se může zrychlit až o vyšší desítky procent než v případě použití běžného disku. Další výhodou je, stejně jako u JBODu, rozšíření kapacity o druhý disk.

Diskové pole RAID 0 se kvůli svým vlastnostem používá pro nekritická data nebo jako dočasná vyrovnávací paměť. Pro důležitá a produkční data je ovšem vhodné zvolit některý z redundantních typů diskového pole.

JBOD vs. RAID 0 vs. RAID 1 - srovnání typů diskových polí
Schéma ukazuje, jak funguje ukládání v JBOD, RAID 0 a RAID 1. Válce představují jednotlivé disky. Zdroj: Wikipedie.org

RAID 1

V případě diskového pole RAID 1 se data zrcadlí z jednoho disku na druhý, takže jsou, na rozdíl od RAID a JBOD, redundantní. Obvykle se používají dva disky, ale může jich být i více. S tím jak roste počet disků, roste i počet jejích tolerovaných selhání. V případě dvou disků může selhat jeden, v případě tří mohou selhat dva a tak dále.

Hlavním důvodem, proč se převážně používá RAID 1 jen o dvou discích jsou náklady navíc za další disky, které kromě počtu možných selhání nepřináší žádný další užitek. Funkční kapacita disku se jimi totiž nějak nezvýší a zůstává stejná jako velikost nejmenšího disku v RAID 1.

V rychlosti zápisu je RAID 1 pomalejší, než kdyby se zapisovalo na běžný disk, protože se data zapisují ne pouze jednou, ale dvakrát nebo dokonce vícekrát (podle počtu disků v poli). Naopak čtení dat z RAID 1 může být o něco rychlejší než z jednoho disku. Ohledně výkonu je sice celkově horší než RAID 0, na rozdíl od něj však vytváří bezpečnou kopii ukládaných dat.

RAID 5

K vytvoření RAID 5 jsou vyžadovány minimálně 3 disky. Bloky dat se ukládají střídavě na dva a více disků, přičemž je navíc vytvářen tzv. samoopravný kód (parita). Ten umí v případě poškození obnovit původní data. Samoopravný kód je umísťován rovněž střídavě na různých discích.

Právě distribucí samoopravných kódů mezi všechny jednotky diskového pole byla odstraněna nedokonalost dnes už prakticky nepoužívaného RAID 3 a 4, které měly všechny samoopravné kódy na jednom disku. Kvůli tomu byl tento specifický disk vytíženější (samoopravné kódy se počítají při zápisu a vyžadují tak určitý výkon) a měl větší tendenci selhávat než ostatní disky.

RAID 5 - schéma diskového pole
Příklad diskového pole RAID 5 vytvořeného ze 4 disků. Písmeno „p” označuje samoopravný kód. Zdroj: Wikipedie.org

Mezi výhody RAID 5 patří rychlejší čtení, protože jsou data rozdělená do bloků mezi jednotlivé disky. Také kapacita je nižší jen o jeden disk z celkového počtu disků (pokud mají disky stejnou velikost). Takže v případě, že je RAID 5 složený ze čtyř 2TB disků, bude kapacita RAID 6 TB.

Naopak nižší je rychlost zápisu, protože je nutné vypočítávat samoopravný kód. Nevýhodou může být též tolerance výpadku pouze jednoho disku a to bez ohledu na celkový počet disků v poli.

RAID 6

Diskové pole typu RAID 6 se svým fungováním velmi podobá RAID 5. Rozdíl je však v tom, že v tomhle případě se odlišným způsobem vypočítávají rovnou dva samoopravné kódy, což ovlivňuje celou charakteristiku tohoto diskového pole.

RAID 6 – Schéma diskového pole
Příklad RAID 6 o 5 discích. Písmena „p” a „q” označují samoopravné kódy, které se počítají různým způsobem. Zdroj: Wikipedie.org

V prvé řadě se skládá z minimálně čtyř disků – alespoň dva pro zapisování bloků dat a dva pro samoopravný kód. Díky dvěma samoopravným kódům toleruje RAID 6 selhání až dvou disků.

Co se týče čtení dat, tak je srovnatelný s RAID 5. Ohledně zápisu je ale ještě pomalejší, právě kvůli vypočítávání dvou samoopravných kódů. V porovnání s RAID 5 je na tom hůře i poměr cena/kapacita. Ze součtu velikostí všech disků se totiž odečítají dva disky. Tedy v případě čtyř 2TB disků bude výsledná kapacita diskového pole jen 4 TB.

RAID 01

Prvním zástupcem víceúrovňových typů je RAID 01, někdy také označovaný jako RAID 0+1. Jak už jeho název napovídá, jedná se o kombinaci typů RAID 0 a RAID 1. Pro jeho vytvoření potřebujeme alespoň čtyři disky.

Data se ukládají střídavě na prvním a druhém disku, stejně jako na třetím a čtvrtém. Vzniknou tak dva totožné páry disků. Střídavé ukládání na první úrovni tak odpovídá typu RAID 0 a zrcadlení na druhé úrovni se shoduje s RAID 1.

RAID 01 – Schéma diskového pole
Diskové pole RAID 01 ukládá data v první úrovni střídavě (RAID 0) a následně je v druhé úrovni zrcadlí (RAID 1). Zdroj: Wikipedie.org

Mezi přednosti RAID 01 patří rozložení zátěže při čtení i zápisu, přičemž je dosaženo redundance dat. Nevýhodou je naopak cena, protože výsledná kapacita je kvůli zrcadlení dat minimálně poloviční než součet kapacit všech použitých disků.

RAID 10, 50 a 60

U RAID 10 je tomu obráceně než v předchozím případě. Na prvním a druhém disku se data zrcadlí stejně jako na třetím a čtvrtém disku a střídavé rozdělení bloků dat probíhá až o úroveň výše. Stejný princip fungování má i RAID 50 či 60, akorát s tím rozdílem, že místo RAID 1 jsou na první úrovni RAID 5, případně RAID 6.

RAID 10 – Schéma diskového pole
Podobně jako RAID 10 si můžete představit také RAID 50 nebo RAID 60, u nich je však místo RAID 1 buď RAID 5, nebo RAID 6. Zdroj: Wikipedie.org

Obecně lze říci, že kombinace střídavého ukládání a zrcadlení kombinuje jejich výhody – vysoký výkon při čtení i zápisu a zároveň bezpečnost. Nevýhodou jsou pak vyšší náklady na pořízení i následnou správu.

RAID Z

Speciální kategorií jsou typy diskových polí RAID Z. Ty jsou součástí projektu OpenZFS, který zastřešuje souborový systém ZFS. RAID Z je tak, na rozdíl od běžného RAID, úzce propojený se souborovým systémem.

Například konkrétní typ RAID Z1 je velmi podobný RAID 5 (RAID Z2 zase připomíná RAID 6). K jeho sestavení je totiž rovněž potřeba 3 a více disků a při zápisu bloků dat se vytváří samoopravný kód.

Naopak se od sebe liší tím, že zatímco v případě RAID 5 jsou jednotlivé bloky ukládaných dat stejně velké, u RAID Z1 mají různou (dynamickou) velikost. Samoopravný kód se navíc ukládá na disky podle potřeby a nikoliv s pravidelnou posloupností jako u běžného RAID.

Ukládání dat v RAID 5 a v RAID Z1

Srovnání způsobu ukládání dat na RAID 5 a RAID Z1. Písmeno „p” označuje samoopravný kód (paritu). Zdroj: Pthree.org

Kvůli nepravidelnosti ukládání dat mezi jednotlivé disky u RAID Z je k nalezení souborů nutné používat metadata souborového systému (ZFS). I přesto ale RAID Z urychluje čtení, protože díky dynamické velikosti ukládaného bloku dat se pracuje jen s „živými” daty. Není tak nutné číst data, která jsou v bloku uložená, ale zrovna se s nimi nepracuje.

Největší výhoda však plyne z úzkého propojení RAID Z se souborovým systémem. ZFS totiž umí pomocí samoopravného kódu automaticky detekovat a opravovat chyby za chodu a to bez nutnosti speciálního hardware.

Méně používané typy RAID

Setkat se lze také například s tříúrovňovým RAID 100 (někdy také 10+0), k jehož sestavení je potřeba minimálně osm disků. V první úrovni dochází podobně jako u RAID 10 k zrcadlení dat (RAID 1), na druhé a třetí úrovni pak ke střídavému ukládání dat v blocích (RAID 0). Jeho největší výhodou je zvýšení přenosové rychlosti.

RAID 100 – Schéma diskového pole
Diskové pole RAID 100 má hned tři úrovně. V první se data zrcadlí (RAID 1) a v dalších dvou úrovních se ukládají střídavě (RAID 0). Zdroj: Wikipedie.org

Mezi další typy patří RAID 2, RAID 3, RAID 4 a RAID 7. V současnosti však nejsou příliš používané, protože při stejných nákladech mají horší vlastnosti než RAID 5 a RAID 6.

Který typ RAID si vybrat?

Standardní i víceúrovňové RAID pole se od sebe liší reálnou kapacitou, počtem tolerovaných selhání disku nebo rychlostí zápisu a čtení. To vše se propíše do výsledného fungování a ceny diskového pole. Volba optimálního řešení se pak odvíjí od účelu použití.

V MasterDC máme se stavbou diskových polí různých typů bohaté zkušenosti. Rovněž nabízíme pronájem již hotového diskového pole s připojením přes SAN pro potřeby zálohování. Napište nám co nejpodrobněji své požadavky a my vám navrhneme ideální řešení na míru.

Líbil se vám článek? Ano / Ne