RAID FAQ (02.06.2004)

Pevné disky a SSD, optické a výměnné mechaniky, řadiče IDE, SCSI, SATA a jejich nastavení.

Moderátoři: morke, Igoreso, Loki5567

Zamčeno
MaWa
Čestný člen
Čestný člen
Uživatelský avatar
Registrován: 27. lis 2003
Bydliště: Ústí n. L.
Kontaktovat uživatele:

RAID FAQ (02.06.2004)

Příspěvek od MaWa »

Struktura FAQu je následující. V tomto příspěvku je obecný pokec o RAIDu, další příspěvky se vždy budou týkat jednoho konkrétního typu RAIDu.

RAID

RAID je zkratka od Redundant Arrays of Inexpensive Disks, v překladu redundantní (záložní) pole nedrahých (levných) disků. Vzhledem k tomu, že výrobcům RAID řadičů se moc nelíbilo idealistické slovo Inexpensive, plynně ho nahradili independent (nezávislý)...asi aby mohli prodávat RAID řadiče za desítky tisíc

Základním principem a úkolem RAID polí je vytvořit z určitého počtu disků pole, které se bude navenek (tzn operačnímu systému) chovat jako jeden disk a které bude mít nějaké speciální vlastnosti, jimiž nějčastěji bývají:

1) rychlost
2) spolehlivost
3) velikost (jeden svazek o kapacitě např. 2 terrabajty).

RAID pole mají i negativní "vlastnosti", např.:

1) cena
2) synchronizace hardwaru (ne každá karta a každý disk je vhodný/á na RAID)
3) nejlevnější řešení (řadiče) neoplývají zrovna bezchybností

Nelze vytvořit RAID pole, které bude mít všechny výhody, stejně jako nelze vytvořit RAID pole, které nebude mít žádnou nevýhodu...

Silně doporučuji dělat RAID pole jen z identických disků - výrobce, řada, cache, otáčky, firmware. jinak je to jakoby jste si sestrojili Porsche a nalevo dali 14" kola a napravo 15" kola
Do RAID pole se z IDE disků nejvíc hodi Hitachi 7k250 a Maxtor DM9+.
Samotná vytvoření raidu není nic těžkého, stačí postupovat podle manuálu k řadiči - většinou po výpisu ram, cpu a disků se objeví ještě jedna "tabulka", kde se obvykle něco zmáčkne (f10 apod), a tam se nakonfigurují 2 disky do požadovaného RAIDu. Pak při instalaci woken se jim předhodí disketa s ovladači (viz důležitý thread). toť vše.

nějaké odkazy...
jak funguje RAID http://abitfun.wz.cz/polozky/pojmy/co_je_to_raid.htm
RAID testy... http://www.zive.sk/h/TestCentrum/AR.asp ... 7&CAI=2195 nebo http://www.zive.sk/h/TestCentrum/AR.asp ... 8&CAI=2195
(ještě k těm odkazům - pokud v nich najdete napsáno něco jiného než je napsáno v tomto FAQu, platí to, co je napsáno TADY, ne ne webech z těch odkazů).


V dalším textu je značkou S značena kapacita nejmenšího disku v poli a N počet disků v poli.
RR...random read
RW...random write
SR...sequential (sustained) read
SW...sustained write

Rozdíl mezi RAID X+Y a RAID Y+X (např. 0+1 vs 1+0)

RAID 0+1...mějme 10disků. rozdělíme je na dvě skupiny po pěti. z jedné pětice uděláme RAID0, a potom zrcadlíme tento RAID0 pomocí RAID1 na druhých 5 disků.
RAID 1+0...mějme 10 disků. opět je rozdělíme na dvě skupiny po pěti. z prvních pěti disků uděláme pole RAID 1, z něhož uděláme stripe RAID 0 pomocí dalších 5 disků.


RAID 0

Název: striping bez parity
Popis: RAID0 nenabízí žádnou ochranu dat navíc, soustřeďuje se jen na výkon. Principem je rozdělit data na více disků, kdy na každý disk se zapíše (nebo se z něj čte) část dat (podle velikosti stripe) a tím by se mělo dosáhnout většího výkonu.
Počet disků: 2 a více, nejlépe shodné.
Kapacita pole: S*N
Využítí prostoru: 100%, pokud jsou použity stejně velké disky
Náchylnost k chybám: dokonce vyšší než při použití jednotlivých disků (ať žije statistika )
Obnova po chybách: žádná. data nelze obnovit. N/A
Rychlost RR: čím větší stripe size, tím lepší
Rychlost RW: čím větší stripe size, tím lepší
Rychlost SR: téměř N-násobná oproti jednomu disku
Rychlost SW: téměř N-násobná oproti jednomu disku


Poznámky: Tento typ RAID pole je dnes nejoblíbenější, obzvláště mezi domácími uživateli. Není mi ale jasné proč. Existuje jistá "fobie", že RAID0 se prostě v poměru cena/výkon vyplatí, což ovšem obzvláště v domácím použití (tzn. cokoliv kromě popužití na serverech !!!) není pravda. Přičteme-li k tomu ještě nižší odolnost na chyby atd...
Jak moc zavádějící mohou být benchmarky pole RAID0 (a tyto benchmarky ovlivňují normální uživatele) je uvedeno níže (první číslo je jeden disk Maxtor DM9+, druhé číslo je dvojice těchto disků - rád bych upozornil také na fakt, že Maxtory a Hitachi se v RAIDech obecně chovají nejlépe, takže níže uvedená čísla je to nejlepší, co můžete z RAID 0 dostat...):

IPEAK Average Read Service Time 13.2 ms 13.3 ms
WinBench 99 Outer Zone Transfer Rate 55.3 MB/sec 109.4 MB/sec
Inner Zone Transfer Rate 31.6 MB/sec 63.1 MB/sec
SR Office DriveMark 2002 395 IO/sec 426 IO/sec
SR High-End DriveMark 2002 373 IO/sec 408 IO/sec
SR Bootup DriveMark 2002 288 IO/sec 474 IO/sec
SR Gaming DriveMark 2002 519 IO/sec 529 IO/sec

SR a SW se opravdu zdvojnásobily, ale real-life performance je pouze o 10% vyšší !!! Nerad bych zde rozepisoval podrobně důvody, proč tomu tak je, z důvodu toho, že by to bylo na hodně dlouhé povídání a času nikdy není dost . pokud o to ovšem má někdo opravdu zájem, můžu to sem přidat.
V tomto testu je krásně vidět, proč v šichni myslí, jak je RAID 0 super věc - lidé se nechají zmanipulovat vysokými STR, ale vůbec nevidí pod povrch tohoto systému...a to je chyba.

RAID 1
Název: mirroring, duplexing
Popis: RAID1 nabízí ochranu dat navíc, soustřeďuje se však jen na ochranu dat, ne na výkon. Principem je rozdělit data na více disků, kdy na každý disk se zapíšou všechna data a tím se dosáhne toho, že identická data jsou na více discích, takže při poruše jednoho disku jsou všechna data stále kompletní.
Počet disků: 2 a více, nejlépe shodné. v praxi se ale používají většinou jen 2 disky.
Kapacita pole: S
Využítí prostoru: 50%, pokud jsou použity stejně velké disky
Náchylnost k chybám: normální
Obnova po chybách: vynikající. žádná data nejsou ztracena. ani žádný dramatický pokles výkonu při rebuildingu.
Rychlost RR: o trochu lepší než jeden disk
Rychlost RW: o trochu horší než jeden disk
Rychlost SR: stejná jako jeden disk
Rychlost SW: skoro stejná jako jeden disk


Poznámky:
RAID1 má docela růžovou bodoucnost. výrobci RAID řadičů se konečně rozhoupávají k tomu, aby při čtení se RAID 1 choval jako RAID0, čímž integruje výhody obou těchto typů polí do jednoho (odolnost proti chybám jako RAID1 a trochu vyšší rychlost při čtení jako RAID0).
pozor ještě na jednu věc (sice logickou, ale pro jistotu upozorňuji). RAID1 vás neochrání před:
a) infikací vašich dat virem
b) poškození tabulky oddílu nebo nějaké kritické datové struktury (MFT, FAT32, ...)
c) zdroj odpálí všechny disky
RAID1 ochrání "jen" před hardwarovým selháním jednoho disku. HW selhání jednoho disku je ale nejčastějším důvodem ztráty dat a ostatní možné důvody se dají eliminovat jinak (antivir, kvalitní zdroj apod...).

Některé RAID řadiče podporují dodatečné vytvoření RAID1 bez ztráty dat na zdrojovém disku. Mezi ně patří například SATA RAID řadič integrovaný na čipu VIA VT8237, používaný v čipsetu KT880.

RAID 2

Název: striping na úrovni bitů s Hammingovým ECC "šifrováním"
Popis: RAID2 je tak trochu jiný RAID - nevyužívá klasického stripingu a miroringu dat, ale místo toho data dělí BIT PO BITU mezi jednotlivé disky. Pak vypočítá paritu podle Hammnigova kódování a zapíše je na další disky. Při čtení je kód přečtena aon-the-fly zjištěno, zda data nebyla poškozena.
Počet disků: záleží na implementaci. typicky 10 disků data a 4 disky ECC, nebo 32 disků data a 7 disků ECC.
Kapacita pole: záleží na implementaci (10*S nebo 32*S)
Využítí prostoru: 71% u 10+4 konfigurace, 82% u 32+7 konfigurace.
Náchylnost k chybám: normální
Obnova po chybách: vzhledem k počtu potřebných disků nic moc - pouze jeden disk může být v jeden okamžik offline bez ztráty dat.
Rychlost RR: nic moc (nelze)
Rychlost RW: velmi slabé (kvůli počítání ECC parity)
Rychlost SR: dobrá
Rychlost SW: slabá


Poznámky:
Možná se někteří z vás teď ptají - proč vůbec takové "zvěrstvo" existuje, když jeho jediným úkolem je implementace ECC mechanismů, které už dnešní disky ovládají samy ? Odpověď je jednoduchá. Typy RAID polí byly definovány na Univerzitě v Berkeley někdy v polovině 80.let. V té době ještě neexistovaly disky s ECC mechanismy přímo uvnitř jako dnes. Toto byla jediná možnost, jak zajistit 100%ní kontrolu dat. Dnes se teto RAID už nepoužívá (je jediný z definovaných RAIDů z Berkeley, který potkal tento osud), píši ho zde spíše pro úplnost.

RAID 3

Název: striping na úrovni bajtů s ECC na dalším vyhrazeném disku
Popis: RAID 3 funguje podobně jako RAID 0. Až na dvě věci: Za prvé - stripe size je maximálně 1kB. Za druhé: zde je ještě další vyhrazený disk na ECC paritu.
Počet disků: 3 a více
Kapacita pole: S*(N-1)
Využítí prostoru: N/(N-1) v procentech, při identických discích
Náchylnost k chybám: normální
Obnova po chybách: jeden disk může být v jeden okamžik offline aniž by došlo ke ztrátě dat.
Rychlost RR: normální
Rychlost RW: velmi slabé (kvůli počítání ECC parity, omezení ECC disku...)
Rychlost SR: velmi dobrá
Rychlost SW: slabší

Poznámky:
RAID 3 je vhodný tam, kde je nutná podobná rychlost čtení jako u RAID 0, ale nelze přehlížet ani bezpečnost dat.

RAID 4

Název: striping na úrovni bloků s ECC na dalším vyhrazeném disku
Popis: RAID 4 funguje podobně jako RAID 3, až na dvě věci - stripe bývá i větší než u RAID 3 a striping se provádí po blocích, ne po bajtech. Stejně tak ECC.
Počet disků: 3 a více
Kapacita pole: S*(N-1)
Využítí prostoru: N/(N-1) v procentech, při identických discích
Náchylnost k chybám: normální
Obnova po chybách: jeden disk může být v jeden okamžik offline aniž by došlo ke ztrátě dat.
Rychlost RR: normální
Rychlost RW: velmi slabé (kvůli počítání ECC parity, omezení ECC disku...)
Rychlost SR: velmi dobrá
Rychlost SW: slabší

RAID 5

Název: striping na úrovni bloků s distribuovanými ECC
Popis: RAID 5 se liší od RAID 3/4 v podstatě jen v jedné věci - ECC nejsou uloženyna zvláštním disku, ale jsou "promíchány" společně s daty.
Počet disků: 3 a více
Kapacita pole: S*(N-1)
Využítí prostoru: (N-1)/N v procentech, při identických discích
Náchylnost k chybám: normální
Obnova po chybách: jeden disk může být v jeden okamžik offline aniž by došlo ke ztrátě dat.
Rychlost RR: excelentní.
Rychlost RW: slabší
Rychlost SR: velmi dobrá
Rychlost SW: dobrá

Poznámky:
RAID 5 vůbec není špatný typ pole, dokonce i v domácím použití.
Slabinou RAID 5 (i když ne velkou) jsou zápisy. Obecně lze říci, že maximální rychlost zápisu je 1/5 rychlosti procesoru, který to řídí (procesoru na řadiči, ne procesoru jako CPU). Rychlost procesorů na RAID řadičích se dnes pohybuje mezi 50-100MHz, tudíž dnešní RAID 5 bude mít maximální rychlost zápisu někde okolo 20MB/s při 100MHz procesoru.

RAID 6

Název: striping na úrovni bloků s duálními distribuovanými ECC
Popis: RAID 6 se liší od RAID 5 pouze v tom, že ECC jsou uloženy společně s daty, ale dvakrát, na dvě místa. Tím vzníká větší spolehlivost.
Počet disků: 4 a více
Kapacita pole: S*(N-2)
Využítí prostoru: (N-2)/N v procentech, při identických discích
Náchylnost k chybám: normální
Obnova po chybách: DVA disky mohou být v jeden okamžik offline aniž by došlo ke ztrátě dat !!!
Rychlost RR: excelentní
Rychlost RW: slabá
Rychlost SR: velmi dobrá
Rychlost SW: slabší

RAID 0+1 (01) a 1+0 (10)

Název: mirroring a striping bez ECC parity
Popis: RAID 01 je zrcadlení dvou stripe polí, kdežto RAID 10 je striping zrcadlených polí . Obecně má RAID 10 vyšší počet disků, které mohou být offline. Oba typy RAIDu poskytují vysoký výkon.
Počet disků: 4 a více (sudý počet)
Kapacita pole: (S*N)/2
Využítí prostoru: 50% při identických discích
Náchylnost k chybám: normální
Obnova po chybách: záleží na počtu disků.
Rychlost RR: excelentní
Rychlost RW: dobrá
Rychlost SR: velmi dobrá
Rychlost SW: dobrá

RAID 0+3 (03) a 3+0 (30)

Název: striping po bytech s vyhrazeným diskem pro paritu, to vše kombinováno se stripingem po blocích.
Popis: Největší blbost, co kdy byla vymyšlená. možná to někdo i používá, ale je to velmi nepravděpodobné... . Vysvětlovat to asi nemusím - prostě to jsou stripy z RAID 3 nebo naopak RAIDy 3 ze stripů.
Počet disků: 6 a více. navíc počet disků musí být číslo, které vznikne násobením dvou jiných celých čísel, z nichž jedno musí být větší alespoň 2 a druhé alespoň 3. ještě tomu rozumíte ?
Kapacita pole: S*počet_disků_v_subRAID0*(počet_subRAID0 - 1) v případě RAID 03, resp. S*(počet_disků_v_subRAID3 - 1)*počet_subRAID3 v případě RAID 30
Využítí prostoru: (počet_subRAID0 - 1)/počet_subRAID0 v případě RAID 03. v případě RAID 30 je to (počet_disků_v_subRAID3 - 1)/počet_disků_v_subRAID3
Náchylnost k chybám: normální
Obnova po chybách: záleží na počtu disků. U RAID 03 je počet offline disků vždy menší než u RAID 30.
Rychlost RR: velmi dobrá
Rychlost RW: nic moc
Rychlost SR: velmi dobrá
Rychlost SW: ujde to

RAID 0+5 (05) a 5+0 (50)

Název: striping po blocích s distribuovanou paritou, kombinované se stripingem po blocích
Popis: RAID 05 je RAID 5 vytvoření z dvojic zastripovaných disků, kdežto RAID 50 (častěji používán) je naopak RAID0 vytvoření ze dvou polí RAID 5. oproti RAID 5 nabízí tento typ pole vyšší spolehlivost a lehce vyšší rychlost zápisu.
Počet disků: stejné jako RAID 03/30
Kapacita pole: stejná jako RAID 03/30
Využítí prostoru: stejné jako RAID 03/30
Náchylnost k chybám: normální
Obnova po chybách: v ideálním případě může až polovina disků odejít bez poškození dat.
Rychlost RR: vynikající
Rychlost RW: dobrá
Rychlost SR: vynikající
Rychlost SW: dobrá

poslední je RAID 1+5 (15) a 5+1 (51)
Název: zrcadlení kombinovaná se stripingem s distribuovanou paritou
Popis: Tyto dva typy RAIDů jsou pro paranoiky. Pokud budeme mít např. RAID 15 s 8 disky, můžeme přijít o 3 libovolné disky z tohoto pole, aniž by byla ztracená nějaká data. S RAIDem 51 je toto číslo zvyšuje až na 5 !!! Tzn. až 5 z 8 disků mohou odejít bez ztráty jakýchkoliv dat ! Spolehlivost je v tomto RAIDu nejdůležítejší, ale výkon také není špatný. To se ale už nedá říct o efektivnosti uložení dat...
Počet disků: 6 a více, číslo musí být sudé
Kapacita pole: S*((N/2)-1)
Využítí prostoru: ((N/2)-1)/N..s osmi disky 41%, s vyšším počtem disků využití dále klesá
Náchylnost k chybám: normální
Obnova po chybách: vynikající. lepší už to nebude
Rychlost RR: velmi dobrá
Rychlost RW: dobrá
Rychlost SR: velmi dobrá
Rychlost SW: dobrá

Created 30th May 2004 by MaWa, All rights reserved. © MaWa
You may not modify, publish, transmit, participate in the transfer or sale of, reproduce, create derivative works of, distribute, publicly perform, publicly display or in any way exploit any of the materials or content above in whole or in part. If you would like to request permission to use any of the content above, please contact me via private message.

//Mr. Dirk - Zkráceno z několika postů do jednoho.
Naposledy upravil(a) MaWa dne úte 8. čer 2004, 15:53, celkem upraveno 7 x.
Zamčeno

Zpět na „Disky, mechaniky a řadiče“