[2021/05/14]
A legfőbb érv általában a NAS vásárlás mellett – a helyett, hogy USB-s külső merevlemezeket halmoznánk fel – a kényelem mellett természetesen az, hogy RAID tömbök használatával a gazdaságosság és biztonság határán egyensúlyozva minél többet hozzunk ki adattárolásnál a pénztárcánkból. A RAID egy tárolási technológia, mely segítségével az adatok elosztása vagy replikálása több fizikailag független merevlemezen, egy logikai lemez létrehozásával lehetséges. Ennél bővebben itt most nem is szükséges belemennünk, arra ott a Wikipédia szócikke: link
A NAS-okban ez ugye szoftveres (Linux mdadm pl.) ami nem feltétlenül rossz, amíg nincs szükségünk magasan átlag feletti teljesítményre.
Viszont! Az elején fontos tisztázni, hogy a RAID nem mentés, hanem a rendelkezésre állást segíti!
Vagyis meg kell különböztetnünk a mentést, az archiválást és a rendelkezésre állást:
– a mentés az adatok periodikus, rövid idejű és vészhelyzet eseti helyreállításra szolgál
– az archiválás a már nem rendszeresen használt, de szükség szerinte előhívható adatok hosszú távú tárolását szolgálja
– a rendelkezésre állás a kiesett időt hivatott elkerülni
Azokban, akik 2-nél több lemez igényéig jutnak el az első számolások során, jogosan a RAID 5 – vagy Synology-nál az SHR – fog felmerülni először, mint ideálisnak tűnő megoldás. Hiszen itt csak 33, 25 vagy még annál is kevesebb százalék tárhelyet áldozunk be a tükör 50%-ához képest.
Ráadásul lépcsőzetesen bővítve is kivitelezhető a végső cél, nem feltétlenül egyszeri beruházás:
Nem csoda, hogy csábító az ötlet, még ha csak 1 lemez is a paritásunk.
És, hogy mi fán terem a paritás?
Magyarul ennyi lemez kiesését viseli el a rendszer adatvesztés nélkül. Itt az első bővítést követően mindig 1 lemez elvesztése lesz a rendszer hibatűrése.
RAID 6-al lenne meg a kívánt 2-es paritás és a végén meglátjuk ez mekkora különbséget is jelent biztonságban!
4 lemeznél persze messze nem ideális anyagilag (amitől még nem lesz a RAID 5 sem az), de 6-8 lemeztől erősen csökken a különbség.
Sajnos túl gyakori még mindig, hogy a NAS-ra önmagában egy szem RAID tömbbel, mint egy teljes körű mentési megoldásra tekintenek. A legrosszabb eset, hogy már eleve mindenki arra dolgozik és a saját gépeken sincs meg az adat. Ilyenkor persze a RAID 5 szóba sem jöhet, de feltétlenül szükséges az ilyen modellt mihamarabb felszámolni, a mentést kiegészíteni. De ez már egy másik téma.
Ne felejtsük, a RAID 5 egy 1986-os IBM szabadalom, és teljesen meg is felelt a 90-es években, az 1000 dollár körüli pár száz MB-os, majd pár GB-os lemezek korában, de azért TB feletti lemezeknél felejtsük el lassan! Hisz már több mint 10 éve el kellett volna…
A kockázat
Mik a tényezők amik miatt túl sok miatyánkot kell elmondani ha mégis a RAID 5 mellet szavazunk, avagy milyen tényezők befolyásolják az adatvesztés esélyét?
Újraépülési idő
Nincs nagyon mit magyarázni rajta – akár napok is lehetnek nagy merevlemezeknél –, az ez alatt kapott extra terhelés semmi jóval nem bíztat és minél hosszabb, annál nagyobb a valószínűsége egy nem várt extra baleset bekövetkezésének.
Általában felgyorsítható parancssorból, ugyanis alapértelmezés szerint nem nyélgázon történik az újraépítés általában, viszont akkor meg ne akarjuk a rendszert használni ez idő alatt…
Ha már van 1 meglévő RAID 5 tömbünk nagyobb merevelemezekkel, és beüt a baj, akkor annál mint, hogy elkezdjük egy behelyezett lemezzel az újraépítést az is jobb, hogy inkább lementjük valahová a tartalmát. Természetesen ha biztosítható a szükséges kapacitás és utána már egy friss RAID 6-os tömbre költözünk lehetőleg vissza.
MTBF
Nem egy külön paramétert igazándiból, mivel az AFR is lefedi a fogalmát. A lényeg, hogy a gyártó által megadott értékek sok köze nincs a valósághoz, és nem a mi javunkra természetesen.
Habár az egyes meghajtók meghibásodások közötti átlagos ideje az idő előrehaladtával nőtt, ez a növekedés nem tartott lépést a meghajtók megnövekedett tárolókapacitásával. A tömb egyetlen meghajtó meghibásodása után történő újjáépítésének ideje, valamint az újjáépítés során bekövetkező második meghibásodás esélye összességében tehát megnőtt.
AFR
"Annual Failure Rate" azaz annak becsült valószínűsége, hogy egy merevlemez meghibásodik az adott év során. Az újraépülés alatt még 1 HDD elhullásának kockázatának számolásánál van jelentősége.
A Google 2007-es tanulmánya, illetve a Backblaze kimutatásai amik valószínűleg a nagy mintavétel miatt a leghitelesebbek. Persze az otthoni és egy adatközpontban lévő körülmények nem feltétlenül adnak azonos eredményt. És a ki-be kapcsolgatás, hőmérsékelt ingadozás, egyenetlen terhelés, magasabb átlagéletkorú lemezek nem feltétlenül az otthoni használat fele billentik a mérleg nyelvét!
Lehet csavarni sokféleképpen a számokat, nagyon sok tényezőtől függ – valahol 2 és 8 % között fog ingadozni –, lehet nyugodtan átlagban 4%-ot számolni.
URE
Vagy LSE vagy Non-recoverable error, elég sok néven ismerhetjük, javíthatatlan sector olvasási hibát takar.
Miért veszélyes ez RAID 5-nél?
Az 1 lemez paritás miatt, ha újraépülés során vagy mielőtt cserélnénk a hibás lemezt csúszik be egy ilyen, akkor sajnos búcsút mondhatunk az egész tömbnek.
A WD RED Plus-oknál (5400rpm) 1-14TB ez az érték így található meg: Non-recoverable error per bits read <1 in 1014
A jelenlegi WD RED PRO (7200rpm) érdekes, de rosszabb! <10 in 1014
Ahogy illik a Seagate Ironwolf PRO 7200rpm 6-16TB között <1 in 1015, ezt tekinthető a következő lépcsőnek.
A számok makacs dolgok
Na és, esélyek? - vethetjük oda flegmán
És akkor a matek majd a seggreülés!
Ne erőltessük az agyunkat, van erre (is) számoló a neten: https://wintelguy.com/raidmttdl.pl
Példaként, ne essünk túlzásba, nézzünk egy 4x8TB RAID5 konfigurációt, NAS-ba illő lemezekkel.
Döbbenetes: 49% jön ki végeredménynek 4%-os AFR-rel 5 év alatt! Tehát attól függően, hogy sikerült az adott merevlemez széria 29-74% jön ki a 2-8% AFR intervallumra.
Ugye ez a konzumer NAS vonal, tehát nézzük mi van ha 1 nagyságrenddel jobb szériából választunk (<1 in 1015). Akkor „mindössze” 13% jön ki 4%-os AFR mellett és 7-25% a 2-8% AFR intervallumra. 16 TB-os lemezek esetén ezek már 32-79%, és még a felsőbb kategória választásával is 12-40%!
Emberek ennél sokkal kisebb nyerési esélyekért játszanak szerencsejátékokat napi szinten...
Mint látható nagyon tág határok között adható meg egy lemez megbízhatósága, ráadásul több paraméterben is. Lehet vitatkozni azon is természetesen, hogy milyen irányba és mennyit túloznak a számok.
De! Akárhogy csavarjuk a dolgot, mindig az fog kijönni, hogy nagyságrendileg minimum 50-100 szoros az esélyünk adatvesztésre RAID 5-el egy átlagos rendszer élettartam alatt mint ha RAID 6-ot használnánk!
És ez tényleg a nagyon minimum, ugyanis egyes konfigurációkban jóval nagyobb lehet a különbség, a NetApp 2006-os tanulmányában 3800-szoros jött ki!
Biztos, hogy megéri a rizikó?
Hol lehet esetleg mégis létjogosultsága?
1.
Egy tiszta SSD-s (pl. 4x1TB) kiépítésű rendszerben, ahol kisebb a lemezkapacitás és gyorsabb az újraépülési idő. Bár itt meg a RAID 5-el veszítünk valamit az írási sebességből, ezért ezt mindig a hálózat áteresztő képességével összhangban kell vizsgálni.
Itt jön jól a Synology RAID F1 rendszere, ami gyakorlatilag a RAID5 SSD-re specializált változata:
„Az SSD és RAID technológiák sajátos jellemzői (különösen a munkaterhelés egyenlő elosztása) miatt általános kihívás, hogy hogyan akadályozzuk meg, hogy az összes meghajtó egyszerre hibásodjon meg. Erre a problémára kínál megoldást a RAID F1. Speciálisan kifejlesztett algoritmusának köszönhetően egyenetlenül osztja el a terhelést a meghajtók között, fokozva ezáltal a tárhely rugalmasságát, és így garantálva az adatok biztonságát. „
2.
Szigorúan felügyelt, kisebb lemezkapacitású (max 3TB/lemez és lehetőleg offsite) backupnál. Azaz a mentés mentésénél – pl. már cserélt, a fő használatból kivont, de még selejtezni nem kívánt eszközökkel –, bár hozzá kell tennem, hogy 5 évnél korosabb merevlemezeket nem igazán illik használni...