SW Raidy a havarie disku

Miroslav Lachman 000.fbsd at quip.cz
Thu Feb 21 02:14:58 CET 2008


Richard Willmann wrote:
>>Ani za teto situace by ale kernel nemel zbuchnout na CPU exception nebo
>>dokonce zustat trvale a tise zadreny - to ukazuje takrka jiste na chybu
>>kodu. Za tehle situace by "regulerne" melo dojit k panicu.
> 
> 
> je to celkom zaujimava otazka, SW raid pouzivam pomerne dlho a zatial a 
> dufam ze to neprivolam, som problem s HW nemal. Ma prosim niekto realnu 
> skusenost s gmirror? Teda vedel by sa niekto podelit o info ohladom havarie 
> jedneho z dvoch diskov zapojenych v RAID via gmirror? Zaujimaju ma prakticke 
> skusenosti, ako sa to chovalo, ci to gmirror rozdychal za behu a stacilo 
> vymenit disk a obsluzit korektne jeho vymenu tj. forget a nasledny insert.

V minulosti jsem tu nekolikrat popisoval svoje trable s mizenim disku ze 
systemu. Jedna zalezitost byla pred rokem a pul na serverech Asus a 
dalsi vyskyt byl pak pri vadnem SATA kabelu na Sun Fire X2100. Abych to 
vyjadril v cislech, tak disk za behu systemu mi zmizel aspon 20x a co si 
tak vybavuju, tak snad jednou jedinkrat to system neustal a doslo k 
rebootu (a to dost mozna proto, ze vypadnul i druhy disk - to uz se 
nikdy nedozvim). Jinak byla v logu vzdy hlaska o tom, ze zmizelo 
zarizeni adX a nasledovala hlaska od gmirroru o tom, ze tohle zarizeni 
vyreazuje z mirroru a raid1 je ted ve stavu degraded.
Ten disk pak nebyl videt na radici ani prikazem atacontrol list a system 
bezel vesele dal.

S hotswapovosti to uz bylo horsi - takhle zmizely disk se proste nikdy 
neobjevil, pomohl jedine reboot, ale to je IMHO spis HW problem.
Dalsi problem u "hotswapu" jsem nasel v tom, ze kdyz jsem disk ze 
systemu chtel odpojit rucne (funkcni disk) tim, ze jsem ho rucne vyradil 
z gmirroru, rucne detachnul pomoci atacontrol a pak ho vytahnul, kernel 
vetsinou zpanikaril, nebo zpanikaril v okamziku opetovneho pripojeni 
disku. Pritom v pripade toho vadneho kabelu u Sunu se mi zmizely disk 
podarilo bez problemu vyndat i znovy vlozit a system ho nasel a byl 
schopen pripojit a pracovat s nim.
Jakmile jsem to zkousel rucne tak, jak se to "ma", tak to skoncilo panicem.

Toliko moje (zatim dobre) zkusenosti s gmirrorem a odpadlym diskem.

Mirek



More information about the Users-l mailing list