zlyhanie vinum mirroru
Dan Lukes
dan at obluda.cz
Wed Jun 30 13:27:36 CEST 2004
Jozef Babjak napsal/wrote:
> Prvym indikatorom problemov bolo, ked mi screen(1) v ktorom bezalo
> centericq(1) "spadlo" na signal 11. Povedal som si ze "stava sa", pre
...
> niekolkych malo minutach sa to iste stalo kolegovi, ktory bol tiez
> pripojeny cez ssh a mal spustenu kombinaciu screen(1) + centericq(1).
> Vtedy som spozornel a prakticky okamzite som zistil ze jeden zo subdiskov
> v mirrore je v stave "up" a druhy v stave "staled". Do cca 10 minut bol
> jeden zo subdiskov v stave "staled" a druhy v stave "crashed", mirror sa
> porucal do vecnych lovist a udaje sa mi nepodarilo nijakym sposobom
> zachranit. Rovnaky status diskov bol aj po prelozeni oboch HDD do ineho
> pocitaca s FreeBSD.
>
> Hardverovo su oba disky v poriadku, teda aspon isli bez problemov znovu
> rozdelit, naformatova a vytvorit na nich opat vinum mirror. Ma niekto z
> vas napad, preco mohlo k takejto poruche dojst? Disky "neodisli" naraz,
> ale v kratkom casovom useku za sebou. Hardverovo su v poriadku, poskodili
Moznosti je mnoho.
Jedna z teorii pravi, ze SIGSEGV se objevuje pri vadach pameti (at uz
jde o vadu pameti jako hardware, nedobry kontakt nebo treba prehrati -
je leto a pokud jsou vetraky prizadrene ...). Chyba v pameti muze tedy
byt pricinou obou padu i chyby v kodu VINUM, ktera sice nevedla k padu
neprodlene, ale, o to hur, vedla k postupnemu poskozovani disku (kdyz
vinum uz nebylo ve "zdravem" stavu, ale stale na disky sebevedome
zapisovalo).
Druha teorie rika, ze mohlo jit primarne o nejakou chybu v kodu
"vinum", ktery vedl k zapisovani nesmyslu na disk. Konec koncu, je to
preci jen software ...
Pozorovany SIGSEGV pak nastal pote, co se "vinum" konecne trefilo do
kodu programu nebo knihovny ktery v dane chvili bezel, ale "postizena"
pasaz nebyla v te chvili v pameti (kody knihoven a programu se v pripade
potreby pameti neswapuji ale zahazuji, protoze je lze kdykoli znovu
obnovit z puvodniho souboru). V okamziku kdy byl uvedeny obsah zavedeny
do pameti doslo k havarii programu.
A to nejsou teorie jedine. Ale poznat, co konkretne to bylo u vas bude,
obavam se, na dalku nemozne (a v soucasne chvili uz asi i z blizka).
Dan
More information about the Users-l
mailing list