Problem s diskom - DMA TIMEOUT
Miroslav Lachman
000.fbsd at quip.cz
Fri Dec 4 09:51:52 CET 2009
Dan Lukes wrote:
> Marian Cerny napsal/wrote, On 12/03/09 16:36:
[...]
> Co se tyce toho, ze jeden disk vyrvava i po odpojeni - nemame od tebe vypis
> swapctl -l
> takze nevime, kde swap mas.
Z hlasky "Device gm0: provider ad12 disconnected" usuzuji, ze se cely
disk pouziva pro RAID, neni tedy rozdeleny na slices / partitions, aby
mohla cast byt pouzita pro swap a zbytek pro mirror. Leda ze by pro swap
byl pouzit jeste uplne jiny disk, nez ty dva zminene, ale to by stejne
nevysvetlilo, proc se neco (swap_pager) snazi dal pracovat s diskem ad12
> Mimochodem, ja bych swap na softwarovy RAID nedaval, nicmene, dovedu si
> predstavit situace, kdy to ma smysl.
Na jednu stranu to celkem chapu, ale na druhou stranu, neznamena to
nahodou pak uplnou zbytecnost pouziti gmirroru, jelikoz system v
okamziku problemu s diskem (jeho zmizeni / odpojeni) stejne zhavaruje a
pak jsou dva samostatne swapy (na dvou diskach) jenom zvysenim
pravdepodobnosti, ze jeden z nich bude mit nekdy nejaky problem?
Osobne kdyz uz nekde gmirror pouzivam, tak na cely disk vcetne swapu a
system tak prezije i uplne zmizeni disku z ata kanalu. Takze aspon v mem
pripade se mi vic vyplatilo mit i swap na SW RAIDu, problemy jsem s tim
snad nikdy nezaznamenal.
> P.S.
> Obecne se v posledni prislo na to, ze rada disku neni vhodna pro provoz
> v RAIDu. A to proto, ze nekdy jim odpoved trva prilis dlouho (rec je o
> zejmena pripadech, kdy disk pouziva L2 samoopravny algoritmus, ktery je
> vypocetne narocnejsi) a RAID management je ma tendenci vyhodnotit jako
> vadne a vyradi je.
>
> Jak Seagate tak WD na problem reagovalo uvolnenim novych firmware pro
> nektere typy svych disku. Ten tvuj ale mezi ne nepatri, coz by mohlo
> znamenat, ze je v tomto ohledu v poradku.
FreeBSD pouziva obecne hrozne nizky timeout pro praci s (S)ATA disky (5
sekund) a i kdyz na to bylo opakovane poukazovano i nekterymi vyvojari
(tech PR, patchu, diskuzi v mailinglistech je vazne mnoho), tak se za
uplynulych par let moc nezmenilo. Az celkem nedavno nekdo commitoval
zvyseni nekterych timeoutu asi na 10 sekund, ale mam pocit, ze se to
tykalo jen timeoutu po probouzeni disku ze spun down.
Ve FreeNASu je/byla dokonce moznost si ty timeouty nastavit pres sysctl,
coz mi prislo rozumne reseni a porad mi neni jasne, proc to nebylo
zpetne prijmuto do src FreeBSD - v zadne diskuzi se k tomu nikdo z
vyvojaru nevyjadril ani kladne, ani zaporne. Pripada mi, jako by se
kolem (S)ATA subsystemu chodilo v tichosti po spickach.
(az ted pro 9-CURRENT / 8-STABLE zacal Alexander Motin s prepisem pro
CAM a zatim s celkem pozitivnim vysledkem)
Mirek
More information about the Users-l
mailing list