Re: Reštart pri zvýšenej záťaži
Dan Lukes
dan at obluda.cz
Sat Jan 30 10:55:39 CET 2016
On 01/30/16 10:21, Vladimír Drgoňa wrote:
> mám malý domáci server:
> core-i3, 16GB RAM, 2x3000GB WD RED, 120GB SSD-Intel
> FreeBSD-10.2-RELEASE-p11, 2x3000GB mirror zfs, 120GB je ako cache a zil.
Nepochybne jsem nespravedlive zaujatej, ale nelze prehlednout, ze jak v
posledni dobe resim nejakej "podivnej" problem okolo stability, tak logy
maji zretelne stycne body. A temi spolecnymi body jsou pismena Z, F a S
Zrovna naposled jsem resil postupne ztracejici se pamet. A on ji
postupne pozira kernelovy modul opensolaris, ktery tam je kvuli ...
... modri uz urcite vedi ...
> Ak na server pristupujú súčasne všetci klienti, zfs začne masívne
> využívať disky (hlavne cache na SSD), obsadí oveľa viac pamäte a
> potrebuje použiť swap.
Uz v tyhle chvili tedy vime, ze stroj neni na zatez dimenzovanej. Za
bezne se vyskytujici zateze (a tou se mysli i opakovane se vyskytujici
spickove zateze) stroj swap pouzivat nesmi.
> V takomto prípade sa občas celý server reštartne
> aj bez toho, aby celý swap využil a bez zápisov do logov. Keď vypnem
> dedup, server beží bez problémov aj rok.
> Čo sa s tým dá robiť okrem vypnutia dedup?
Velmi nerad to uslysis, ale da se s tim udelat jedine - najit tu chybu.
Coz znamena mit debugovaci kernel, nakonfigurovat system tak aby pri
restartu udelal coredump (na to ale, zda se mi, nemas ten swap dost
velkej, takze nejprve zvetsit swap - musi byt vetsi jez je mnozstvi
fyzicke pameti) - doufat, ze to pri padu ten coredump udela.
Pak uz "jen" zjistit co to delalo v okamziku, kdy to spadlo, najit tu
chybu a opravit ji. Pokud bych mel vystrelit zcela naslepo, tak jde o
chybu pri praci s pameti, ktera je chybne oznacena jako zpusobila k
odswapovani, nasledne odswapovana - a system spadne v okamziku, kdy
kernelovy modul tu pamet chce pouzit v kontextu, ktery nedovoluje jeji
nacteni ze swapu. Ale to jsem si jen hodil kostkama. Muze to byt i uplne
neco jinyho.
Existuje pro tebe urcita mala sance na mene narocne reseni. Pokud nejde
o memory-leak (kdy je spotreba pameti z dlouhodobeho hlediska shora
neomezena), pak by ti problem mohlo vyresit pridani pameti - a to
takoveho mnozstvi, aby swap nebyl potrebny.
Ostatne, uz nahore jsem naznacoval, ze to je minimalni mnozstvi pameti v
kazdem pripade.
Alternativne se samozrejme muzes pokusit omezit pouzivani stavajici
pameti - zkusit ZFS presvedcit, ze nesmi pouzivat vic pameti nez kolik
ji je. I pokud se ti to povede, nebude to zadarmo, nejspis to bude mit
negativni vliv na vykon.
> Reštart nastane samozrejme v najnevhodnejší čas.
To je nejpravdepodobnejsi - v dobe nejvetsi zateze jsou nejvetsi naroky
na pamet.
> Za každú radu ďakujem.
Skutecne i za tuhle ? ;-)
Dan
More information about the Users-l
mailing list