Re: Reštart pri zvýšenej záťaži

Dan Lukes dan at obluda.cz
Sat Jan 30 10:55:39 CET 2016


On 01/30/16 10:21, Vladimír Drgoňa wrote:
> mám malý domáci server:
> core-i3, 16GB RAM, 2x3000GB WD RED, 120GB SSD-Intel
> FreeBSD-10.2-RELEASE-p11, 2x3000GB mirror zfs, 120GB je ako cache a zil.

Nepochybne jsem nespravedlive zaujatej, ale nelze prehlednout, ze jak v 
posledni dobe resim nejakej "podivnej" problem okolo stability, tak logy 
maji zretelne stycne body. A temi spolecnymi body jsou pismena Z, F a S

Zrovna naposled jsem resil postupne ztracejici se pamet. A on ji 
postupne pozira kernelovy modul opensolaris, ktery tam je kvuli ...
... modri uz urcite vedi ...

> Ak na server pristupujú súčasne všetci klienti, zfs začne masívne
> využívať disky (hlavne cache na SSD), obsadí oveľa viac pamäte a
> potrebuje použiť swap.

Uz v tyhle chvili tedy vime, ze stroj neni na zatez dimenzovanej. Za 
bezne se vyskytujici zateze (a tou se mysli i opakovane se vyskytujici 
spickove zateze) stroj swap pouzivat nesmi.


> V takomto prípade sa občas celý server reštartne
> aj bez toho, aby celý swap využil a bez zápisov do logov. Keď vypnem
> dedup, server beží bez problémov aj rok.
> Čo sa s tým dá robiť okrem vypnutia dedup?

Velmi nerad to uslysis, ale da se s tim udelat jedine - najit tu chybu. 
Coz znamena mit debugovaci kernel, nakonfigurovat system tak aby pri 
restartu udelal coredump (na to ale, zda se mi, nemas ten swap dost 
velkej, takze nejprve zvetsit swap - musi byt vetsi jez je mnozstvi 
fyzicke pameti) - doufat, ze to pri padu ten coredump udela.

Pak uz "jen" zjistit co to delalo v okamziku, kdy to spadlo, najit tu 
chybu a opravit ji. Pokud bych mel vystrelit zcela naslepo, tak jde o 
chybu pri praci s pameti, ktera je chybne oznacena jako zpusobila k 
odswapovani, nasledne odswapovana - a system spadne v okamziku, kdy 
kernelovy modul tu pamet chce pouzit v kontextu, ktery nedovoluje jeji 
nacteni ze swapu. Ale to jsem si jen hodil kostkama. Muze to byt i uplne 
neco jinyho.

Existuje pro tebe urcita mala sance na mene narocne reseni. Pokud nejde 
o memory-leak (kdy je spotreba pameti z dlouhodobeho hlediska shora 
neomezena), pak by ti problem mohlo vyresit pridani pameti - a to 
takoveho mnozstvi, aby swap nebyl potrebny.

Ostatne, uz nahore jsem naznacoval, ze to je minimalni mnozstvi pameti v 
kazdem pripade.

Alternativne se samozrejme muzes pokusit omezit pouzivani stavajici 
pameti - zkusit ZFS presvedcit, ze nesmi pouzivat vic pameti nez kolik 
ji je. I pokud se ti to povede, nebude to zadarmo, nejspis to bude mit 
negativni vliv na vykon.

> Reštart nastane samozrejme v najnevhodnejší čas.

To je nejpravdepodobnejsi - v dobe nejvetsi zateze jsou nejvetsi naroky 
na pamet.

> Za každú radu ďakujem.

Skutecne i za tuhle ? ;-)


Dan






More information about the Users-l mailing list