sockets disabled, out-of-fds
Miroslav Lachman
000.fbsd at quip.cz
Thu Dec 8 21:54:55 CET 2016
Dan Lukes wrote on 2016/12/08 19:36:
> To muze znamenat proste jen prilis velky pocet prichozich pozadavku
> (velky zajem o server nebo utok), ne az tak velky pocet prichozich
> pozadavku, ale takoveho typu, ze jejich vyrizeni trva velmi dlouho (mj.
> napriklad proto, ze o velka data zada klient s pomalym spojenim, takze
> prilis dlouho trva prenos), priblem lighttpd (z nejakeho duvodu i
> normalni a male pozadavky vyrozuje velmi pomalu - napriklad jsou data na
> vzdalenem disku a problemy jsou s nim).
Mam graf datoveho toku, poctu otevrenych spojeni lighttpd, pocet
obslouzenych requestu za sekundu, ale bohuzel s tou petiminutovou
granularitou tam nikde neni ani naznak nejakeho narustu. Takze pokud to
opravdu byl nejaky velky pocet spojeni, narostlo to tak rychle, ze to na
grafu neni videt.
>> Proces Lighttpd bezi, ale neodpovida
>
> Ja myslim, ze odpovida - ale musis se s prichozim pozadavkem trefit do
> toho okamziku, kdy se ve fronte prichozich pozadavku zrovna uvolni misto
> - a pak si pockat, nez pozadavek prijde na radu a TCP spojeni je
> skutecne navazano (coz se navic musi trefit do okamziku, kdy ma lighttpd
> prostor pro navazani dalsiho spojeni) a kdy je skutecne vyrizeno.
>
> Statisticky to muze vypadat, ze neodpovida vubec.
Podle access logu to vypadalo takhle - skutecne po ohlaseni out-of-fds
dobehla jen existujici spojeni (v case 14:09:16) a pak to nabehlo az po
restartu Lighttpd
192.168.28.106 xx.yyy.zz - [07/Dec/2016:14:09:05 +0100] "GET
/noRW_layout/favicon.ico HTTP/1.1" 200 894
91.13.253.30.cz xx.yyy.zz - [07/Dec/2016:14:09:16 +0100] "GET
/noRW_wr/o2/mojeid-prihlasit-155x24.png HTTP/1.1" 304 0
192.168.15.145 xx.yyy.zz - [07/Dec/2016:14:42:43 +0100] "GET
/noRW_layout/favicon.ico HTTP/1.1" 200 894
>> "service lighttpd restart" problem vyresi.
>
> To porad jeste nedokazuje, ze problem je nutne v nem (ale nerikam ani,
> ze neni).
>
> Je treba zjistit jake pozadavky ma ten server "rozdelane" v okamziku,
> kdy problem nastal, zda je vubec vyrizuje (a nove jen pribyvaji moc
> rychle) nebo data nepodava vubec (pak je dobre identifikovat jaka data
> to ma problem podavat a zacit hledat proc by mel byt problem je podat).
server-status stranka byla samozrejme taky nedostupna, ale muzu priste
zkusit nejaky truss, ktrace, nebo tak neco. I kdyz si s tim moc nerozumim.
Mirek
More information about the Users-l
mailing list