Samovolne zastaveni sitoveho provozu

Pavlíček Jaroslav JaPavlicek at csas.cz
Wed Oct 12 14:02:39 CEST 2005


Zdravim,

Uplne to same, co popisujete, jsem zazival jeden cas na stroji s FreeBSD 4.8. Nepravidelne vypadky, v logu zadne zminky, neodpovidalo to na ping a z niceho nic se to pak "samo" zase rozjelo. Za nejaky cas to prestalo, ale jestli pomohla vymena HW nebo cim to bylo, jsem nikdy nezjistil.

--- jp


-----Original Message-----
From: users-l-bounces at freebsd.cz [mailto:users-l-bounces at freebsd.cz] On Behalf Of Dan Bilik
Sent: Wednesday, October 12, 2005 10:48 AM
To: FreeBSD mailing list
Subject: Samovolne zastaveni sitoveho provozu

Dobry den.

Situace: Jednoucelovy server pro http vydej statickeho obsahu, pred par tydny zprovozneny s FreeBSD 6.0-BETA5. Hardware je IBM eServer x330 (2 x P3, 1GB RAM, SCSI disky 36 a 72GB, 2 x Intel fxp(4) ethernet), dmesg a konfigurace kernelu v priloze. Software navic oproti cistemu systemu je boa, cdpd, qmail a net-snmp.

Problem: Po nejake dobe provozu prestane reagovat sitovy interface, pres ktery se vydava, tj. stroj neodpovida na jakekoliv pokusy o sitovy kontakt (ping, ssh, nfs, http). "vmstat -i" ukazuje zastavene pocitadlo preruseni pro danou sitovku. Stroj pritom funguje dal, lokalne pres konzoli se da bez problemu prihlasit, korektne projde i shutdown(8).
Nikde do logu nepadne nic podezreleho a nezvykleho. Po rucnim nastaveni druheho sitoveho interface se pres nej da opet v siti komunikovat.
Doba, po ktere se stroj dostane do tohoto stavu, je nahodna a nezavisla na jakychkoliv dennich ci nocnich aktivitach stroje. Nekdy se tak stane po 14 dnech bezproblemoveho provozu, nekdy k tomu dojde dvakrat za den.

Co vsechno bylo zkouseno: Vypnuti ACPI. Nastaveni polling(4). Presun stroje do VLAN, ktera nevykazuje tak husty sitovy provoz. Vse bez viditelneho vlivu na dany problem.

Dotazy: Nesetkal se nekdo z vas s podobnym chovanim? Nenasli byste v poskytnutych informacich nejakou na prvni pohled zjevnou neoptimalitu nebo chybne nastaveni? Jakym zpusobem dostat z takto postizeneho stroje vic informaci pro odhaleni priciny? Pripadne jak sesbirat potrebne dumpy, ktere by mohl pouzit znaly vyvojar k hlubsi analyze?

Dekuji za jakykoli podnet.

Dan





More information about the Users-l mailing list