bge0: watchdog timeout
Dan Lukes
dan at obluda.cz
Tue Sep 7 18:51:58 CEST 2010
On 09/07/10 18:05, Miroslav Prýmek:
> Zajimavy je, ze me to na 7.x jelo uplne bez problemu - a taky se tam delaly zalohy
> v radu malych desitek gigabajtu...
>
>> Zajimave ovsem bylo, ze cerstve po restartu to tak 15 minut chodilo skvele.
>> Pak v ruznych casech vypadky od 1 do 4 vterin nahodne. Cim dele stroj bezel, tim castejsi.
>> f.
>
> Tak to jsem nepozoroval. Vsiml jsem si toho az kdyz se pustilo zalohovani,
> takze bych rekl, ze to souviselo spis se zvysenym provozem nez s casem.
U takto malo popsane zavady se samozrejme neda rict nic urciteho, ale
jednou z moznych pricin "timeout" nektereho z hardwarovych zarzeni je
"ztracene preruseni". Zarizeni proste ma dat vedet prerusenim, ze
uspesne dokoncilo pozadovanou operaci - a ono neda.
Preruseni se muze ztratit (krome hardwarovych problemu) take u sdilenych
preruseni v dusledku chyby v voladacich kdy preruseni prohlasi za sve
nespravny ovladac. Pritom nemusi jit o deterministicky se vyskytujici
chybu - casteji jde o nejakou race-condition vyskytujici se tehdy, pokud
je v nevhodny okamzik splneni vice podminek soucasne.
Pak samozrejme zalezi na tom jak je vyuzivana sitovka ono "druhe"
zarizeni. Takze se snadno stane, ze nekdo jiny problemy nema vubec -
bud' proto, ze nema ono "druhe" zarizeni, nebo ma jinou hardwarovou ci
softwarovou konfiguraci, taze to zarizeni se sitovkou preruseni nesdili.
Staci mit karty zasunute v jinych slotech.
Problem muze mit i casove zavislou "teplotni" slozku - ony podminky,
ktere musi byt splneny soucasne mozna mohou byt splnovany jen v pripade,
ze zarizeni vlivem zmeny teploty zmeni nektere sve charakteristiky
(nikoliv nutne mimo povolene tolerance - staci v ramci nich). Ale ze
samotneho faktu,ze "nejdriv to vzdycky 15 minut bezelo" nelze mit
automaticky za dokazane, ze to je ten pripad.
> Nicmene teda asi budu resit, jakou sitovku tam dat. Ta, co jsem tam
> narychlo dal ted je:
>
> em0 at pci0:9:0:0: class=0x020000 card=0xa01f8086 chip=0x10d38086 rev=0x00 hdr=0x00
> vendor = 'Intel Corporation'
> device = 'Intel 82574L Gigabit Ethernet Controller (82574L)'
Intelky jsou obecne dost dobra volba. Nejenze jde o hardwarove celkem
slusne zarizeni, ale hlavne - Intel se pro podili na vyvoji ovladacu. Da
se tedy spis ocekavat bezproblemova soucinnost hardware a ovladacu.
> Myslite, ze clovek neco vyznamnyho ziska, kdyz tam da podobnou kartu ze serverove
> rady? (neco na zpusob http://www.alza.cz/sitova-karta-intel-pro-1000-pt-server-adapter-pci-e-x1-d65224.htm
> - cca 3x drazsi)
Obecne bys mel ziskat lepsi pomer "pruchodnost"/"spotreba vykonu
procesoru". Ale jake bude to zvyseni pruchodnosti a snizeni zatizeni lze
tezko odhadnout - to zavisi hodne na konkretnim zpusobu pouzivani a jak
se to projevi zrovna u tebe nedokazu odhadnout.
> Nejkritictejsi a nejvic "online" vec, co tam bezi, je samba PDC s cestovnimi profily
> a nejakymi sdilenimi. Pro ostatni sluzby vykon neni kriticky (smtp, imap, proxy, dns apod.).
> Stroj ma CPU vytizeni stabilne v radu jednotek procent.
Pak te snizeni zateze procesoru asi moc neoslovi ...
Dan
More information about the Users-l
mailing list