Padani stroje
Dan Lukes
dan at obluda.cz
Mon Jan 14 11:51:00 CET 2013
On 01/14/13 09:33, Radek Krejča:
> padaji mi 3 stroje na nasledujici chybu - je to ovladaci, ci cim to muze byt?
> Fotka je zde: http://www.krejca.info/chyba.jpg
Pokud se to opakuje (a me se jevi, ze ano), je treba nejmene jeden z
tech stroju nechat bezet na kernelu s ladicimi informacemu
(/boot/kernel/kernel.debug)
Az takovy stroj spadne, vznikly coredump je dulezity zdroj informaci:
gdb -k kernel.debug /usr/crash/vmcore.0
(jmeno coredumpu se bude nejspis lisit)
Vypise totiz u funkci nejen binarni offsety, ale primo cisla radku
odkazujici do zdrojovych kodu. Tedy - misto
> #5 0xffffffff8060c05a at turnstile_wait+0x01aa
bychom videli (ve vypisu gdb, ne pri samotnem panicu) neco jako:
> #5 0x8060c05a in turnstile_wait (ts=???, lock=0x???, owner=0x???)
> at /usr/src/sys/kern/subr_turnstile.c:???
Podstatne jsou ty otazniky. To by dovolilo exaktnejsi analyzu.
Bez toho muzu zkusit leda hadat - klicovy je ramec #5, funkce
turnstile_wait(). Ta mela problemy v zamcich uz driv, abendovalo to tam
uz pred cca osmi lety jeste na 5.2-R (nevim presne, ja se vsem 5.x
vyhnul obloukem).
Ja osobne bych nejspis zkusil aplikovat patche z techto dvou setu:
http://svnweb.freebsd.org/base?view=revision&revision=239585
http://svnweb.freebsd.org/base?view=revision&revision=240424
Myslim, ze ani v 9.1 jeste nejsou.
Tezko ale dokazu vysvetlit proc prave tyhle dva. Vybral jsem si je
postupem, kterej smrdi vestenim a samotne podklady pro vesteni uz jsou
taky "hadane". Takze vsechno co k tomu muzu rict, ze ja bych zkusil
prave tohle. Mozna to nezabere a mozna dokonce uskodi. C'est la vie.
Dan
More information about the Users-l
mailing list