Перезагрузки сервера, подскажите что может быть?

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
alexisl
Junior member
Сообщения: 3
Зарегистрирован: 12 апр 2005, 14:06

Перезагрузки сервера, подскажите что может быть?

Сообщение alexisl » 12 апр 2005, 15:29

Железо:
SuperMicro X5DPA-GG
Inet Xeon -Prestonia,2.4Ghz  - 2x
2 Gb DDr PC266 ECC
Mulex AcceleRaid 170
ОС: Windows 2000 Server SP4
TSE, Citrix Metaframe XP  Presentation Server
Все апдэты для win и citrix установлены
Сервак работает как сервер приложения для 1С, базы dbf.

Симптомы:

Сервер стал периодически перезагружаться с ошибкой:
UNEXPECTED_KERNEL_MODE_TRAP (0x0000007F)
Parameter 1: 0x00000000
В ходе тестов было выявлено, что проблемы с процессорами, их заменили, и все вроде стало ок.

Теперь после некоторого времени, сервак стал падать с ошибкой:
UNEXPECTED_KERNEL_MODE_TRAP (0x0000007F)
Parameter 1: 0x00000008

перезагрузки могут происходить в любое время,независимо от загрузки  
сервера и задач запущенных на нем.
Привожу один из примеров анализа дампа памяти:
Windows 2000 Kernel Version 2195 (Service Pack 4) MP (4 procs) Free x86 compatible
Product: Server, suite: TerminalServer
Kernel base = 0x80400000 PsLoadedModuleList = 0x80484b80
Debug session time: Mon Apr 11 15:12:39 2005
System Uptime: 0 days 17:57:45.024
WARNING: Process directory table base 41DA4000 doesn't match CR3 00030000
WARNING: Process directory table base 41DA4000 doesn't match CR3 00030000
*** WARNING: symbols timestamp is wrong 0x41773335 0x3ee650b3 for ntkrnlmp.exe
Loading Kernel Symbols
...................................................................................................
Loading unloaded module list
..........
Loading User Symbols
..................................................................
*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

Use !analyze -v to get detailed debugging information.

BugCheck 7F, {8, 0, 0, 0}

*** WARNING: symbols timestamp is wrong 0x41cc5092 0x3eb1ea3c for win32k.sys
*** WARNING: symbols timestamp is wrong 0x41d2757d 0x3ef37f50 for USER32.dll
*** WARNING: symbols timestamp is wrong 0x3d9c6d9b 0x3ef37f51 for COMCTL32.dll
*** WARNING: Unable to verify checksum for
*** ERROR: Symbol file could not be found.  Defaulted to export symbols for  -
*** WARNING: Unable to verify checksum for
*** ERROR: Symbol file could not be found.  Defaulted to export symbols for  -
Probably caused by : USER32.dll ( USER32!GetSystemMetrics+2 )

Followup: MachineOwner
---------

0: kd> !analyze -v
*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

UNEXPECTED_KERNEL_MODE_TRAP (7f)
This means a trap occurred in kernel mode, and it's a trap of a kind
that the kernel isn't allowed to have/catch (bound trap) or that
is always instant death (double fault).  The first number in the
bugcheck parens is the number of the trap (8 = double fault, etc)
Consult an Intel x86 family manual to learn more about what these
traps are. Here is a *portion* of those codes:
If kv shows a taskGate
       use .tss on the part before the colon, then kv.
Else if kv shows a trapframe
       use .trap on that value
Else
       .trap on the appropriate frame will show where the trap was taken
       (on x86, this will be the ebp that goes with the procedure KiTrap)
Endif
kb will then show the corrected stack.
Arguments:
Arg1: 00000008, EXCEPTION_DOUBLE_FAULT
Arg2: 00000000
Arg3: 00000000
Arg4: 00000000

Debugging Details:
------------------


BUGCHECK_STR:  0x7f_8

TRAP_FRAME:  b86ade64 -- (.trap b86ade64)
ErrCode = 00000000
eax=03dab5b7 ebx=0000f000 ecx=00000000 edx=b86ae604 esi=039bf3a8 edi=039b65d6
eip=77e15b69 esp=0012f1c8 ebp=0012f220 iopl=0         nv up ei ng nz na po nc
cs=001b  ss=0023  ds=0023  es=0023  fs=003b  gs=0000             efl=00000286
USER32!GetSystemMetrics+2:
001b:77e15b69 c20800      ret     0x8
Resetting default context

DEFAULT_BUCKET_ID:  DRIVER_FAULT

LAST_CONTROL_TRANSFER:  from 7172421f to 77e15b69

STACK_TEXT:  
0012f220 7172421f 038e93f0 039bf3a8 00000100 USER32!GetSystemMetrics+0x2
0012f244 71721c44 038e93f0 00000100 039b8328 COMCTL32!ListView_WndProc+0x10d7
0012f2c4 77e3a420 0001015c 00000401 00000100 COMCTL32!StatusWndProc+0x878
0012f2e4 77e16b41 71721441 0001015c 00000401 USER32!ECCopy+0x6
0012f308 77e16b64 ffff00ad 0001015c 00000401 USER32!GetWindowWord+0x34
0012f328 6c2d9330 ffff00ad 0001015c 00000401 USER32!_GetWindowWord+0x86
0012f348 1f3521d1 00000401 00000100 0252dc28 MFC42!CWnd::DefWindowProcA+0x42
WARNING: Stack unwind information not available. Following frames may be wrong.
0012f384 1f35240e 00000000 031f6114 00000001 Frame!SECStatusBar::SetPaneText+0xb2
0012f418 6c2d99d5 0000000c 00000000 1f35e3e8 Frame!SECStatusBar::OnSetText+0x21
0012f438 6c2e627d 0000000c 00000000 031f6114 MFC42!CWnd::WindowProc+0x22
0012f458 6c2d88ee 0000000c 00000000 031f6114 MFC42!CControlBar::WindowProc+0xc6
0012f4b8 6c2d8afb 00000000 0001015c 0000000c MFC42!AfxCallWndProc+0x90
0012f4d8 6c3013a8 0001015c 0000000c 00000000 MFC42!AfxWndProc+0x34
0012f504 77e3a420 0001015c 0000000c 00000000 MFC42!AfxWndProcBase+0x39
0012f524 77e16381 6c30136f 0001015c 0000000c USER32!ECCopy+0x6
0012f554 77e18c16 004ce2d8 0000000c 00000000 USER32!_FindProp+0x58
0012f554 77e18c16 004ce2d8 0000000c 00000000 USER32!DefDlgProcWorker+0x2d2
0012f5ac 00418ef5 0000c110 00000000 01553418 USER32!DefDlgProcWorker+0x2d2
0012f640 6c2d99d5 00000362 0000c110 0042a9b0 1cv7s!Framework::~Framework+0x151d5
0012f660 6c2d88ee 00000362 0000c110 00000000 MFC42!CWnd::WindowProc+0x22
0012f6c0 6c2d8afb 00000000 00010158 00000362 MFC42!AfxCallWndProc+0x90
0012f6e0 6c3013a8 00010158 00000362 0000c110 MFC42!AfxWndProc+0x34
0012f70c 77e3a420 00010158 00000362 0000c110 MFC42!AfxWndProcBase+0x39
0012f72c 77e16381 6c30136f 00010158 00000362 USER32!ECCopy+0x6
0012f75c 77e168c4 004f4768 00000362 0000c110 USER32!_FindProp+0x58
0012f77c 6c2f24b3 00010158 00000362 0000c110 USER32!_GetDlgItem+0x4
0012f790 6c2f2484 0000c110 01553418 00419a57 MFC42!CFrameWnd::SetMessageText+0x14
0012f79c 00419a57 00000002 0283dafc 01553418 MFC42!CFrameWnd::OnEnterIdle+0x2d
0012f7b0 6c2d9e07 00000002 0283dafc 01553418 1cv7s!Framework::~Framework+0x15d37
000a0034 00000000 00000000 00000000 00000000 MFC42!CWnd::OnWndMsg+0x410
b86adaec a0005bf4 00000002 b86adb1c 00000018 nt!KiIpiGenericCall+0x68
b86add7c a0002ae2 a0ece2d8 0000000f 00000000 win32k!xxxCallHook+0xd
b86addd4 a000bd7b a0ece2d8 0000000f 00000000 win32k!xxxHungAppDemon+0xc4
b86ade20 a00094f2 a0ece2d8 00000001 a00094b8 win32k!RGNOBJ::bCopy+0xc7
b86ade54 804670c9 0001015c 00000050 00740000 win32k!xxxScanSysQueue+0xb03
b86ade54 77e15b69 0001015c 00000050 00740000 nt!KiUnexpectedInterruptTail+0xfa
0012f220 7172421f 038e93f0 039bf3a8 00000100 USER32!GetSystemMetrics+0x2
0012f244 71721c44 038e93f0 00000100 039b8328 COMCTL32!ListView_WndProc+0x10d7
0012f2c4 77e3a420 0001015c 00000401 00000100 COMCTL32!StatusWndProc+0x878
0012f2e4 77e16b41 71721441 0001015c 00000401 USER32!ECCopy+0x6
0012f308 77e16b64 ffff00ad 0001015c 00000401 USER32!GetWindowWord+0x34
0012f328 6c2d9330 ffff00ad 0001015c 00000401 USER32!_GetWindowWord+0x86
0012f348 1f3521d1 00000401 00000100 0252dc28 MFC42!CWnd::DefWindowProcA+0x42
0012f384 1f35240e 00000000 031f6114 00000001 Frame!SECStatusBar::SetPaneText+0xb2
0012f418 6c2d99d5 0000000c 00000000 1f35e3e8 Frame!SECStatusBar::OnSetText+0x21
0012f438 6c2e627d 0000000c 00000000 031f6114 MFC42!CWnd::WindowProc+0x22
0012f458 6c2d88ee 0000000c 00000000 031f6114 MFC42!CControlBar::WindowProc+0xc6
0012f4b8 6c2d8afb 00000000 0001015c 0000000c MFC42!AfxCallWndProc+0x90
0012f4d8 6c3013a8 0001015c 0000000c 00000000 MFC42!AfxWndProc+0x34
0012f504 77e3a420 0001015c 0000000c 00000000 MFC42!AfxWndProcBase+0x39


FOLLOWUP_IP:
USER32!GetSystemMetrics+2
77e15b69 c20800           ret     0x8

FOLLOWUP_NAME:  MachineOwner

SYMBOL_NAME:  USER32!GetSystemMetrics+2

MODULE_NAME:  USER32

IMAGE_NAME:  USER32.dll

DEBUG_FLR_IMAGE_TIMESTAMP:  41d2757d

STACK_COMMAND:  .trap b86ade64 ; kb

BUCKET_ID:  INVALID_KERNEL_CONTEXT

Followup: MachineOwner
---------

0: kd> kv
ChildEBP RetAddr  Args to Child              
00000000 00000000 00000000 00000000 00000000 nt!KiTrap0D+0x343
b86adaec a0005bf4 00000002 b86adb1c 00000018 nt!KiIpiGenericCall+0x68 (FPO: [Non-Fpo])
b86add7c a0002ae2 a0ece2d8 0000000f 00000000 win32k!xxxCallHook+0xd (FPO: [Non-Fpo])
b86addd4 a000bd7b a0ece2d8 0000000f 00000000 win32k!xxxHungAppDemon+0xc4 (FPO: [Non-Fpo])
b86ade20 a00094f2 a0ece2d8 00000001 a00094b8 win32k!RGNOBJ::bCopy+0xc7 (FPO: [Non-Fpo])
b86ade54 804670c9 0001015c 00000050 00740000 win32k!xxxScanSysQueue+0xb03 (FPO: [Non-Fpo])
b86ade54 77e15b69 0001015c 00000050 00740000 nt!KiUnexpectedInterruptTail+0xfa (FPO: [0,2] TrapFrame @ b86ade64)
0012f220 7172421f 038e93f0 039bf3a8 00000100 USER32!GetSystemMetrics+0x2 (FPO: [Non-Fpo])
0012f244 71721c44 038e93f0 00000100 039b8328 COMCTL32!ListView_WndProc+0x10d7 (FPO: [Non-Fpo])
0012f2c4 77e3a420 0001015c 00000401 00000100 COMCTL32!StatusWndProc+0x878 (FPO: [Non-Fpo])
0012f2e4 77e16b41 71721441 0001015c 00000401 USER32!ECCopy+0x6 (FPO: [Non-Fpo])
0012f308 77e16b64 ffff00ad 0001015c 00000401 USER32!GetWindowWord+0x34 (FPO: [2,0,0])
0012f328 6c2d9330 ffff00ad 0001015c 00000401 USER32!_GetWindowWord+0x86 (FPO: [2,0,1])
0012f348 1f3521d1 00000401 00000100 0252dc28 MFC42!CWnd::DefWindowProcA+0x42
WARNING: Stack unwind information not available. Following frames may be wrong.
0012f384 1f35240e 00000000 031f6114 00000001 Frame!SECStatusBar::SetPaneText+0xb2
0012f418 6c2d99d5 0000000c 00000000 1f35e3e8 Frame!SECStatusBar::OnSetText+0x21
0012f438 6c2e627d 0000000c 00000000 031f6114 MFC42!CWnd::WindowProc+0x22
0012f458 6c2d88ee 0000000c 00000000 031f6114 MFC42!CControlBar::WindowProc+0xc6
0012f4b8 6c2d8afb 00000000 0001015c 0000000c MFC42!AfxCallWndProc+0x90
0012f4d8 6c3013a8 0001015c 0000000c 00000000 MFC42!AfxWndProc+0x34
0: kd> .trap b86ade64
ErrCode = 00000000
eax=03dab5b7 ebx=0000f000 ecx=00000000 edx=b86ae604 esi=039bf3a8 edi=039b65d6
eip=77e15b69 esp=0012f1c8 ebp=0012f220 iopl=0         nv up ei ng nz na po nc
cs=001b  ss=0023  ds=0023  es=0023  fs=003b  gs=0000             efl=00000286
USER32!GetSystemMetrics+2:
001b:77e15b69 c20800      ret     0x8
0: kd> kv
 *** Stack trace for last set context - .thread/.cxr resets it
ChildEBP RetAddr  Args to Child              
0012f220 7172421f 038e93f0 039bf3a8 00000100 USER32!GetSystemMetrics+0x2 (FPO: [Non-Fpo])
0012f244 71721c44 038e93f0 00000100 039b8328 COMCTL32!ListView_WndProc+0x10d7 (FPO: [Non-Fpo])
0012f2c4 77e3a420 0001015c 00000401 00000100 COMCTL32!StatusWndProc+0x878 (FPO: [Non-Fpo])
0012f2e4 77e16b41 71721441 0001015c 00000401 USER32!ECCopy+0x6 (FPO: [Non-Fpo])
0012f308 77e16b64 ffff00ad 0001015c 00000401 USER32!GetWindowWord+0x34 (FPO: [2,0,0])
0012f328 6c2d9330 ffff00ad 0001015c 00000401 USER32!_GetWindowWord+0x86 (FPO: [2,0,1])
0012f348 1f3521d1 00000401 00000100 0252dc28 MFC42!CWnd::DefWindowProcA+0x42
WARNING: Stack unwind information not available. Following frames may be wrong.
0012f384 1f35240e 00000000 031f6114 00000001 Frame!SECStatusBar::SetPaneText+0xb2
0012f418 6c2d99d5 0000000c 00000000 1f35e3e8 Frame!SECStatusBar::OnSetText+0x21
0012f438 6c2e627d 0000000c 00000000 031f6114 MFC42!CWnd::WindowProc+0x22
0012f458 6c2d88ee 0000000c 00000000 031f6114 MFC42!CControlBar::WindowProc+0xc6
0012f4b8 6c2d8afb 00000000 0001015c 0000000c MFC42!AfxCallWndProc+0x90
0012f4d8 6c3013a8 0001015c 0000000c 00000000 MFC42!AfxWndProc+0x34
0012f504 77e3a420 0001015c 0000000c 00000000 MFC42!AfxWndProcBase+0x39
0012f524 77e16381 6c30136f 0001015c 0000000c USER32!ECCopy+0x6 (FPO: [Non-Fpo])
0012f554 77e18c16 004ce2d8 0000000c 00000000 USER32!_FindProp+0x58 (FPO: [3,0,1])
0012f554 77e18c16 004ce2d8 0000000c 00000000 USER32!DefDlgProcWorker+0x2d2 (FPO: [Non-Fpo])
0012f5ac 00418ef5 0000c110 00000000 01553418 USER32!DefDlgProcWorker+0x2d2 (FPO: [Non-Fpo])
0012f640 6c2d99d5 00000362 0000c110 0042a9b0 1cv7s!Framework::~Framework+0x151d5
0012f660 6c2d88ee 00000362 0000c110 00000000 MFC42!CWnd::WindowProc+0x22


грешу либо на память или на процессоры.
Правда, память новая и оттестированная.
Процы тоже новые, правда версия микрокода на них 14, а по истории
последняя версия аж 47. Может после обновления будет получше.

А где взять этот микрокод новый, не знаю.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 13 апр 2005, 16:05

Дело не в микрокоде, скорее всего.
1. Обновите биос мамы.
2. Проверьте память чем-то типа memtest.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: Bing [Bot] и 25 гостей