Имеется сервер с контроллером adaptec 3805 + 6x Seagate SATA 250G
Железо не бренд, Intel Q8200 CPU + GA-EP45 DS3P, 8Gb RAM
ОС RHEL 5.2, свежеустановленная
RAID 5EE+HS
Диски и память предварительно тестировались.
В выходные шел процесс поднятия БД, размер порядка 150Гб
Где-то на полпути случился kernel panic.
Подозреваю, что что-то не так в дисковой системе.
Сейчас навесил на контроллер кулер, (он грелся до 70С), идет вторая попытка поднятия базы (Sybase ASE, если это важно) Upd: база поднялась успешно, счетчик все так же равномерно растет
Растет счетчик numParityErrors. Растет немного странно - ровно 4 ошибки в час, установка кулера ничего не изменила.
До установки ОС счетчики были все нулевые, я в этом практически уверен.
Гугль что-то молчит о том, что может означать этот параметр, не подскажет ли кто по данному вопросу? Спасибо
Код: Выделить всё
/usr/sbin/arcconf getlogs 1 DEVICE tabular
Controllers found: 1
ControllerLog
controllerID ..................... 0
type ............................. 0
time ............................. 1232964503
version .......................... 2
driveErrorEntry
adapterID ........................ 0
channelID ........................ 0
deviceID ......................... 165
numParityErrors .................. 973
linkFailures ..................... 0
hwErrors ......................... 0
slotNum .......................... 0
enclIndex ........................ 0
abortedCmds ...................... 0
mediumErrors ..................... 0
Command completed successfully.
запустил опрос контроллера раз в минуту
последние 10 результатов выборки awk '{ print $4 " " $9 }' paritylog.txt | uniq --skip-fields=1
Код: Выделить всё
время / счетчик ошибок
13:26:01 975
13:41:01 976
13:56:01 977
14:10:01 978
14:25:01 979
14:40:01 980
14:55:01 981
15:10:01 982
15:25:01 983
15:40:01 984