Сервер HP Proliant DL380 G3 непонятные разрушения райд

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Sem
Junior member
Сообщения: 3
Зарегистрирован: 06 май 2005, 06:25

Сервер HP Proliant DL380 G3 непонятные разрушения райд

Сообщение Sem » 06 май 2005, 07:05

На сервер установлены 6 дисков HP - 36.6 Gb, конфигурацию массивов RAID-5 делал и с BIOS и с CD, массив создается нормально, включается процедура его оптимизации, вроде все OK. После установки ОС (ставлю Debian Linux), система живет от 1 до 14 дней и пока по не идентифицированным причинам из райда начинают отваливаться диски. После того как сбойный диск вытащив, возвращаю на место, бывает райд восстанавливается, а бывает что нет. Диски вываливаются разные.
Есть пару серверов (самосборных) там стоят Mylex - подобных проблем не наблюдалось, время жизни более 2 лет.

Может у кого были подобные случаи? Есть ли пути решения проблемы?
На hp.com к сожалению ничего по проблеме не нашел, хотя может плохо искал  :( ....

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 06 май 2005, 11:09

1. "Перевдуть" все, что перевдувается (прошивки).
2. Взять дистрибутив из списка поддерживаемых. Если все нормально работает - пишите в maillist дебиана. Если все равно отваливается - пишите в HP.

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 08 май 2005, 13:37

1. перед тем как "все перевдувать": посмотрите какой кернел-модуль используется  для управления контроллером. должен быть 'cciss'.
`/sbin/lsmod'  даст список используемых модулей.

2. посмотрите в лог, есть-ли какие сообщения в момент 'вываливания' винтов, или вообще какие-либо сообщения от драйвера контроллера.
`sudo grep -rn 'cciss' /var/log/'

3. У вас контроллер не SA 5i plus с батарейкой? Если да, то проверьте батарейку, может ее надо поменять?
 
PS:
1. замечу что никогда не имел подобных проблем со SА (Smart Array) контроллерами, а равно как и с HP(Compaq) оборудованием в целом.
2. HP сертифицирует DL3xx под определенные версии RedHat и SuSE, и видимо не зря ничего не говорит про совместимость с Debian, хотя не секрет что главным спонсором проекта Debian является именно HP.

Sem
Junior member
Сообщения: 3
Зарегистрирован: 06 май 2005, 06:25

Сообщение Sem » 12 май 2005, 07:35

- Все firmware уже прошито - не помогло...
- Модуль cciss вкомпилен в ядро, если бы его не было не работали бы устрорйчтва /dev/cciss/c0d0 и т.д.
- Ядро в момент сбоя обычно никак не ругается, просто на экран начинают сыпаться сообщения, что система не может записать информацию на устойство....(устройство не доступно)

Попробую взять "рекоммендуемый" дистр .....

Спасибо.

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 12 май 2005, 09:16

Sem писал(а):- Все firmware уже прошито - не помогло...
- Модуль cciss вкомпилен в ядро, если бы его не было не работали бы устрорйчтва /dev/cciss/c0d0 и т.д.
- Ядро в момент сбоя обычно никак не ругается, просто на экран начинают сыпаться сообщения, что система не может записать информацию на устойство....(устройство не доступно)
модуль cciss скомпилирован в ядро?  ...  то есть вы сами компилировали кернел, так?  Если так, то тогда надо компилировать с возможностями дебагг, чтоб понять в чем дело, но это дело непростое и не быстрое.

(все устройства будут работать, вне зависимости от того включен-ли модуль в ядро при компиляции, или сделан динамически загружаемым)
sem писал(а):
Попробую взять "рекоммендуемый" дистр .....

Спасибо.
Вот это шаг в правильном направлении

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и 21 гость