RAID 5 + один системный
Модераторы: Trinity admin`s, Free-lance moderator`s
RAID 5 + один системный
Сервер HP tc4100;
RAID контроллер Mylex 352;
конфигурация массива - RAID 5 уровня;
Все это ведет себя не стабильно. Вопрос по поводу этой нестабильности я уже задавал здесь, но не смог ничего сделать. Ну да ладно. Есть следующая идея - подключить системный винт через SCSI канал на мат. плате. Поставить туда Windows, а данные(базы *.dbf) положить на RAID. Далее сделать образ винчестера с системного винчестера(например Ghost'ом) и жить более менее спокойно. Просто насколько мне известно(и у самого однажды так было), когда в массиве вылетает винт на котором лежат системные файлы, то операционка отказывается грузиться. Что вы думаете по этому поводу?
RAID контроллер Mylex 352;
конфигурация массива - RAID 5 уровня;
Все это ведет себя не стабильно. Вопрос по поводу этой нестабильности я уже задавал здесь, но не смог ничего сделать. Ну да ладно. Есть следующая идея - подключить системный винт через SCSI канал на мат. плате. Поставить туда Windows, а данные(базы *.dbf) положить на RAID. Далее сделать образ винчестера с системного винчестера(например Ghost'ом) и жить более менее спокойно. Просто насколько мне известно(и у самого однажды так было), когда в массиве вылетает винт на котором лежат системные файлы, то операционка отказывается грузиться. Что вы думаете по этому поводу?
В логах gam'a такие ошибки:
A hard disk failed because device is missing.
Logical drive is critical.
An automatic rebuild has started.
An automatic rebuild has started on logical drive.
Rebuild on logical drive is over.
Rebuild is over.
A hard disk has been placed online.
Logical drive has been placed online.
Такие штуки повторяются несколько раз в месяц. Весь процесс занимает примерно 1 час. Винты вылетают разные. За полтора года 3 раза вообще вылетало по 2 винта, тогда сервер просто падал, приходилось из под bios'а контроллера все поднимать.
Что самое интересное: это происходит на двух серверах, которые абсолютно идентичны по конфигурации и похоже не зависит от нагрузки на дисковую подсистему, так как бывало даже ночью.
Что можете посоветовать?[/b]
A hard disk failed because device is missing.
Logical drive is critical.
An automatic rebuild has started.
An automatic rebuild has started on logical drive.
Rebuild on logical drive is over.
Rebuild is over.
A hard disk has been placed online.
Logical drive has been placed online.
Такие штуки повторяются несколько раз в месяц. Весь процесс занимает примерно 1 час. Винты вылетают разные. За полтора года 3 раза вообще вылетало по 2 винта, тогда сервер просто падал, приходилось из под bios'а контроллера все поднимать.
Что самое интересное: это происходит на двух серверах, которые абсолютно идентичны по конфигурации и похоже не зависит от нагрузки на дисковую подсистему, так как бывало даже ночью.
Что можете посоветовать?[/b]
- Dmitry
- Сотрудник Тринити
- Сообщения: 867
- Зарегистрирован: 22 авг 2002, 16:12
- Откуда: St.Petersburg
- Контактная информация:
Поменять прошивки RAID, HDD, Корзин. Если не помогло то:
Первое что приходит в голову - проблема с терминацией (оно же проблема работы на максимальной скорости). Проверяется тупо. А именно занизить скорость SCSI шины, т е попробовать переключить в режим SE (Single Ended) установив джамперы на каждом винчестере.
Далее в Mylex в Phisical devices поставить частоту шины 20MGz. В результате этого скорость каналов упадет с U160 до UW т е до 40MB/s. Но при этом массив не будет разваливаться.
Если будет именно так, то известно куда копать - менять шлейфы, терминаторы, и даже корзины (бывают старые на поддерживающие U160)
Первое что приходит в голову - проблема с терминацией (оно же проблема работы на максимальной скорости). Проверяется тупо. А именно занизить скорость SCSI шины, т е попробовать переключить в режим SE (Single Ended) установив джамперы на каждом винчестере.
Далее в Mylex в Phisical devices поставить частоту шины 20MGz. В результате этого скорость каналов упадет с U160 до UW т е до 40MB/s. Но при этом массив не будет разваливаться.
Если будет именно так, то известно куда копать - менять шлейфы, терминаторы, и даже корзины (бывают старые на поддерживающие U160)
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Какие кстати винты?
Именно такое поведение было с дисками IBM DDYS с прошивками S80D. Виноваты были именно винты. Проверьте - если надо, кинем перешивалку.
Еще в плане шаманства - на контроллере есть темно-серая пластиковая квадратная хреновина. Это батарейка NVRAM. Иногда контроллер по каким-то причинам (например из-за нестабильности скази шины или еще как) начинает выкидывать разные кренделя. Причем это не лечится нормальными методами, т.к. он что-то пишет в скрытые врутренние регистры NVRAM. В этом случае часто помогает сдергивание этой самой батарейки для обнуления настроек.
Именно такое поведение было с дисками IBM DDYS с прошивками S80D. Виноваты были именно винты. Проверьте - если надо, кинем перешивалку.
Еще в плане шаманства - на контроллере есть темно-серая пластиковая квадратная хреновина. Это батарейка NVRAM. Иногда контроллер по каким-то причинам (например из-за нестабильности скази шины или еще как) начинает выкидывать разные кренделя. Причем это не лечится нормальными методами, т.к. он что-то пишет в скрытые врутренние регистры NVRAM. В этом случае часто помогает сдергивание этой самой батарейки для обнуления настроек.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 19 гостей