Не работает Raid контроллер

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Shadow
Junior member
Сообщения: 2
Зарегистрирован: 23 окт 2002, 20:35
Откуда: Краснодар

Не работает Raid контроллер

Сообщение Shadow » 23 окт 2002, 20:50

Ситуация: имеется сервер Acer Altos 1200, hot swap. 4 винта Fujitsu 36Gb SCSI 160 и контроллер AcelleRaiD 352. Так вот он при запуске хоть с винтами, хоть без как правило пишет Spinning drives и потом диски так и не находит... с трудом (методом шаманства, например вытащить контроллер, подержать и снова вставить) получается войти в EzAssist, но без винтов. С винтами вообще не входит... вот сегодня чудом удалось войти с винтами (хотя до этого что только не делали - и форматировали даже) и вроде перезапускается пока без проблем... но иногда Raid просто вис (вроде) - горит лампочка на одном только приводе и не гаснет (привод всегда разный). Люди советуют поиграться с Drives per spin и Interval between spin... но сервак уже дохлый вторую неделю (бьемся над ним). Что это может быть такое (хотя сейчас работает. правда и раньше работал, но потом повис дисковый массив и потом не запускался EzAssist вообще)? (шлейф менять тоже пробовали, и Raid на другое место перетыкали)
С уважением, Дмитрий.

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1984
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 24 окт 2002, 10:19

Я считаю, что наиболее вероятная причина такого поведения контроллера то, что сигнал SCSI шины подвешивается битым контроллером одного (или нескольких) HDD.
:idea: рекомендую по одиночке проверить все винчестеры на реакцию на шину scsi и соответственно заменить неработоспособные. Если имеется возможность (переходничёк, запасной кабель) то попробуйте подключать hdd без корзинки и с другим шнурком.

P.S. Ситуация знакомая, как правило виноват всего 1 винт.

Аватара пользователя
CyberDrake
free-lance moderator
Сообщения: 338
Зарегистрирован: 23 авг 2002, 10:39
Откуда: Санкт-Петербург
Контактная информация:

Сообщение CyberDrake » 24 окт 2002, 13:42

1. Проверить схему терминации, корзину и кабель. Если что-то не соответстует стандарту Ultra160SCSI, то понизить частоту шины через настройки в RAID Ezassist.

2. Проверить прошивку RAID контроллера, прошить последнюю версию
http://www.mylex.com/support/productgd/index.html

3. Проверить прошивку винтов, прошить последнюю. Вполне вероятно что глючит один из винтов, забивая при этом шину.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 24 окт 2002, 14:19

если с винтами и без них проблема идентичная, то скорее всего виновата связка корзина-кабель-терминация.
попробуйте действительно понизить частоту шины и\или повесить диск без корзины (просто на кабеле с заведомо хорошей терминацией).
кстати, что значит "без винтов" - просто диски вынуты из подключенной к контроллеру корзины или кабель от контроллера отстегнут?

Shadow
Junior member
Сообщения: 2
Зарегистрирован: 23 окт 2002, 20:35
Откуда: Краснодар

Сообщение Shadow » 24 окт 2002, 21:35

Попытаться запустить без корзины не получается - винты ведь все хот свап и разъемы соответствующие. Звонили в Питер и в Москву по этой проблеме. Частоту шины меньше ставить пока не пробовали. Но корзину разъединили на 2 раздельных блока на разные шлейфы (раньше там шлейфик-перемычка был) и поставили по 2 винта на каждый канал Raid контроллера и в разных блоках корзины. Запускается, но пока периодически вылетают винты (первые два поочередно, может и остальные тоже будут вылетать - мы много не гоняли систему) в офлайн и им постоянно ребилд делается... А что значит "без винтов" ? пробовали и вообще без шлейфов подключенных, так и со шлейфами, но с отключенными винтами от корзины.
С уважением, Дмитрий.

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1984
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 25 окт 2002, 13:27

Shadow писал(а):Попытаться запустить без корзины не получается - винты ведь все хот свап и разъемы соответствующие. Звонили в Питер и в Москву по этой проблеме.
Для этой цели существуют переходнички 68pin - 80pin
Shadow писал(а): Частоту шины меньше ставить пока не пробовали. Но корзину разъединили на 2 раздельных блока на разные шлейфы (раньше там шлейфик-перемычка был) и поставили по 2 винта на каждый канал Raid контроллера и в разных блоках корзины. Запускается, но пока периодически вылетают винты (первые два поочередно, может и остальные тоже будут вылетать - мы много не гоняли систему) в офлайн и им постоянно ребилд делается...
Стопудово - разделив корзину на 2 части вы совсем нарушили схему терминации ( если она вообще была ).
FAQ по терминации написать, или сами занаете о чем говорю ?

Palych
Junior member
Сообщения: 1
Зарегистрирован: 25 окт 2002, 22:49

Сообщение Palych » 25 окт 2002, 23:25

Я напарник Shadow.
Схема терминации была, однозначно!! После разъединения карзины на 2 независимых канала терминацию мы не нарушили. По мануалу карзина без встроенной терминации, и мы затерминировали оба канала. Ситуация в принципе не изменилась. Успели создать массив, установить сервер 2000, погонять систему с нагрузкой на диски, все вроде бы нормально, но после суток непрерывной работы массив заткнулся, что привело к экрану смерти и невозможности записи дампа на диск. После перегрузки массив не раскручивается, пришлось выключать питание, после этого с горем пополам раскрутился массив. Глянули на лог GAM, там сообщения о ребюлде дисков и есть еще пара записей о ошибке процессора контроллера, данная запись появляется по одной на сессию. В последний раз массив опять не раскрутился, все шлейфы и терминаторы в порядке, в офлайн переходят разные диски, даже купленный в другом городе, изначально было 3 диска, потом докупили еще один.
Что еще можете посоветовать?

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1984
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 28 окт 2002, 10:26

Palych, Shadow.
:? А всё ли хорошо у вас в этом серверочке с питанием ???
Уже дважды проскакивала жалоба на нестабильное (с неуловимыми причинами) раскручивание дисков, которое может не происходить по 3 причинам
  1. нет сигнала на раскрутку от контроллера - исправляется перемычкой auto spin (или disable auto spin)
  2. подсажены уровни сигналов (плохие провода, битая эл-ка, кривые терминаторы). Это самый сложный для диагностики вариант. :(
  3. недостаточно напряжение источника питания :!:

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»