выгорел канал на корзине..

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
ilya63rus
Power member
Сообщения: 40
Зарегистрирован: 04 июн 2004, 10:13
Откуда: Самара
Контактная информация:

выгорел канал на корзине..

Сообщение ilya63rus » 26 июн 2004, 14:59

Есть корзина AXX2HSDRVUG - обычная, которая ставиться на 5200 корпус Intel, подключена к intel SRCU32, такая проблема - сервак не загрузился в одно прекрасное время (я пришел с утра - а он висит), при перезагрузке 0-канал говорит failed, воткнул другой винт - в скорости подключения написал async, постаил другой винт - у него скорость то 40Мб/с, то 80Мб/с. Все подозрения, что выгорел именно канал - остальные 4 пашут нормально.
Вопрос следующий - я все правильно понимаю - если я куплю новую корзину и переставлю винты в прежнем порядке (по каналам) - массив не рассыпиться?
И еще вопрос - сервак уже 3 года пашет, винты 2 штуки сменил (падали, но раид отрабатывал хорошо), а 3 осталось старыми.
Вопрос такой - через какое время надо менять винты в принудительном порядке - профилактически?
И каким образом это делать в srcu32.
Да, RAID10 используется. В настройке RAID этого нет. Или просто выдернуть винт, поставить новый и сказать раиду использовать его взамен потеряного? В меню удалить hotswap есть, а удалить винт из RAID1 массива нет.
Заранее спасибо за ответы

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1984
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 28 июн 2004, 11:08

Есть подозрение что на корзине накрылся терминатор.

Диски можно переставить в новую корзину без нежелательных последствий.
Блее того т.к. информация о занимаемой роли винта в массиве хранится как в контроллере так и на самом винте, то винты можно перетсовывать как вздумается, данные не пострадают.
впрочем, без особой на то нужды делать этого не стоит - вдруг вам случиться быть первооткрывателями неизвестного бага используемых версий прошивок ;)

Насчёт профилактической замены её нужно делать когда на винт появляются подозрения - повышенный шум, участившаяся рекалибрация головок, показания SMART, показания счётчика ошибок RAID контроллера.

Делается такая замена с толком, расстоновкой и не спеша.
Извлекли винт на пол корпуса, оставили его в салазках чтобы шпиндиль остановился, подождали пока контроллер сообразит о неполадках и запустит rebuild на HotSpare винт.
Рационально убедиться что контроллер ведёт ребилд, и это не обычная его активность.
Новый hdd имеет смысл вставлять в процессе Rebuild`а он автоматом займёт место HotSpare.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Re: выгорел канал на корзине..

Сообщение exLH » 28 июн 2004, 11:36

ilya63rus писал(а):Есть корзина AXX2HSDRVUG - обычная, которая ставиться на 5200 корпус Intel, подключена к intel SRCU32, такая проблема - сервак не загрузился в одно прекрасное время (я пришел с утра - а он висит), при перезагрузке 0-канал говорит failed, воткнул другой винт - в скорости подключения написал async, постаил другой винт - у него скорость то 40Мб/с, то 80Мб/с. Все подозрения, что выгорел именно канал - остальные 4 пашут нормально.
На самом деле, вполне вероятно, что все у Вас нормально, кроме, конечно, умершего (или отвалившегося) в 0-м канале диска. Дело в том, что для непроинициализированного интеловым контроллером физического диска, состояние его в async, а также прыганье по скоростям криминалом (если я не ошибаюсь) не является. Для нового диска надо в advanced меню контроллера (F4) надо зайти в Configure Physical devices -> SCSI parameter / initialize, там выбрать нужные параметры и при выходе из этой менюшки, все произойдет. Странно, что у вас там все повисло, правда, при отвале диска.

В меню контроллера можно удалять части зеркала (configure array drives -> remove RAID1 component). Правда, для RAID10 такой ход работать не должен.

ilya63rus
Power member
Сообщения: 40
Зарегистрирован: 04 июн 2004, 10:13
Откуда: Самара
Контактная информация:

Сообщение ilya63rus » 28 июн 2004, 11:47

сегодня проверил - выделил отдельно диск с 0- канала, сделал его отдельным диском, форматнул
в системе он появился, запись/чтение нормально работает
но со скоростью интерфейса (40Мб/с)
перевел обратно его в hot fix

если выгорел терминатор в корзине - что делать? где взять терминатор? или это имеется в виду терминатор на кабеле, который соединяет корзину и контроллер?

По поводу плановой замены - СМАРТом как пользоваться на скази винтах в корзине? и как смотреть количество рекалибровок? Может какая прога есть? Винты Seagate, Quantum, Hitach (IBM)

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1984
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 28 июн 2004, 12:29

ilya63rus писал(а):если выгорел терминатор в корзине - что делать? где взять терминатор? или это имеется в виду терминатор на кабеле, который соединяет корзину и контроллер?
стоп, стоп, стоп,
кабель соединяющий корзину и контроллер прямой и без всяких терминаторов!
если это не так - это корень вашей проблеммы.
У интеловой корзины внутренняя терминация, не отключаемая
если она сгорела то всю корзину необходимо менять.

ilya63rus
Power member
Сообщения: 40
Зарегистрирован: 04 июн 2004, 10:13
Откуда: Самара
Контактная информация:

Сообщение ilya63rus » 28 июн 2004, 15:12

эээ.
у меня конкретно на этом серваке не помню как (встроенное scsi есть, стриммер зацеплен через него), может и без терминатора, а вот на другом, с такой же корзиной, подключен стриммер на канал раида(раид потому что одноканальный, а встроенного scsi нет), так кабель с терминатором. Причем кабель идет от контроллера, в корзину, потом в стриммер, потом терминатор - и работает без проблем.
Что надо сделать - снять терминатор?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 28 июн 2004, 15:29

Это вообще нерабочий вариант. Стример (если уж так нужно - мы не рекомендуем вообще их на рэйды вешать) должен висеть МЕЖДУ контроллером и корзиной. Терминация должна быть НА КОНЦЕ шины в единственном экземпляре. В данном случае на корзине (она там встроенная).

ilya63rus
Power member
Сообщения: 40
Зарегистрирован: 04 июн 2004, 10:13
Откуда: Самара
Контактная информация:

Сообщение ilya63rus » 28 июн 2004, 18:22

нерабочий в смысле навернется все?
или не будет работать сразу?
вобщем ситуация была такая - мы приобрели сервер - 2*XEONDP 2,4Ggh в который входил раид SRCU42L(задачи такие - не особо дисковая подсистема загружена будет) подключенный к вышеупомянутой корзине. Так же в состав этого сервера входит стриммер HP/ При поставке этого сервака кабеля для подключения стриммера не было - поставщики говорили,что мол не пришел
я его протестил, запустил в работу.
Тут у поставщиков пришел кабель нужный, он приехали, воткнули кабель, все заработало. Вопрос про стриммер в раиде я им задавал - сказали что все будет путем.В принципе сейчас ошибок не наблюдается, но хочется быть уверенным - может вынести все же стриммер на отдельный контроллер (Tekram 395 есть под рукой)?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 28 июн 2004, 18:26

То, о чем я говорил - нарушение сказевой спецификации. Оно может и будет работать. Какое-то время. А потом рухнет.

А насчет стримера на рэйде - не надо туда совать девайс, который имеет непосредственный контакт с хомо сапиенс. Теоретически это работоспособно, но весьма чревато :(

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»