Вопросы по замене винчестера в RAID 10

Конфигурирование, планирование RAID систем, возможности, технологии, теория. Qlogic, LSI Logic, Adaptec ...

Модераторы: Trinity admin`s, Free-lance moderator`s

dimakazantip
Junior member
Сообщения: 13
Зарегистрирован: 26 окт 2009, 13:23
Откуда: Санкт-Петербург

Вопросы по замене винчестера в RAID 10

Сообщение dimakazantip » 26 окт 2009, 13:32

Добрый день!

Имеем сервер SuperMicro
Имеем RAID контроллер Adaptec 2130S
Четыре винчестера Fujitsu MAT3073NC включены как RAID 10
Один винчестер явно умер - индикатор горит красным. В утилите контроллера показан с красным крестом.
Вопрос: если я "на горячую" заменю этот винчестер, то контроллер сам все поймет и перестроит массив или надо будет предпринять еще какие то телодвижения для восстановления нормальной работы? В принципе, сервер можно и остановить. В общем, возникает вопрос: как лучше менять винч - "на горячую" или на остановленном сервере? И будет ли все восстановлено автоматом или надо еще что-то делать?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Вопросы по замене винчестера в RAID 10

Сообщение gs » 26 окт 2009, 13:34

Вытащите диск, подождите минуту, вставьте новый. Ребилд должен пойти автоматом. Если не пойдет, из ASM толкните его руками.
Вариант - воткните новый диск рядом и назначьте его спаре.

dimakazantip
Junior member
Сообщения: 13
Зарегистрирован: 26 окт 2009, 13:23
Откуда: Санкт-Петербург

Re: Вопросы по замене винчестера в RAID 10

Сообщение dimakazantip » 26 окт 2009, 15:31

Решил просто вынуть винчестер и вставить обратно в сервер "на горячую"
Если раньше на винчестере просто горел красный светодиод, то теперь он ритмично мигает, а зеленый (он вообще не горел) стал помаргивать в такт с другими зелеными.

В утилите контроллера появился на значке винчестера восклицательный знак (был красный крест) и статус Rebuild

Хм. Если сейчас он придет в норму, то стоит ли менять такой винчестер? Говорит ли это о его проблемах или это какой то локальный сбой контроллера?

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Вопросы по замене винчестера в RAID 10

Сообщение Stranger03 » 26 окт 2009, 15:41

dimakazantip писал(а):В утилите контроллера появился на значке винчестера восклицательный знак (был красный крест) и статус Rebuild
Ждите окончания ребилда, потом смотрите статус и логи.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

dimakazantip
Junior member
Сообщения: 13
Зарегистрирован: 26 окт 2009, 13:23
Откуда: Санкт-Петербург

Re: Вопросы по замене винчестера в RAID 10

Сообщение dimakazantip » 27 окт 2009, 07:56

Процесс закончился. Все винчестеры теперь говорят, что всё ОК.
Где смотреть логи и как понять, что могло произойти и что нужно предпринять? Может все же поменять неблагонадежный винч?

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Вопросы по замене винчестера в RAID 10

Сообщение Stranger03 » 27 окт 2009, 08:25

dimakazantip писал(а):Где смотреть логи и как понять, что могло произойти и что нужно предпринять?
Адаптек сторадж менеджер
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

dimakazantip
Junior member
Сообщения: 13
Зарегистрирован: 26 окт 2009, 13:23
Откуда: Санкт-Петербург

Re: Вопросы по замене винчестера в RAID 10

Сообщение dimakazantip » 27 окт 2009, 09:02

Собственно говоря, вот лог. Проблемы с диском были замечены утром 26.10.2009

RaidEvt.log:
8 Сентябрь 2009 г. 8:22:47 MSD INF -1:A0-1C-S--L-- server5 Adaptec Storage Manager started on TCP/IP port number 34 571.
8 Сентябрь 2009 г. 8:22:59 MSD INF -1:A00C-S--L-- server5 User dima logged into server5 with administrative privileges.
26 Октябрь 2009 г. 10:28:44 MSK WRN -1:A00C-S--L-- server5 Could not contact Adaptec Storage Manager service. Adaptec Storage Manager may not function correctly. Please start the service.
26 Октябрь 2009 г. 10:28:45 MSK WRN 212:A00C-S--L-- server5 Task Scheduler: Task 1 failed to start at the scheduled start time.
26 Октябрь 2009 г. 10:28:40 MSK INF -1:A0-1C-S--L-- server5 Adaptec Storage Manager started on TCP/IP port number 34 571.
26 Октябрь 2009 г. 10:28:47 MSK WRN 301:A01C-S--L01 server5 Logical device is degraded: controller 1, logical device 1 ("RAID10")
26 Октябрь 2009 г. 10:28:47 MSK ERR 401:A01C0S01L-- server5 Failed drive: controller 1, channel 0, SCSI device ID 1
26 Октябрь 2009 г. 10:28:50 MSK ERR -1:A00C-S--L-- server5 User dima could not be logged into server5.
26 Октябрь 2009 г. 10:28:40 MSK INF -1:A0-1C-S--L-- server5 Adaptec Storage Manager started on TCP/IP port number 34 571.
26 Октябрь 2009 г. 10:28:58 MSK WRN 301:A01C-S--L01 server5 Logical device is degraded: controller 1, logical device 1 ("RAID10")
26 Октябрь 2009 г. 10:28:59 MSK INF -1:A00C-S--L-- server5 User dima logged into server5 with administrative privileges.
26 Октябрь 2009 г. 10:28:58 MSK ERR 401:A01C0S01L-- server5 Failed drive: controller 1, channel 0, SCSI device ID 1
26 Октябрь 2009 г. 10:31:10 MSK WRN -1:A00C-S--L-- server5 Could not contact Adaptec Storage Manager service. Adaptec Storage Manager may not function correctly. Please start the service.
26 Октябрь 2009 г. 10:31:06 MSK INF -1:A0-1C-S--L-- server5 Adaptec Storage Manager started on TCP/IP port number 34 571.
26 Октябрь 2009 г. 10:31:19 MSK WRN 301:A01C-S--L01 server5 Logical device is degraded: controller 1, logical device 1 ("RAID10")
26 Октябрь 2009 г. 10:31:19 MSK ERR 401:A01C0S01L-- server5 Failed drive: controller 1, channel 0, SCSI device ID 1
26 Октябрь 2009 г. 10:31:22 MSK INF -1:A00C-S--L-- server5 User dima logged into server5 with administrative privileges.
26 Октябрь 2009 г. 13:16:13 MSK WRN -1:A00C-S--L-- server5 Could not contact Adaptec Storage Manager service. Adaptec Storage Manager may not function correctly. Please start the service.
26 Октябрь 2009 г. 13:16:09 MSK INF -1:A0-1C-S--L-- server5 Adaptec Storage Manager started on TCP/IP port number 34 571.
26 Октябрь 2009 г. 13:16:23 MSK WRN 301:A01C-S--L01 server5 Logical device is degraded: controller 1, logical device 1 ("RAID10")
26 Октябрь 2009 г. 13:16:23 MSK ERR 401:A01C0S01L-- server5 Failed drive: controller 1, channel 0, SCSI device ID 1
26 Октябрь 2009 г. 13:16:25 MSK INF -1:A00C-S--L-- server5 User dima logged into server5 with administrative privileges.
26 Октябрь 2009 г. 13:18:49 MSK WRN -1:A00C-S--L-- server5 Could not contact Adaptec Storage Manager service. Adaptec Storage Manager may not function correctly. Please start the service.
26 Октябрь 2009 г. 13:18:45 MSK INF -1:A0-1C-S--L-- server5 Adaptec Storage Manager started on TCP/IP port number 34 571.
26 Октябрь 2009 г. 13:19:00 MSK WRN 301:A01C-S--L01 server5 Logical device is degraded: controller 1, logical device 1 ("RAID10")
26 Октябрь 2009 г. 13:19:00 MSK ERR 401:A01C0S01L-- server5 Failed drive: controller 1, channel 0, SCSI device ID 1
26 Октябрь 2009 г. 13:19:02 MSK INF -1:A00C-S--L-- server5 User dima logged into server5 with administrative privileges.
26 Октябрь 2009 г. 15:11:36 MSK INF 304:A01C-S--L01 server5 Rebuilding: controller 1, logical device 1 ("RAID10").
26 Октябрь 2009 г. 15:27:06 MSK WRN -1:A00C-S--L-- server5 Could not contact Adaptec Storage Manager service. Adaptec Storage Manager may not function correctly. Please start the service.
26 Октябрь 2009 г. 15:27:02 MSK INF -1:A0-1C-S--L-- server5 Adaptec Storage Manager started on TCP/IP port number 34 571.
26 Октябрь 2009 г. 15:27:15 MSK WRN 301:A01C-S--L01 server5 Logical device is degraded: controller 1, logical device 1 ("RAID10")
26 Октябрь 2009 г. 15:27:15 MSK INF 304:A01C-S--L01 server5 Rebuilding: controller 1, logical device 1 ("RAID10").
26 Октябрь 2009 г. 15:27:17 MSK INF -1:A00C-S--L-- server5 User dima logged into server5 with administrative privileges.
26 Октябрь 2009 г. 19:18:13 MSK INF 345:A01C-S--L01 server5 Logical device is normal: controller 1, logical device 1 ("RAID10")
26 Октябрь 2009 г. 19:18:13 MSK INF 305:A01C-S--L01 server5 Rebuild complete: controller 1, logical device 1 ("RAID10").
27 Октябрь 2009 г. 7:51:07 MSK WRN -1:A00C-S--L-- server5 Could not contact Adaptec Storage Manager service. Adaptec Storage Manager may not function correctly. Please start the service.
27 Октябрь 2009 г. 7:51:03 MSK INF -1:A0-1C-S--L-- server5 Adaptec Storage Manager started on TCP/IP port number 34 571.
27 Октябрь 2009 г. 7:51:16 MSK INF -1:A00C-S--L-- server5 User dima logged into server5 with administrative privileges.

Что здесь можно увидеть интересного? Посмотрел остальные логфайлы. Есть некий RaidEvtA.log. Там как я понял лог начал вестись с того времени, как начался рибилд диска

26 Октябрь 2009 г. 19:17:32 MSK INF server5 Running: Scrub mirror - 99%. Controller 0, logical drive 62
26 Октябрь 2009 г. 19:17:52 MSK INF server5 Running: Scrub mirror - 99%. Controller 0, logical drive 62
26 Октябрь 2009 г. 19:18:02 MSK INF server5 Running: Scrub mirror - 99%. Controller 0, logical drive 62
26 Октябрь 2009 г. 19:18:12 MSK INF server5 Complete: Scrub mirror - 100%. Controller 0, logical drive 62
26 Октябрь 2009 г. 19:18:12 MSK INF server5 Adapter text event: Container 62 completed REBUILD task: controller 0
26 Октябрь 2009 г. 19:18:12 MSK INF server5 Complete: Scrub mirror - 100%. Controller 0, logical drive 62
26 Октябрь 2009 г. 19:18:12 MSK INF server5 Container changed: controller 0, logical device 0
26 Октябрь 2009 г. 19:18:12 MSK INF server5 Container changed: controller 0, logical device 62
26 Октябрь 2009 г. 19:18:12 MSK INF server5 Container changed: controller 0, logical device 63
26 Октябрь 2009 г. 19:18:12 MSK INF server5 A device that resides in an enclosure slot experienced a status change: controller 0
26 Октябрь 2009 г. 19:18:12 MSK INF server5 A device that resides in an enclosure slot experienced a status change: controller 0
26 Октябрь 2009 г. 19:18:13 MSK INF 345:A01C-S--L01 server5 Logical device is normal: controller 1, logical device 1 ("RAID10")
26 Октябрь 2009 г. 19:18:13 MSK INF 305:A01C-S--L01 server5 Rebuild complete: controller 1, logical device 1 ("RAID10").
26 Октябрь 2009 г. 19:18:18 MSK INF server5 A device that resides in an enclosure slot experienced a status change: controller 0

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Вопросы по замене винчестера в RAID 10

Сообщение Stranger03 » 27 окт 2009, 09:41

dimakazantip писал(а):26 Октябрь 2009 г. 19:18:13 MSK INF 305:A01C-S--L01 server5 Rebuild complete: controller 1, logical device 1 ("RAID10")
Например вот эта запись интересна.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

dimakazantip
Junior member
Сообщения: 13
Зарегистрирован: 26 окт 2009, 13:23
Откуда: Санкт-Петербург

Re: Вопросы по замене винчестера в RAID 10

Сообщение dimakazantip » 27 окт 2009, 09:45

А чего в ней такого? Это закончился ребилд, который я инициировал тем, что вынул винч, а потом вставил обратно. Лог в этом файле начался вестись ровно в то время, когда я это сделал. Вот первая запись:

26 Октябрь 2009 г. 15:20:00 MSK INF server5 Running: Scrub mirror - 3%. Controller 0, logical drive 62

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Вопросы по замене винчестера в RAID 10

Сообщение Stranger03 » 27 окт 2009, 10:02

dimakazantip писал(а):А чего в ней такого?
Закончился ребилд, дальше ошибок не наблюдается. Вылезет, тогда будете волноваться.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

dimakazantip
Junior member
Сообщения: 13
Зарегистрирован: 26 окт 2009, 13:23
Откуда: Санкт-Петербург

Re: Вопросы по замене винчестера в RAID 10

Сообщение dimakazantip » 27 окт 2009, 10:06

Т.е. ситуацию, когда вот так вот вдруг ни с того, ни с сего остановился винчестер, а потом начал работать нормально , можно считать стандартной?

Аватара пользователя
diz
Advanced member
Сообщения: 1189
Зарегистрирован: 12 янв 2009, 12:09
Откуда: Пермь

Re: Вопросы по замене винчестера в RAID 10

Сообщение diz » 27 окт 2009, 10:59

Извлеките жесткий диск, сделайте полную проверку и, если ошибки не будут выявлены, отформатируйте и установите обратно. В любом случае есть смысл купить диск в ЗИП. Обновите драйвера контроллера на всякий случай.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Вопросы по замене винчестера в RAID 10

Сообщение Stranger03 » 27 окт 2009, 11:06

diz писал(а):В любом случае есть смысл купить диск в ЗИП.
Ага, только где теперь найти этот диск? Разве что на блошинном рынке:

Код: Выделить всё

HDD 73.5 U320SCSI Fujitsu MAT3073NC LVD 80pin 10000rpm
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Вопросы по замене винчестера в RAID 10

Сообщение Stranger03 » 27 окт 2009, 11:07

dimakazantip писал(а):Т.е. ситуацию, когда вот так вот вдруг ни с того, ни с сего остановился винчестер, а потом начал работать нормально , можно считать стандартной?
В вашем случае считаем что стандартная ситуация. если повторится - следует задуматься о смене этого старичка на что-то более новое с гарантией.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

dimakazantip
Junior member
Сообщения: 13
Зарегистрирован: 26 окт 2009, 13:23
Откуда: Санкт-Петербург

Re: Вопросы по замене винчестера в RAID 10

Сообщение dimakazantip » 27 окт 2009, 11:24

Stranger03 писал(а):
diz писал(а):В любом случае есть смысл купить диск в ЗИП.
Ага, только где теперь найти этот диск? Разве что на блошинном рынке:

Код: Выделить всё

HDD 73.5 U320SCSI Fujitsu MAT3073NC LVD 80pin 10000rpm

Так говорят, что можно ставить с большим объемом и большим rpm без проблем. Или это не так?

Ответить

Вернуться в «Массивы - RAID технологии.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 5 гостей