Форум Тринити

Открытый технический форум по серверам и системам хранения данных, кластерным решениям, SAN, NAS.
Microsemi infortrend storage
Текущее время: 18 мар 2019, 21:24

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 8 ] 
Автор Сообщение
СообщениеДобавлено: 13 мар 2015, 13:55 
Не в сети
Junior member

Зарегистрирован: 13 мар 2015, 11:40
Сообщения: 3
Здравствуйте! Сервер iRU ROCK 110R. 4 харда по 1 терабайту. Контроллер LSI MegaRAID SAS 9240-8i. Сделан RAID 10. В итоге один виртуальный диск на 1.8 Тб. На него установлена ОС Windows Server 2008, поставлен SQL Server 2012, в который залита БД и программа работающая с ней. По сети люди подключаются через программу к базе и работают. При работающей системе был вынут жесткий диск ID 28 (4 хардам контроллер присвоил след номера (почему-то, начиная, не с 1): 28, 29, 30, 31) из корзины и вставлен обратно через 5-10 сек.. Система и программа продолжили работать, однако контроллер выдал ошибку. Было принято решение перезагрузить систему и посмотреть в WebBIOS состояние массива. Сделав это, диск, который был вынут, стал "uncofigured bad". Загрузил систему и через "MegaRAID Storage Manager" вернул диск обратно в массив (в webbios не разобрался с ходу). Все, вроде бы система и программа заработали штатно. Но на след. день программа начала выдавать ошибки. Было принято решение обновить её, перед этим сделать бэкап и перезагрузить сервер. Однако после перезагрузки выкинуло синий экран. Восстановил систему через "Восстановление системы" (пришлось вновь подсовывать дрова контроллера, чтоб система увидела массив). В итоге пришлось переставлять и SQL Server, так как он не мог подключиться к серверу. После этого начало выдавать ошибку при попытке восстановить последнюю успешно сделанную резервную копию БД. Однако выдавало ошибки. В итоге получилось восстановить лишь ту резервную копию БД, которая была сделана до вытаскивания диска (ID 28). Отсюда есть несколько вопросов к опытным админам.

1) Почему "hot swap" (горячая замена) не сработал после того, как был вынут\вставлен хард (ID 28)? Или ее как то нужно активировать? Подскажите где и что нужно подкрутить? можно ли это сделать без потери данных и переустановки системы?

2) Как сделать на подобной системе "hot spare" диск? И можно ли это сделать на моем RAID 10 без потери данных и переустановки системы?

3) Можно ли делать "consistency check and fix error" в "MegaRAID Storage Manager" (показано на приложенном рисунке consistency.jpeg) на работающей системе? Есть возможность также внести эту операцию в план заданий через ту же "MegaRAID Storage Manager". Нужно ли это делать и как часто?

4) Можно ли прогой Victoria 4.47 (определила массив и контроллер правильно) в режиме "Remap" (то есть помечать как плохие неудовлетворительные блоки) запускать процедуру проверки с лечением для массива RAID 10 указанного контроллера? Будет от этого толк? При обычной проверке в режиме "Ignore" нашлось 9 опасных блоков:

"18:23:44 : Starting Reading, LBA=0..3904897023, sequential access, timeout 10000ms
18:46:12 : Warning! Block start at 723698944 = 265 ms
18:46:19 : Warning! Block start at 724781056 = 312 ms
18:47:21 : Warning! Block start at 736308224 = 234 ms
18:47:28 : Warning! Block start at 737525760 = 1045 ms
19:32:11 : Warning! Block start at 2144364800 = 234 ms
19:48:07 : Warning! Block start at 2606505984 = 281 ms
19:48:43 : Warning! Block start at 2612854016 = 250 ms
19:53:21 : Warning! Block start at 2677889024 = 265 ms
20:23:30 : Warning! Block start at 3458733056 = 234 ms
20:49:00 : ***** Scan results: Warnings - 9, errors - 0 *****"

5) Какие еще есть рекомендации по настройке подобного контроллера в целях ускорения работы массива и повышения его надежности? Скрин настроек и параметров контроллера из "MegaRAID Storage Manager" прилагается.

Спасибо!


Вложения:
Свойства контроллера.jpg
Свойства контроллера.jpg [ 269.94 КБ | Просмотров: 6444 ]
Параметры контроллера.jpg
Параметры контроллера.jpg [ 190.61 КБ | Просмотров: 6444 ]
warning.txt [1.53 КБ]
Скачиваний: 191
Consistency.jpg
Consistency.jpg [ 49.17 КБ | Просмотров: 6444 ]
Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2015, 16:11 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 23 авг 2002, 17:34
Сообщения: 16730
Откуда: Москва
1. Слишком быстро переткнули диск, контроллер просто не успел сообразить.
3. Если у Вас уже полезли ошибки, то верификация не поможет. Она может пофиксить совсем не то, что нужно.
Объясняю. После того, как был вынут диск, информация на нем уже не соответствует остальным винтам - она устарела. Потом Вы принудительно вернули диск в массив, т.к. ЗАСТАВИЛИ контроллер думать, что все в порядке - но на самом деле данные на массиве сейчас представляют собой невнятную мешанину из актуальных блоков и устаревших.
Самый правильный путь - переинициализация массива и заливка последнего корректного бэкапа.

Можно конечно попробовать еще выдрать этот диск снова и сделать ему ребилд. Но это сомнительно. И только если еще не делали верификацию.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2015, 16:13 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 23 авг 2002, 17:34
Сообщения: 16730
Откуда: Москва
Контроллер у Вас безмозглый и тормозной, производительности ждать не стоит.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2015, 16:54 
Не в сети
Advanced member

Зарегистрирован: 18 июн 2010, 11:22
Сообщения: 233
Откуда: C.Петербург
wladimir1804 писал(а):
Было принято решение перезагрузить систему и посмотреть в WebBIOS состояние массива. Сделав это, диск, который был вынут, стал "uncofigured bad". Загрузил систему и через "MegaRAID Storage Manager" вернул диск обратно в массив (в webbios не разобрался с ходу).


как уже выше сказали, в этот момент вы сами разрушили массив. если уж так получилось, что из работающего сервера случайно вынули рабочий диск, то заново его вводить в массив надо только через ребилд. в MSM сделать его unconfigured good, а потом сделать его hot spare. по умолчанию у LSI авторебилд включен, так что он сразу начнётся.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2015, 16:59 
Не в сети
Junior member

Зарегистрирован: 13 мар 2015, 11:40
Сообщения: 3
gs писал(а):
1. Слишком быстро переткнули диск, контроллер просто не успел сообразить.


Так сколько нужно времени ждать, чтобы "безболезненно" вставить диск обратно?

gs писал(а):
3. Если у Вас уже полезли ошибки, то верификация не поможет. Она может пофиксить совсем не то, что нужно.


Здесь я имел ввиду про проведение верификации на полностью исправной и рабочей системе. Запускать ее, когда система и БД под "нагрузкой или же в ночное время"? Есть ли вообще в этом смысл и польза, например, поставить ее в расписание раз в неделю или месяц ночью?

gs писал(а):
Объясняю. После того, как был вынут диск, информация на нем уже не соответствует остальным винтам - она устарела. Потом Вы принудительно вернули диск в массив, т.к. ЗАСТАВИЛИ контроллер думать, что все в порядке - но на самом деле данные на массиве сейчас представляют собой невнятную мешанину из актуальных блоков и устаревших.
Самый правильный путь - переинициализация массива и заливка последнего корректного бэкапа.

Так а как сделать, чтобы hot swap работал, который, как я понимаю и призван безболезненно и без каких либо дополнительных манипуляций позволять вытаскивать и вставлять обратно хотя бы один хард при работающей системе? Сравниваю с HP Proliant DL 380, где можно абсолютно безболезненно вытащить и вставить любой диск при загруженной ОС...


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2015, 17:04 
Не в сети
Junior member

Зарегистрирован: 13 мар 2015, 11:40
Сообщения: 3
turboprop писал(а):
wladimir1804 писал(а):
Было принято решение перезагрузить систему и посмотреть в WebBIOS состояние массива. Сделав это, диск, который был вынут, стал "uncofigured bad". Загрузил систему и через "MegaRAID Storage Manager" вернул диск обратно в массив (в webbios не разобрался с ходу).


как уже выше сказали, в этот момент вы сами разрушили массив. если уж так получилось, что из работающего сервера случайно вынули рабочий диск, то заново его вводить в массив надо только через ребилд. в MSM сделать его unconfigured good, а потом сделать его hot spare. по умолчанию у LSI авторебилд включен, так что он сразу начнётся.


Получается это особенность контроллера LSI, что он не поддерживает горячую замену диска?
Диск вставленный в корзину моего сервера автоматически станет "hot spare", или в MSM его нужно до этого доводить? Если нужно, опишите, пож-та, как это сделать?


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2015, 17:23 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 23 авг 2002, 17:34
Сообщения: 16730
Откуда: Москва
О господи, да все он поддерживает.
На НР можно с таким же успехом нарваться на развал массива при передергивании винтов. Это просто дело случая.
Подождали бы минуту-другую, он бы сам все прочухал.
И в НР диск, имеющий метаданные, хот спаре с бухты-барахты тоже не станет.

В доке написано следующее:
12.6 Removing a Drive
You may sometimes need to remove a non-failed drive that is connected to the controller. For example, you may need
to replace the drive with a larger drive. Follow these steps to remove a drive safely:
1. Click the icon of the drive in the left panel, and click the Operations tab in the right panel.
2. Select Prepare for Removal, and click Go.
3. Wait until the drive spins down and remove it.
If you change your mind, select Undo Prepare for Removal, and click Go.

http://www.lsi.com/products/raid-contro ... x#tab/tab3
Почитайте вообще доку.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 01 июн 2018, 00:45 
Не в сети
Junior member

Зарегистрирован: 01 июн 2018, 00:41
Сообщения: 4
Хочу поделиться своим опытом, так же недавно коллега дернул не тот диск, но ребилдить не пришлось, достаточно было найти конфигурационную информацию на втащенном диске, точнее импортировать. (Scan Foreign Configuration), вся процедура заняла минуту.


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Часовой пояс: UTC + 3 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 11


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB