Проблемы с массивом на LSI9280

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

rahs
Advanced member
Сообщения: 98
Зарегистрирован: 07 дек 2009, 13:44
Откуда: Архангельск

Проблемы с массивом на LSI9280

Сообщение rahs » 01 дек 2015, 18:52

Здравствуйте

Нужен совет

Есть сервер, fujitsu primergy rx200 s7 wi2012r2std, установлен контроллер LSI 9280-8e, подключена полка на 24 диска, собран массив raid60

С некоторых пор начались проблемы - диск пропадает из системы. Вслед за диском пропадает и контроллер

Код: Выделить всё

PS C:\Program Files (x86)\MegaRAID Storage Manager> .\StorCLI.exe /c1 show
Status = Failure
Description = At least one controller is busy. Please wait for 3 minutes and try again
В логе сообщения

Код: Выделить всё

Controller ID:  1  Controller encountered a fatal error and was reset
Event ID:345.

Reset to device, \Device\RaidPort2, was issued.

Controller ID:  1   PD Predictive failure:  
    -:-:2.

Controller ID:  1   PD Predictive failure:  
    -:-:21.
После перезагрузки работа восстанавливается и некоторое время все работает нормально

Попробовал заменить контроллер на 9286CV-8e, ничего не изменилось

Вдобавок после одной из перезагрузок контроллер потерял диск. Диск я заменил, запустился ребилд, но идет он как-то очень вяло

Собственно, вопрос - чтоможно предпринять? Заменить сразу два диска с ошибками чтения мне не кажется хорошей идеей

Код: Выделить всё

Controller = 1
Status = Success
Description = None

Product Name = LSI MegaRAID SAS 9286CV-8e
Serial Number = SV41916432
SAS Address =  500605b008dafe00
PCI Address = 00:04:00:00
System Time = 12/01/2015 18:36:07
Mfg. Date = 05/06/14
Controller Time = 12/01/2015 19:34:46
FW Package Build = 23.34.0-0005
BIOS Version = 5.50.03.0_4.17.08.00_0x06110200
FW Version = 3.460.05-4565
Driver Name = megasas2.sys
Driver Version = 6.709.12.00
Vendor Id = 0x1000
Device Id = 0x5B
SubVendor Id = 0x1000
SubDevice Id = 0x9291
Host Interface = PCIE
Device Interface = SAS-6G
Bus Number = 4
Device Number = 0
Function Number = 0
Drive Groups = 1

TOPOLOGY :
========

--------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type   State BT      Size PDC  PI SED DS3  FSpace
--------------------------------------------------------------------------
 0 -   -   -        -   RAID60 Pdgd  N  36.376 TB dsbl N  N   dflt N
 0 0   -   -        -   RAID6  Dgrd  N  18.188 TB dsbl N  N   dflt N
 0 0   0   10:0     32  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   1   10:1     29  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   2   10:2     18  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   3   10:3     17  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   4   10:4     15  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   5   10:5     35  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   6   10:6     37  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   7   10:7     26  DRIVE  Rbld  Y   1.818 TB dsbl N  N   dflt -
 0 0   8   10:8     34  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   9   10:9     16  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   10  10:10    56  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 0   11  10:11    33  DRIVE  Onln  N   1.818 TB dsbl N  N   dflt -
 0 1   -   -        -   RAID6  Dgrd  N  18.188 TB dsbl N  N   dflt N
 0 1   0   10:12    13  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   1   10:13    38  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   2   10:14    24  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   3   10:15    49  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   4   10:16    52  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   5   10:17    27  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   6   10:18    48  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   7   10:19    30  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   8   10:20    55  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   9   10:21    57  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   10  10:22    36  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
 0 1   11  10:23    58  DRIVE  Onln  Y   1.818 TB dsbl N  N   dflt -
--------------------------------------------------------------------------

DG=Disk Group Index|Arr=Array Index|Row=Row Index|EID=Enclosure Device ID
DID=Device ID|Type=Drive Type|Onln=Online|Rbld=Rebuild|Dgrd=Degraded
Pdgd=Partially degraded|Offln=Offline|BT=Background Task Active
PDC=PD Cache|PI=Protection Info|SED=Self Encrypting Drive|Frgn=Foreign
DS3=Dimmer Switch 3|dflt=Default|Msng=Missing|FSpace=Free Space Present

Virtual Drives = 1

VD LIST :
=======

-----------------------------------------------------------
DG/VD TYPE   State Access Consist Cache sCC      Size Name
-----------------------------------------------------------
0/0   RAID60 Pdgd  RW     No      RWTD  -   36.376 TB VD_0
-----------------------------------------------------------

Cac=CacheCade|Rec=Recovery|OfLn=OffLine|Pdgd=Partially Degraded|dgrd=Degraded
Optl=Optimal|RO=Read Only|RW=Read Write|HD=Hidden|B=Blocked|Consist=Consistent|
R=Read Ahead Always|NR=No Read Ahead|WB=WriteBack|
AWB=Always WriteBack|WT=WriteThrough|C=Cached IO|D=Direct IO|sCC=Scheduled
Check Consistency

Physical Drives = 24

PD LIST :
=======

----------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                 Sp
----------------------------------------------------------------------------
10:0     32 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:1     29 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:2     18 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:3     17 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:4     15 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:5     35 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:6     37 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:7     26 Rbld   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:8     34 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:9     16 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:10    56 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:11    33 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:12    13 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:13    38 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:14    24 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:15    49 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:16    52 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:17    27 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:18    48 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:19    30 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:20    55 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:21    57 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:22    36 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
10:23    58 Onln   0 1.818 TB SATA HDD N   N  512B WDC WD2003FYYS-02W0B0 U
----------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded


PS C:\Program Files (x86)\MegaRAID Storage Manager>

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Проблемы с массивом на LSI9280

Сообщение Stranger03 » 02 дек 2015, 10:40

rahs
Как я понимаю, контроллер "левый"? С дисками, надо проверить те, что вызывают подозрения. Если есть какие-то косяки - менять. Были случаи, когда один диск "гадил" всему массиву.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

rahs
Advanced member
Сообщения: 98
Зарегистрирован: 07 дек 2009, 13:44
Откуда: Архангельск

Re: Проблемы с массивом на LSI9280

Сообщение rahs » 02 дек 2015, 10:56

В каком смысле "левый"?

По проверке дисков: что будет, если я проблемные диски просто выдерну и заменю? По факту проблемные диски в разных спанах, проблем быть не должно. В теории.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Проблемы с массивом на LSI9280

Сообщение Stranger03 » 02 дек 2015, 11:44

rahs писал(а):В каком смысле "левый"?
Не по каналу Фуджи?
По проверке дисков: что будет, если я проблемные диски просто выдерну и заменю? По факту проблемные диски в разных спанах, проблем быть не должно. В теории.
По одиночке меняйте, дожидайтесь полного ребилда. Можно еще прогнать верификацию рейда. А то, что в разных спанах, не играет особой роли. Я повторюсь, у нас была пара случаев, когда один диск гадил всем. Правда на Адаптеке, но не суть. Чем-то "забивал" контроллер, у того постоянно вываливались диски. На форуме редко, но тоже проскакивали случаи.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Проблемы с массивом на LSI9280

Сообщение gs » 02 дек 2015, 11:51

Если диски в разных спанах, то проблем быть не должно.
Но гадость ситуации в том, что таких проблем вообще не должно быть (пропадание контролера). Так что поаккуратнее.
Спонтанный отвал исправных дисков чаще всего бывает из-за проблем совместимости или кабелей/бэкплейнов...

В общем, подергать провода, прошить контроллер, если не свежий... после окончания ребилда конечно.

rahs
Advanced member
Сообщения: 98
Зарегистрирован: 07 дек 2009, 13:44
Откуда: Архангельск

Re: Проблемы с массивом на LSI9280

Сообщение rahs » 02 дек 2015, 11:59

Stranger03 писал(а):Не по каналу Фуджи?
Да, контроллеры отдельно покупались
Stranger03 писал(а):По одиночке меняйте, дожидайтесь полного ребилда. Можно еще прогнать верификацию рейда. А то, что в разных спанах, не играет особой роли. Я повторюсь, у нас была пара случаев, когда один диск гадил всем. Правда на Адаптеке, но не суть. Чем-то "забивал" контроллер, у того постоянно вываливались диски. На форуме редко, но тоже проскакивали случаи.
Ну вот сейчас на ребилд контроллер хочет два месяца

rahs
Advanced member
Сообщения: 98
Зарегистрирован: 07 дек 2009, 13:44
Откуда: Архангельск

Re: Проблемы с массивом на LSI9280

Сообщение rahs » 02 дек 2015, 12:01

gs писал(а):Если диски в разных спанах, то проблем быть не должно.
В теории...
gs писал(а):Но гадость ситуации в том, что таких проблем вообще не должно быть (пропадание контролера). Так что поаккуратнее.
Спонтанный отвал исправных дисков чаще всего бывает из-за проблем совместимости или кабелей/бэкплейнов...
Эта полка с дисками на таком же контроллере долго работала без нареканий
gs писал(а):В общем, подергать провода, прошить контроллер, если не свежий... после окончания ребилда конечно.
Прошивки и драйвера обновил еще до выпадения диска

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Проблемы с массивом на LSI9280

Сообщение Stranger03 » 02 дек 2015, 12:07

rahs писал(а):Да, контроллеры отдельно покупались
Тут даже кейс не откроешь, и никто не будет гарантировать работоспособность. Хотя конечно работать то должно бы. Контроллер стандартный.
Ну вот сейчас на ребилд контроллер хочет два месяца
Мда, это печальненько, это под нагрузкой из под ОСи? Как вариант, все отключить, контроллер воткнуть в другую машину и попробовать на нем под биосом, без нагрузки.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

rahs
Advanced member
Сообщения: 98
Зарегистрирован: 07 дек 2009, 13:44
Откуда: Архангельск

Re: Проблемы с массивом на LSI9280

Сообщение rahs » 02 дек 2015, 12:11

Stranger03 писал(а):Мда, это печальненько, это под нагрузкой из под ОСи? Как вариант, все отключить, контроллер воткнуть в другую машину и попробовать на нем под биосом, без нагрузки.
Сейчас попробую в биосе посмотреть, сколько запросит

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Проблемы с массивом на LSI9280

Сообщение gs » 02 дек 2015, 12:31

Под нагрузкой ребилд может идти сколь угодно долго...

rahs
Advanced member
Сообщения: 98
Зарегистрирован: 07 дек 2009, 13:44
Откуда: Архангельск

Re: Проблемы с массивом на LSI9280

Сообщение rahs » 02 дек 2015, 13:16

А вот в биос контроллера мне зайти не удалось. Странно. Такое впечатление, что при загрузке сервер его вообще не видит

Перезагрузился, остановил все процессы - 13 часов

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Проблемы с массивом на LSI9280

Сообщение Stranger03 » 02 дек 2015, 14:19

rahs писал(а):Перезагрузился, остановил все процессы - 13 часов
Для САТА дисков это нормально, я бы сказал даже довольно быстро.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

rahs
Advanced member
Сообщения: 98
Зарегистрирован: 07 дек 2009, 13:44
Откуда: Архангельск

Re: Проблемы с массивом на LSI9280

Сообщение rahs » 02 дек 2015, 14:31

Подождем. Завтра видно будет.

Кстати, фуджиковский ServerView RAID Manager контроллер увидел и нормально с ним работает

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Проблемы с массивом на LSI9280

Сообщение Stranger03 » 02 дек 2015, 14:48

rahs писал(а):Кстати, фуджиковский ServerView RAID Manager контроллер увидел и нормально с ним работает
Дык и будет работать, они же контроллеры не делают, оемят у LSI.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

rahs
Advanced member
Сообщения: 98
Зарегистрирован: 07 дек 2009, 13:44
Откуда: Архангельск

Re: Проблемы с массивом на LSI9280

Сообщение rahs » 04 дек 2015, 14:03

Докладаю

Ребилд прошел. Заменил оба проблемных диска, массиву сразу полегчало - на ребилд хочет 16 часов и это под рабочей нагрузкой.

Ошибки типа "Corrected medium error during recovery on disk" еще есть, но их немного

В общем, похоже, действительно сбойный диск не давал контроллеру нормально работать

Спасибо за помощь

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 31 гость