Adaptec 3805 теряет wd1003fbyx RE4

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
binni
Junior member
Сообщения: 3
Зарегистрирован: 24 апр 2012, 11:21
Откуда: Москва

Adaptec 3805 теряет wd1003fbyx RE4

Сообщение binni » 24 апр 2012, 11:55

Добрый день!
RAID 10 из четырех (новых)wd1003fbyx на Adaptec 3805 через некоторое время, после создания, начинает терять диски по непонятным причинам.
Батарейка есть, "write cache" включен, на дисках "write-trough". Массив создавался через полный Clear. Прошивка контроллера и драйвер - последние с сайта адаптека.
Диски отваливаются один за другим, пока LUN из состояния Degraded не рушится полностью. Горячее отключение и (через 5 минут) подключение ничего не дает.
Сначала грешил на корзину SAS743TQ, но при подключении "напрямую" - та-же история. Также пробовал менять контроллер (есть запасной).

Развитие событий (отваливаются 3 HDD)

Код: Выделить всё

24 Апрель 2012 г. 10:19:10 Set the write-cache mode to write through: controller 1, connector 0, device 0, S/N WD-WMAW30654070.
24 Апрель 2012 г. 10:19:17 Set the write-cache mode to write through: controller 1, connector 0, device 1, S/N WD-WMAW30717547.
24 Апрель 2012 г. 10:19:22 Set the write-cache mode to write through: controller 1, connector 0, device 2, S/N WD-WMAW30697013.
24 Апрель 2012 г. 10:19:26 Set the write-cache mode to write through: controller 1, connector 0, device 3, S/N WD-WMAW30733244.
24 Апрель 2012 г. 11:09:52 Physical drive removed: controller 1, connector 0, device 2, S/N WD-WMAW30697013.
24 Апрель 2012 г. 11:09:52 Logical device is degraded: controller 1, logical device 0 ("MUN0").
24 Апрель 2012 г. 11:31:23 Physical drive removed: controller 1, connector 0, device 1, S/N WD-WMAW30717547.
24 Апрель 2012 г. 11:42:41 Physical drive removed: controller 1, connector 0, device 0, S/N WD-WMAW30654070.
24 Апрель 2012 г. 11:42:41 Logical device failed: controller 1, logical device 0 ("MUN0").
Вот конфигурация "остатков" (это запасный контроллер без батареи)

Код: Выделить всё

24 Апрель 2012 г. 11:46:00 GMT+03:00

Configuration summary
---------------------------

Server name.....................server.local
Adaptec Storage Manager agent...6.50.00 (18579)
Adaptec Storage Manager console.6.50.00 (18579)
Number of controllers...........1
Operating system................Windows

Configuration information for controller 1
-------------------------------------------------------
Type............................Controller
Model...........................Adaptec 3805
Controller number...............1
Physical slot...................7
Installed memory size...........128 MB
Serial number...................9C491141B47
Boot ROM........................5.2-0 (17342)
Firmware........................5.2-0 (17342)
Device driver...................5.2-0 (17342)
Controller status...............Optimal
Battery status..................Not installed
Background consistency check....Disabled
Copy back.......................Disabled
Controller temperature..........Normal (38C / 100F)
Default logical drive task priorityHigh
Number of logical devices.......1
Number of hot-spare drives......0
Number of ready drives..........0
NCQ status......................Enabled
Phy 0...........................No device attached
Phy 1...........................No device attached
Phy 2...........................No device attached
Phy 3...........................No device attached
Phy 4...........................3.00 Gb/s
Phy 5...........................3.00 Gb/s
Phy 6...........................3.00 Gb/s
Phy 7...........................3.00 Gb/s

Logical device..................0
Logical device name.............MUN0
RAID level......................10
Data space......................1,818 TB
Mirror space....................1,818 TB
Date created....................04/23/2012
Stripe size.....................256K
Interface type..................Serial ATA
State...........................Failed
Additional details..............Impacted
Read-cache mode.................Enabled
Write-cache mode................Disabled (temporary write-through)
Write-cache setting.............Enabled (write-back)
Partitioned.....................Unknown
Protected by hot spare..........No
Bootable........................Yes
Bad stripes.....................No
Segment 0.......................Missing
Segment 1.......................Present: controller 1, connector 0, device 3, S/N WD-WMAW30733244

Serial attached SCSI
-----------------------
Type............................Disk drive
Vendor..........................WDC
Model...........................WD1003FBYX-01Y7B
Serial Number...................WD-WMAW30733244
Firmware level..................01.01V02
Reported channel................0
Reported SCSI device ID.........3
Interface type..................Serial ATA
Size............................931,513 GB
Negotiated transfer speed.......3.00 Gb/s
State...........................Optimal
S.M.A.R.T. error................No
Write-cache mode................Write through
Hardware errors.................0
Medium errors...................0
Parity errors...................0
Link failures...................0
Aborted commands................24
S.M.A.R.T. warnings.............0
NCQ status......................Enabled
Phy 0...........................3.00 Gb/s


End of the configuration information for controller 1
-------------------------------------------------------


UPD После перезагрузки диски снова видны и массив ребилдится

Код: Выделить всё

24 Апрель 2012 г. 12:05:04 GMT+03:00

Configuration summary
---------------------------

Server name.....................server.local
Adaptec Storage Manager agent...6.50.00 (18579)
Adaptec Storage Manager console.6.50.00 (18579)
Number of controllers...........1
Operating system................Windows

Configuration information for controller 1
-------------------------------------------------------
Type............................Controller
Model...........................Adaptec 3805
Controller number...............1
Physical slot...................7
Installed memory size...........128 MB
Serial number...................9C491141B47
Boot ROM........................5.2-0 (17342)
Firmware........................5.2-0 (17342)
Device driver...................5.2-0 (17342)
Controller status...............Optimal
Battery status..................Not installed
Background consistency check....Disabled
Copy back.......................Disabled
Controller temperature..........Normal (39C / 102F)
Default logical drive task priorityHigh
Number of logical devices.......1
Number of hot-spare drives......0
Number of ready drives..........0
NCQ status......................Enabled
Phy 0...........................No device attached
Phy 1...........................No device attached
Phy 2...........................No device attached
Phy 3...........................No device attached
Phy 4...........................3.00 Gb/s
Phy 5...........................3.00 Gb/s
Phy 6...........................3.00 Gb/s
Phy 7...........................3.00 Gb/s

Logical device..................0
Logical device name.............MUN0
RAID level......................10
Data space......................1,818 TB
Mirror space....................1,818 TB
Date created....................04/23/2012
Stripe size.....................256K
Interface type..................Serial ATA
State...........................Degraded
Additional details..............Impacted
Read-cache mode.................Enabled
Write-cache mode................Enabled (write-back)
Write-cache setting.............Enabled (write-back)
Partitioned.....................Yes
Protected by hot spare..........No
Bootable........................Yes
Bad stripes.....................No
Group 0, segment 0..............Present: controller 1, connector 0, device 0, S/N WD-WMAW30654070
Group 0, segment 1..............Inconsistent: controller 1, connector 0, device 1, S/N WD-WMAW30717547
Group 1, segment 0..............Present: controller 1, connector 0, device 3, S/N WD-WMAW30733244
Group 1, segment 1..............Rebuilding: controller 1, connector 0, device 2, S/N WD-WMAW30697013

Serial attached SCSI
-----------------------
Type............................Disk drive
Vendor..........................WDC
Model...........................WD1003FBYX-01Y7B
Serial Number...................WD-WMAW30654070
Firmware level..................01.01V02
Reported channel................0
Reported SCSI device ID.........0
Interface type..................Serial ATA
Size............................931,513 GB
Negotiated transfer speed.......3.00 Gb/s
State...........................Optimal
S.M.A.R.T. error................No
Write-cache mode................Write through
Hardware errors.................0
Medium errors...................0
Parity errors...................0
Link failures...................0
Aborted commands................8
S.M.A.R.T. warnings.............0
NCQ status......................Enabled
Phy 0...........................3.00 Gb/s

Type............................Disk drive
Vendor..........................WDC
Model...........................WD1003FBYX-01Y7B
Serial Number...................WD-WMAW30717547
Firmware level..................01.01V02
Reported channel................0
Reported SCSI device ID.........1
Interface type..................Serial ATA
Size............................931,513 GB
Negotiated transfer speed.......3.00 Gb/s
State...........................Optimal
S.M.A.R.T. error................No
Write-cache mode................Write through
Failed logical device segments..Yes
Hardware errors.................0
Medium errors...................0
Parity errors...................0
Link failures...................0
Aborted commands................0
S.M.A.R.T. warnings.............0
NCQ status......................Enabled
Phy 0...........................3.00 Gb/s

Type............................Disk drive
Vendor..........................WDC
Model...........................WD1003FBYX-01Y7B
Serial Number...................WD-WMAW30697013
Firmware level..................01.01V02
Reported channel................0
Reported SCSI device ID.........2
Interface type..................Serial ATA
Size............................931,513 GB
Negotiated transfer speed.......3.00 Gb/s
State...........................Rebuilding
S.M.A.R.T. error................No
Write-cache mode................Write through
Hardware errors.................0
Medium errors...................0
Parity errors...................0
Link failures...................0
Aborted commands................0
S.M.A.R.T. warnings.............0
NCQ status......................Enabled
Phy 0...........................3.00 Gb/s

Type............................Disk drive
Vendor..........................WDC
Model...........................WD1003FBYX-01Y7B
Serial Number...................WD-WMAW30733244
Firmware level..................01.01V02
Reported channel................0
Reported SCSI device ID.........3
Interface type..................Serial ATA
Size............................931,513 GB
Negotiated transfer speed.......3.00 Gb/s
State...........................Optimal
S.M.A.R.T. error................No
Write-cache mode................Write through
Hardware errors.................0
Medium errors...................0
Parity errors...................0
Link failures...................0
Aborted commands................24
S.M.A.R.T. warnings.............0
NCQ status......................Enabled
Phy 0...........................3.00 Gb/s


End of the configuration information for controller 1
-------------------------------------------------------



Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение gs » 24 апр 2012, 12:16

На двух винтах есть абортед коммандс. Винты валидированы для этого контроллера?

binni
Junior member
Сообщения: 3
Зарегистрирован: 24 апр 2012, 11:21
Откуда: Москва

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение binni » 24 апр 2012, 13:06

gs писал(а):На двух винтах есть абортед коммандс. Винты валидированы для этого контроллера?
В смысле входят ли в список поддерживаемых?
Именно их в списке нет (контроллер старенький, а в винты - более свежая модель).
Из WD Raid Edition в списке только эти

Код: Выделить всё

SATA Western Digital WD RE3 WD1002FBYS 03.00C06 1TB
SATA Western Digital WD RE3 WD2502ABYS 02.03B03 250GB
SATA Western Digital WD RE3 WD3202ABYS 02.03B03 320GB
SATA Western Digital WD RE3 WD5002ABYS 02.03B03 500GB
SATA Western Digital WD RE3 WD7502ABYS 03.00C06 750GB
SATA Western Digital WD RE4 WD2003FYYS 01.00D01, 01.01D01 2TB
SATA Western Digital WD RE4-GP WD2002FYPS 04.05G04, 04.01G01 2TB

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение gs » 24 апр 2012, 13:08

Это и может быть причиной проблемы.
Абортед коммандс - довольно обычный признак несовместимости.

binni
Junior member
Сообщения: 3
Зарегистрирован: 24 апр 2012, 11:21
Откуда: Москва

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение binni » 24 апр 2012, 13:16

Эх, мда :(
А может в винтах какими-нибудь параметрами можно поиграться (прошивками)?
Попробую еще в адаптек в саппорт чиркануть.

kuuk
Junior member
Сообщения: 12
Зарегистрирован: 12 дек 2008, 11:08
Откуда: Тольятти

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение kuuk » 31 май 2012, 09:00

binni писал(а):Эх, мда :(
А может в винтах какими-нибудь параметрами можно поиграться (прошивками)?
Попробую еще в адаптек в саппорт чиркануть.
Добрый день, вы решили проблему? У меня такая же ситуация, на тринити уже обращался
http://3nity.ru/viewtopic.php?f=6&t=16547
Вообщем нечего не смогли сделать, отправили по гарантии контроллер, в СЦ заменили, приехал. На днях сделал райд 6 из 6 дисков st32000641as (они есть в списках совместимости), сегодня прихожу один диск отвалился, рескан не помогает, отключил-подключил-рескан, толку нет. Подключил отвалившийся диск к свободному концу, нашелся пошел ребилд. На дисках есть aborted commands. Уже намучились и не знаю куда и копать...

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение gs » 31 май 2012, 10:21


kuuk
Junior member
Сообщения: 12
Зарегистрирован: 12 дек 2008, 11:08
Откуда: Тольятти

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение kuuk » 31 май 2012, 10:46

я понимаю, что это признак, но как же тогда листы совместимости? У нас жесткие даже по firmware совпадают с листами от adaptec...

Alenvik
Junior member
Сообщения: 1
Зарегистрирован: 29 авг 2013, 19:21
Откуда: Липецк

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение Alenvik » 29 авг 2013, 20:09

У меня та же проблема, и контроллер тот же Adaptec 3805 и диски те же wd1003fbyx RE4. Если очень, очень кратко:
-перепробовал разные прошивки, ситуация менялось хуже или лучше, но в целом - не помогло;
-менял корзины - не помогло;
-подключал диски напрямую - не помогло;
-менял контроллер - не помогло;
-переставлял контроллер в другой слот - не помогло;
-поменял материнскую плату - не помогло!
Сегодня позвонил в суппорт, объяснил ситуацию, на что мне сообщили, что проблема известная, проявляется в следующем случае: если одновременно используются SATA диски, контроллер Adaptec 3805 и при этом установлена Adaptec Storage Manager версии 6.50. Для решения проблемы необходимополностью удалить версию 6.50, после чего установить Adaptec Storage Manager версии 6.40 или Adaptec Storage Manager 7.31
У себя установил Adaptec Storage Manager версии 7.31 пока 1 день, полет нормальный, может ещё кому поможет!

IlyaS
Junior member
Сообщения: 6
Зарегистрирован: 12 фев 2008, 20:13
Откуда: Московская область, Королев

Re: Adaptec 3805 теряет wd1003fbyx RE4

Сообщение IlyaS » 06 сен 2013, 14:38

Alenvik писал(а): Сегодня позвонил в суппорт, объяснил ситуацию, на что мне сообщили, что проблема известная, проявляется в следующем случае: если одновременно используются SATA диски, контроллер Adaptec 3805 и при этом установлена Adaptec Storage Manager версии 6.50. Для решения проблемы необходимополностью удалить версию 6.50, после чего установить Adaptec Storage Manager версии 6.40 или Adaptec Storage Manager 7.31
У себя установил Adaptec Storage Manager версии 7.31 пока 1 день, полет нормальный, может ещё кому поможет!
Большое вам спасибо за наводку на 7.31! Тоже задрали на 3805 aborted commands на этом дисковом "motley crew":
HUA722010CLA330 (с января 2011)
numParityErrors="0" linkFailures="0" hwErrors="0" abortedCmds="60506" mediumErrors="0" smartWarning="0"
ST31000528AS CC49 (с октября 2010, в январе 2011 ремонт щелкающих головок)
numParityErrors="0" linkFailures="135" hwErrors="0" abortedCmds="32345" mediumErrors="20" smartWarning="0"
ST3500514NS SN11 (с декабря 2010/февраля 2011 без нареканий), знаю есть SN12, есть ли смысл обновлять?
numParityErrors="0" linkFailures="0" hwErrors="0" abortedCmds="7673" mediumErrors="0" smartWarning="0"
numParityErrors="0" linkFailures="38" hwErrors="0" abortedCmds="6881" mediumErrors="2" smartWarning="0"
ST3500320NS SN06 (с марта 2009 без нареканий, всех пережил!)
numParityErrors="0" linkFailures="3" hwErrors="0" abortedCmds="65535" mediumErrors="0" smartWarning="0"
В связи с установкой ASM 7.31 имеет ли смысл делать сброс статистики "arcconf RESETSTATISTICSCOUNTERS"?

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 60 гостей