Рассказываю ситуацию:
Есть довольно большой парк серверов Supermicro(TRINITY), контроллеры везде стоят LSI 9261-8i. Наконфигурены по 2 массива RAID50 (по 12 дисков в каждом), еще и сверху объединены в md raid0. Такой вот, значит, RAID500 получается (зачем - отдельная история).
Диски - HITACHI HDS723020BLA642. По большей части живут себе и не грустят, разве что иногда какой-нибудь отвалится и в ход вступает пресловутая MegaCli...
Но вот смущает одно обстоятельство: частенько в логах появляются такие гадости:
Код: Выделить всё
Time: Sun Aug 26 09:13:15 2012
Code: 0x00000071
Class: 0
Locale: 0x02
Event Description: Unexpected sense: PD 1d(e0x21/s20) Path 50030480012ede60, CDB: 28 00 df 1c 54 00 00 02 80 00, Sense: 6/29/00
Event Data:
===========
Device ID: 29
Enclosure Index: 33
Slot Number: 20
CDB Length: 10
CDB Data:
0028 0000 00df 001c 0054 0000 0000 0002 0080 0000 0000 0000 0000 0000 0000 0000 Sense Length: 18
Sense Data:
0070 0000 0006 0000 0000 0000 0000 000a 0000 0000 0000 0000 0029 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
seqNum: 0x00008970
Time: Sun Aug 26 09:13:15 2012
Code: 0x00000072
Class: 0
Locale: 0x02
Event Description: State change on PD 1d(e0x21/s20) from ONLINE(18) to FAILED(11)
Event Data:
===========
Device ID: 29
Enclosure Index: 33
Slot Number: 20
Previous state: 24
New state: 17
Судя по списку Sense-кодов, 6/29/00 - это power on reset. Так вот, какого, собственно, черта диски дергаются с шины и встают обратно? Причем происходит это явно чаще, чем должно даже на таком парке машин.