Event 29,30,35,50 - кто виноват?

jvl · Сообщение **jvl** » 05 сен 2003, 19:16

Добрый день, уважаемые!
Случился сбой на такой системе:
В корпусе с корзиной SuperMicro SC742S-500 стоит мать
SuperMicro P4DL6, raid-контроллер Adaptec 2000s,
6 hdd IBM IC35L018ucd210-0 (2 - зеркало под систему и
4 - raid5 - данные)
ПО: w2k as sp3, ms sql 2k ee sp3.
Недавно в 06:25 в логе по поводу raid5 появляются записи:
Event 29: dmio: Harddisk1 read error at block 151: status 0xc00000a3
Event 35: dmio: Disk Harddisk1 block 151 (mountpoint D:): Uncorrectable read error
Event 29: dmio: Harddisk1 read error at block 151: status 0xc00000a3
...
Event 35: dmio: Disk Harddisk1 block 151 (mountpoint D:): Uncorrectable read error
Event 30: dmio: Harddisk1 write error at block 107524177: status 0xc00000a3
Event 1500: ldm: Disk group S244Dg1: Reimport of disk group failed:
Disk group has no valid configuration copies
Event 50: dmio: {Lost Delayed-Write Data} The system was attempting to transfer file
data from buffers to . The write operation failed, and only some of the data may have been written to the file. - дважды
Event 26: Application popup: Windows - Delayed Write Failed :
Windows was unable to save all the data for the file
\Device\HarddiskDmVolumes\PhysicalDmVolumes\BlockVolume1\$Mft.
The data has been lost. This error may be caused by a failure of your computer hardware
or network connection. Please try to save this file elsewhere.
Одна из баз данных переходит в suspect
Далее через час дважды повторяется event 50 и 26 - в результате еще 3 базы
переходят в состояние suspect.
Нам видимо повезло - после 2-х перезагрузок sql 3 базы починились и резервный
сервер задействовать не пришлось.
Через три дня в 06:30 с интервалом в неск. минут получили 3 сообщения:
event 9: dpti2o: The device, \Device\Scsi\dpti2o1, did not respond within the timeout period.
На этот раз базы повреждены не были.

Мне кажется, что в повреждении данных виноват вряд ли виноват диск - ведь массив должен был сохранить работоспособность - или я не прав?
Как мне относительно безопасно протестировать диски - я слышал, что DFT от IBM не работает через raid-контроллер?
Если надо менять контроллер - что выбрать?

С уважением, Вадим.

Сообщение **CyberDrake** » 09 сен 2003, 00:00

установлен ли Adaptec Storage Manager? что он пишет?
если не установлен, то скачайте его отсюда

Event 29,30,35,50 - кто виноват?

Event 29,30,35,50 - кто виноват?

Кто сейчас на конференции