Итак, имеется домашний серверок на базе Intel S3200SHV, ОС - 2008 Std x64.
Конфигурация дисковой: Adaptec 3405 без BBU (прошивка последняя), корзина Intel AXX6DRV3GEXP - экспандерная (прошивка не последняя - 2.02, корзина не подключена спец. кабелем к материнке), винты: 2*SAS + 4*SATA 500Gb RAID5, все в NTFS.
В процессе работы возникают следующие проблемы:
1. Например выполняется верификация массива и одновременно идет чтение с него же, или же выполняется ребилд массива, а обращение идет к винтам, которые не принадлежат массиву (т.е. к SAS) - контроллер может "потерять" винты, причем бессистемно, как все (всю корзину), так и часть (видно в ASM, окно которого специально не закрываю в процессе). Рескан "возвращает" диски, однако если сие произошло в процессе ребилда - контроллер может счесть один из винтов строящегося массива "failed" и т.п. В чем может быть причина и как избежать? (Нареканий на конкретный винт нет - это может быть любой из имеющихся, на любом канале корзины)
2. В процессе обычной работы (нагрузки на дисковую не было), без к.-л. сообщений (в логах ничего путного) внезапно возник "bad stripe", сервак ушел в ребут и автоматом стартанул чекдиск (на данный момент отключил в реестре). К несчастью, я не успел к старту сервера и прервал уже запущенный чекдиск (жесткой перезагрузкой), предполагая, что чекдиск вполне может разрушить здоровый раздел (случаи бывали). После перезагрузки, контроллер запустил ребилд. На одном из винтов в ASM была пометка о "bad stripes" и такая же пометка была в свойствах массива. После ребилда, пометка осталась только в свойствах массива и часть данных на диске была недоступна (или же папки не открывались или же некоторые файлы внутри папок были недоступны). При попытке скопировать инфу (не сразу, в процессе копирования) из "проблемных" папок получил BSOD и сервак снова ушел в ребут, после ребута при загрузке, контроллер и вовсе потерял все диски (сообщение об отсутствии массивов и невозможности загрузить BIOS), однако после повторной перезагрузки (полное выключение - старт) контроллер все-таки пришел в себя. Часть данных так и осталась недоступной. Проверки утилитами типа чекдиска не производились (пока что). Ошибок смарта и предупреждений по всем дискам - нет, по крайней мере так показывает ASM (а можно ли чем-то увидеть более подробную инфу по смарту?)
В нолидж-бэйзе адаптека прочитал о методах "лечения" в случае возникновения"bad stripes" - все сводится к пересозданию массива (кстати тут вопрос, если я верно понял, то нужно удалить массив, создать заново с теми же параметрами и контроллер "подхватит" старый массив?).
Как избежать появления таких логических (как я понял) "бэдов"? Каков правильный порядок действий в такой ситуации?
3. В процессе экспанда массива (просто пробовал) гарантированно отваливается один из дисков (как правило свежедобавленный) на определенном этапе билда, потом, правда, ребилд заканчивается ("выпавший" диск находится в состоянии "failed") и потом автоматом производится новый ребилд с новым диском. Отчего это может происходить? Контроллер в процесс вообще не нагружаю никакими другими задачами.
P.S. возможно такие вопросы уже обсуждались, однако ни поиском, ни путем прочтения нескольких страниц форума (его можно просто как мануал читать, спасибо
