Пропал доступ к папкам на ISCSI Raid

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
leowest
Junior member
Сообщения: 11
Зарегистрирован: 08 дек 2012, 12:41
Откуда: 1234

Пропал доступ к папкам на ISCSI Raid

Сообщение leowest » 08 дек 2012, 13:05

Привет знатокам!
Есть видео-сервер (Airbox) на Win Xp SP2, к нему по ISCSI подключен janus SA6643S (Disk Array System), на котором размещен медиаконтент.Второй сетевой интерфейс сервера подключен к локалке (монтажки и т.д.).janus SA6643S сконфигурирован на Raid 5, который состоит из 3Х Western Digital 7200 2Tb 64Mb cash.
Итак проблема - пропадает доступ к папкам на рейд массиве, переназначение доступа через свойства конкретной папки не помагают.Что посоветуете? SMART сейчас посмотреть немогу,он будет попозже.

LCF_R
Advanced member
Сообщения: 702
Зарегистрирован: 27 сен 2011, 18:12
Откуда: Москва

Re: Пропал доступ к папкам на ISCSI Raid

Сообщение LCF_R » 10 дек 2012, 11:36

А подключение организовано напрямую? Или через коммутатор? Что происходит непосредственно с SA6643S во время потери коннекции? Прошивка последняя?
С уважением, Александр.

leowest
Junior member
Сообщения: 11
Зарегистрирован: 08 дек 2012, 12:41
Откуда: 1234

Re: Пропал доступ к папкам на ISCSI Raid

Сообщение leowest » 11 дек 2012, 11:19

Доступ пропал не к целому массиву, а к отдельным папкам.Подключение к серверу напрямую по одному каналу без транкинга и LACP.
У меня есть подозрение на прошивку SA6643s и на винчестера 6 Gb/s (их думаю переключить в режим 3Gb/s). По-поводу обновления прошивки: если я ее обновлю, то моя старая конфигурация настроек сохранится (сетевые настройки конфиг рейда) или нет?

Вот нашел полезную инфу, может еще кому поможет ибо мне глаза открыла:
1
Могу ли я использовать новые SATA диски с интерфейсом SATA Revision 3.0 (часто называемым SATA 6 Gb или SATA III) в системах хранения данных, изначально рассчитанных на диски SAS/SATA II (3 Gb)?
На этот вопрос нет однозначного ответа, к сожалению. Частично ответ дан ответе на вопрос по 3 TB дискам. Тем не менее, мы предлагаем как подробное описание проблемы, так и варианты ее решения. Суть проблемы: После установки SATA жестких дисков с интерфейсом SATA 6 Gb в системы хранения, поддерживающие как SAS, так и SATA диски (у Maxtronic это системы SS-xxxx) работа системы хранения становится крайне нестабильной. Самопроизвольно диск (диски) могут "выпасть" из RAID, самопроизвольно может пропадать доступ к web интерфейсу управления системой хранения и т.п. Очевидно, что нормальное функционирование системы хранения невозможно из-за подобных проблем. Также обращаем Ваше внимание, что проблема полностью отсутствует в системах хранения, появившихся на рынке в 2011 году и позднее и изначально поддерживающих SATA 6 Gb.

Суть проблемы в применении большинством производителей SAS/SATA систем хранения SAS chipset LSI 1068, который не может корректно работать с SATA 6 Gb дисками. Именно с SATA, с любыми SAS, в том числе 6 Gb проблем нет. К сожалению, заменить эти микросхемы в десятках тысяч RAID контроллеров невозможно чисто технически, не говоря уже о том, что LSI ответственности за несовместимость не несет. В 2006 году, когда LSI 1068 был разработан, никто о SATA 6 Gb не знал. Поэтому мы предлагаем такие варианты решения проблемы:

Применять платы-мультиплексоры AA-MUX 6 Gb даже в одноконтроллерных системах. Самый существенный недостаток этого варианта в высокой стоимости AA-MUX 6 Gb. В расчете на один диск применение AA-MUX 6 Gb приводит к удорожанию в размере $70. По иронии судьбы столь высокая стоимость объясняется не аппетитами производителей систем хранения, а все той же LSI, которая продает основную микросхему для AA-MUX 6 Gb весьма недешево, а замены ей на рынке нет. Тем не менее, установка AA-MUX 6 Gb является универсальным вариантом, решающим проблему с любым SATA 6 Gb жестким диском любого производителя.

Если вы хотите использовать жесткие диски Hitachi (несмотря на покупку подразделения жестких дисков Hitachi компанией WD, продукция бывшей Hitachi еще долго будет носить это имя), то следует скачать программу Feature Tool версии 2.16 или выше. Затем, создав CD диск и загрузившись с него, переключить скорость интерфейса жесткого диска с 6 Gb на 3 Gb, запретив одновременно параметр Spread Spectrum Modulated. Такую операцию надо проделать для каждого Hitachi диска, планируемого к использованию в системе хранения. Но - новые (выпущенные после мая 2012 года) HDD Hitachi, емкостью 3 TB и выше уже не поддерживают этот способ изменения скорости интерфейса, будьте внимательны! Поэтому следует применять диски Hitachi SAS на 7200 оборотов.

Если вы хотите использовать жесткие диски WD, то на них достаточно установить джампер в положение 3 Gb в соответствии с инструкцией на сайте производителя (раздел PNY enabled). Кроме этого, можно использовать SAS 6 Gb диски от WD без установки каких-либо джамперов. Последнее решение настоятельно рекомендуется в случае применения двухконтроллерных систем, поскольку в этом случае нет необходимости применять любые AA-MUX в принципе.

Если вы хотите использовать жесткие диски Seagate, то наилучшим во всех отношениях вариантом будет применение SAS жестких дисков на 7200 оборотов серии Constellation® ES (аналог серии WD RAID Edition) от Seagate. По сути это те же SATA диски, но с SAS внешним интерфейсом. Стоимость таких дисков отличается от аналогичных SATA дисков с такой же емкостью на единицы процентов.Такое решение, кстати, в принципе оптимальнее любого другого, из описанных выше, для использования в редантных (двухконтроллерных) системах.
2

В последнее время IDE и в большей степени SATA жесткие диски все чаще и чаще используются для построение отказоустойчивых дисковых подсистем на базе RAID контроллеров и/или внешних дисковых массивов. Большая емкость на один диск, низкая стоимость и вполне приличная надежность делает эти диски в ближайшей перспективе серьезными конкурентами для SCSI в серверных системах, а во внешних дисковых системах для работы с оцифрованным кино и видео SCSI диски уже практически не применяются. Но при использовании обычных IDE/SATA жестких дисков в RAID массивах может возникнуть одна довольно неприятная проблема, о решении которой мы и расскажем в этой заметке.
Суть проблемы

Чаще всего в RAID-массивы устанавливают стандартные жесткие диски, изначально предназначенные для обычных desktop компьютеров, по той простой причине, что иных SATA/IDE дисков просто нет. Они обладают большой емкостью, высокой надежностью и сравнительно низкой стоимостью. Казалось бы, чего же боле? Однако, здесь и существует проблема! Дело в том, что во все современные IDE/SATA жесткие диски для повышения надежности хранения данных встроена автоматическая функция коррекции ошибок. При ее разработке исходили из здравого посыла, что жесткий диск не должен отправлять куда-либо сообщение о каждой обнаруженной ошибке чтения, загружая тем самым другие устройства (в том числе процессор компьютера) ненужной дополнительной работой. Напротив, он должен предпринять все возможное для самостоятельной коррекции обнаруженной ошибки, для начала многократно пытаясь прочитать сбойный блок, а потом исключив его из использования, сделав переназначение (remap) плохого сектора на хороший. Погрузившись в данную "внутреннюю" операцию, диск начинает отвечать на внешние запросы с большой задержкой, тем большей, чем интенсивней поступают на него команды записи/чтения.

И это правильно до тех пор, пока этот диск функционирует сам по себе, являясь самостоятельным, не входящим ни в какие RAID массивы, устройством хранения данных. Однако, когда он является частью сложной системы из многих дисков в RAID массиве, некоторые диски в которых выделены для хранения резервных данных на случай любой ошибки, т.е. системы, управляемой специализированным интеллектуальным RAID контроллером, подобная "самостоятельность" установленного в систему диска может приводить к проблемам. Одной из важнейших задач контроллера RAID является постоянный анализ распределяемых между дисками данных на предмет возможного появления и немедленной коррекции ошибок. Поэтому RAID контроллер, отвечая за работоспособность всей системы, ожидает ответа от каждого диска строго определенное время (обычно 8 секунд), по истечении которого считает, что вовремя не ответивший диск неисправен, и принимает решение об его исключении из системы с последующим перераспределением данных между оставшимися дисками. При этом нагрузка на них возрастает, и в этих условиях и второй диск может вовремя не ответить, что уже приведет к крушению всей системы с потерей данных (напомним, что в наиболее популярных RAID уровнях 3 и 5 резервные данные хранятся только на одном диске и выход сразу двух фатален - все данные теряются). Но в результате последующего анализа может оказаться, что отключенные диски были вполне работоспособны и могли далее использоваться, но уже будет слишком поздно.

Здесь не поможет и наличие диска в "горячем" резерве - пока RAID контроллер будет вводить его в массив (этот процесс может занять часы и дни, в зависимости от нагрузки на RAID), вполне может "отвалиться" следующий диск в массиве и данные также будут безвозвратно потеряны. Эта ситуация иллюстрируется на рисунке ниже.



Безусловно, такая проблема возникает только при интенсивной работе дисков в RAID массиве на запись/чтение данных. Но, достаточно совпадения буквально минутной "тяжелой" нагрузки на RAID массив и начала автоматической процедуры восстановления ошибки на каком-то жестком диске, как ложный выход из строя жесткого диска станет вполне реальным. Трудность решения этой проблемы в том, что диск и на самом деле, реально, может выйти из строя, поэтому удлинение допустимого времени отклика от жесткого диска, что иногда, к сожалению, делают некоторые производители RAID контроллеров не решает проблему, а наоборот, загоняет ее вглубь. Ведь в том случае, если диск на самом деле сломался, промедление в реакции RAID контроллера на это событие чревато полной потерей данных.

Наличие данной проблемы (задержка отклика из-за встроенной функции коррекции ошибок) не зависит от того, диски какого производителя вы планируете использовать. Ее возможное решение в другом – ввести ограничение на максимально допустимую длительность обработки ошибок жестким диском с обязательным информированием RAID контроллера о наличии конкретной ошибки. В этом случае RAID контроллер поймет, что диск исправен, но у него есть конкретная ошибка в конкретном месте, которую контроллер легко скорректирует.

К сожалению, единственной компанией, которая предложила такое понятное и очевидное любому грамотному специалисту решение, стала Western Digital Corporation. Она разработала специальную серию дисков RAID Edition c функцией TLER(TimeLimitedErrorCorrection - Ограниченное время на коррекцию ошибки). TLER-диски при возникновении ошибки начинают нормальный процесс ее коррекции, но, не уложившись в 7 секунд, сообщают RAID-контроллеру о возникшей ошибке, откладывая дальнейшую обработку ошибки на "лучшее" время (например, на момент простоя системы). При этом контроллер легко справится с возникшей ошибкой чтения данных с данного диска – ведь для этого в его распоряжении всегда есть резервная информация. Такой алгоритм иллюстрируется на рисунке ниже.



Отметим, что RAID Edition диски от Western Digital кроме функции TLER отличает и увеличенное вдвое время наработки на отказ. Несмотря на то, что случаев возникновения этой ошибки довольно мало в массивах с SATA дисками, но довольно много случаев в массивах с IDE дисками, мы настоятельно рекомендуем применение дисков с TLER в любых RAID массивах, особенно рассчитанных на работу под серьезной нагрузкой или имеющих хотя бы пики с с ней. Надеемся, что и другие компании-производители жестких дисков начнут выпуск аналогичных дисков.

SMBV
Junior member
Сообщения: 11
Зарегистрирован: 07 июл 2006, 11:08
Контактная информация:

Re: Пропал доступ к папкам на ISCSI Raid

Сообщение SMBV » 11 дек 2012, 12:51

leowest
Эта простыня не могла открыть Вам глаза по той простой причине, что ваша система хранения SAS диски не поддерживает. У Вас вообще, судя по всему, проблема не со стораджем, он не может с одними папками работать нормально, а с другими нет.

leowest
Junior member
Сообщения: 11
Зарегистрирован: 08 дек 2012, 12:41
Откуда: 1234

Re: Пропал доступ к папкам на ISCSI Raid

Сообщение leowest » 11 дек 2012, 13:37

SMBV писал(а):leowest
Эта простыня не могла открыть Вам глаза по той простой причине, что ваша система хранения SAS диски не поддерживает. У Вас вообще, судя по всему, проблема не со стораджем, он не может с одними папками работать нормально, а с другими нет.
А я и не говорю что моя проблема решена.Завтра у нас профилактика, попробую сделать выше изложенное, понаблюдаю, может что и поможет.Но вопрос пока открыт - если сделать апдейт прошивки,то текущая конфигурация останется или нет?

SMBV
Junior member
Сообщения: 11
Зарегистрирован: 07 июл 2006, 11:08
Контактная информация:

Re: Пропал доступ к папкам на ISCSI Raid

Сообщение SMBV » 11 дек 2012, 13:52

Вам же ответили почтой, что новая прошивка все сохранит, но на 99% проблемы не решит. И, повторяю еще раз - либо ищите проблему вне стораджа, либо выложите/пришлите лог стораджа, наконец-то.
Кстати, а что Вы конкретно собираетесь из "вышеизложенного" делать? К вашему случаю ничего из "вышеизложенного" отношения не имеет.

leowest
Junior member
Сообщения: 11
Зарегистрирован: 08 дек 2012, 12:41
Откуда: 1234

Re: Пропал доступ к папкам на ISCSI Raid

Сообщение leowest » 11 дек 2012, 14:41

SMBV писал(а):Вам же ответили почтой, что новая прошивка все сохранит, но на 99% проблемы не решит. И, повторяю еще раз - либо ищите проблему вне стораджа, либо выложите/пришлите лог стораджа, наконец-то.
Кстати, а что Вы конкретно собираетесь из "вышеизложенного" делать? К вашему случаю ничего из "вышеизложенного" отношения не имеет.
Огромное спасибо, что помогаете!Думал переключить винты на sata II и перепрошить ящик.Завтра сделаю и пришлю логи.

leowest
Junior member
Сообщения: 11
Зарегистрирован: 08 дек 2012, 12:41
Откуда: 1234

Re: Пропал доступ к папкам на ISCSI Raid

Сообщение leowest » 12 дек 2012, 18:07

Добрый день! Сегодня перепрошил Sa6643s прошивкой 2.3.4.Вот логи высылаю.Там у нас недавно электричество отрубали , упс к которому подсоеденон сторадж разрядился полностью. Потом на одном резервном блоке питания (от сети без упса) не захотел работать.Включили упс и он с двумя БП заработал. Также мы дав раза конфигурировали рейд.Сначала у нас было 2 HDD - Raid1 потом 3- Raid5.Причем с рейд1 были те же проблемы что и сейчас (пропадеть доступ к папке на 100 гиг, она место занимаэт ,а ни прочесть ни удалить нельзя).В логах Windows. на котором построен видео-сервер, просто пишет что пропал доступ к папке (unreadable) выполнить CHKdisk.
Вложения
log-SA-6643S-A20505-20121212-144749.txt
(141.02 КБ) 655 скачиваний

Аватара пользователя
Fader
Data Recovery Expert
Сообщения: 115
Зарегистрирован: 21 мар 2005, 02:13
Откуда: Москва
Контактная информация:

Re: Пропал доступ к папкам на ISCSI Raid

Сообщение Fader » 12 дек 2012, 20:12

Кмк, проблема у вас с винтами. Что-то где-то начало сыпаться. Т.е появились дефекты.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 20 гостей