Влияет ли ежедневное вкл/выкл на стабильность работы Raidtec

Конфигурирование, планирование RAID систем, возможности, технологии, теория. Qlogic, LSI Logic, Adaptec ...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
MADivan
Junior member
Сообщения: 7
Зарегистрирован: 02 фев 2007, 11:55
Откуда: Ukraine

Влияет ли ежедневное вкл/выкл на стабильность работы Raidtec

Сообщение MADivan » 02 фев 2007, 13:36

Дисковый массив Raidtec FibreArray 2Tb подключен к Pentium4/3.2Ghz/1Gb/W2003Server. На базе массива организован видеосервер для хранения некомпрессированного видео DV-AVI.  По гигабитному линку видео отсматривается, монтируется и пересохраняется на массив с 7 компьютеров. Системник и сам Raidtec питаются через APC Smart-UPS 2200. Четыре года массив работал круглосуточно, с 1 января текущего года массив работает с 8-00 до 20-00. Две первые праздничные недели года никто особых отличий в работе не заметил, но с середины января клиенты стали жаловаться на нестабильную работу массива: видео "бежит" при просмотре, конформинг и просчет видео на массив "виснет".

Проблемы у клиентов были и раньше вследствие параллельного обращения к видео с нескольких компьютеров, но случались проблемы намного реже. Если монтируемое видео попадало на "битый" кластер, массив приходилось перегружать. Происходило это 1-2 раза в неделю, сейчас перезагрузка осуществляется по несколько раз в день.

Температура в шкафу с массивом в 8 утра ~20'C, часам к 11 утра температура возрастает до ~23-24'C и держиться на таком уровне до вечера.

Массив заполнен на 65%, не особо фрагментирован.

Стоит ли выключать массив на ночь или всё же вернуться к круглосуточному режиму работы? Может ли повлиять ежедневное вкл/выкл массива на стабильность работы?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 02 фев 2007, 13:39

Стоит ли выключать массив на ночь
Нет
Если каждый день его включать-выключать, срок его жизни очень быстро подойдет к концу.

MADivan
Junior member
Сообщения: 7
Зарегистрирован: 02 фев 2007, 11:55
Откуда: Ukraine

Сообщение MADivan » 02 фев 2007, 13:42

exLH писал(а):Стоит ли выключать массив на ночь
Нет
Если каждый день его включать-выключать, срок его жизни очень быстро подойдет к концу.
Спасибо!

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 фев 2007, 13:42

Постоянный вкл-выкл может проявить все существующие и не замеченные вовремя проблемы. И вообще - это ненормальный режим работы для оборудования такого класса.

Еще настораживает фраза про битые кластеры - в массиве такого быть просто не должно. И буде такие появляются, они должны оперативно лечиться.

Проведите для начала полную проверку массива (consystensy check, verify - как оно там зовется) - дальше будет видно.

MADivan
Junior member
Сообщения: 7
Зарегистрирован: 02 фев 2007, 11:55
Откуда: Ukraine

Сообщение MADivan » 02 фев 2007, 14:02

gs писал(а):Постоянный вкл-выкл может проявить все существующие и не замеченные вовремя проблемы. И вообще - это ненормальный режим работы для оборудования такого класса.
Не знаю как аргументировать начальнику отказ от ежедневного выключения. Он утверждает, что 12 часов из 24 винты зря работают, пластины царапаются и т.д и т.п.
gs писал(а):Еще настораживает фраза про битые кластеры - в массиве такого быть просто не должно. И буде такие появляются, они должны оперативно лечиться.
Запускаю chkdsk в W2003, выдаёт: 256Kb in bad sectors. Какие утилиты использовать для лечения и где их скачать?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 фев 2007, 14:10

Сложно возразить на подобную чушь.
Дисковые системы изначально проектируются в расчете на круглосуточную работу. А перезапуск есть жестокий удар как по механике, так и по электронике... В общем бред это.

Проверка массива делается из его консоли управления. Я не знаю как она называется у рэйдтека.

MADivan
Junior member
Сообщения: 7
Зарегистрирован: 02 фев 2007, 11:55
Откуда: Ukraine

Сообщение MADivan » 02 фев 2007, 14:15

gs писал(а):Сложно возразить на подобную чушь.
Дисковые системы изначально проектируются в расчете на круглосуточную работу. А перезапуск есть жестокий удар как по механике, так и по электронике... В общем бред это.

Проверка массива делается из его консоли управления. Я не знаю как она называется у рэйдтека.
Это то, что я хотел услышать. Спасибо!

MADivan
Junior member
Сообщения: 7
Зарегистрирован: 02 фев 2007, 11:55
Откуда: Ukraine

Сообщение MADivan » 02 фев 2007, 16:00

Спасибо за ответ и внимание к нашей проблеме, если таковую можно так назвать.

Это пишет начальник автора топика.

Собственно что имеется ввиду, ещё раз, и что вы можете объяснить более конкретизировано. Речь идёт о том, что четыре(!) года дисковый массив работает круглосуточно, не выключаясь. Явно с 20.00 до утра (даже не до 8.00, а до 10.00) никакой работы у него не было. На массиве кроме стандартных DV-шных avi-шек ничего нет, и это просто хранилище видеофайлов, никакого (абсолютно!!!) софта типа Sanbolic и пр. на нём отродясь не стояло и стоять не будет, в силу полнейшей некомпетентности видеомонтажёров-пользователей, набираемый с улицы.

Напрашивается вопрос, - какого хера четыре года ночей (по 12 часов ежесуточно!!!) работала система? Т.е. КАКОГО ХРЕНА СИСТЕМА ВПУСТУЮ "ЦАРАПАЛА" ВИНЧЕСТЕРЫ 2 ГОДА ИЗ 4-ЁХ?

Если вы ответите более копетентно чем просто отписка "так положено", или "так заведено у буржуев", то я готов буду понять это.

Пока же, кроме аргумента о том что в момент включения могосложного устройства возможны выходы из строя отдельных его элементов по причие БРОСКА ТОКА, а не чего-то другого, что исключает тогда вообще перезагрузку системы, я не вижу. Хотябы один аргумент, плиз, что такое имеется в системе зависимое от перезагрузок, включений-выключений отчего ПАДАЕТ ПРОИЗВОДИТЕЛЬНОСТЬ массива, о чём собственно мой сисадмин забыл вам сказать, ТАК КАК ОПАСЕНИЯ ЕГО В РЕАЛЬНОСТИ БЫЛИ НЕ ЗА СУДЬБУ МАССИВА, А КАК ЕМУ КАЗАЛОСЬ, - "МОНТАЖЁРЫ СТАЛИ БОЛЬШЕ ЖАЛОВАТЬСЯ ЧТО СИСТЕМА СТАЛА МЕДЛЕННЕЕ РАБОТАТЬ".

Надеюсь что вы поняли о чём речь. Спасибо.

Эдуард.
Последний раз редактировалось MADivan 02 фев 2007, 16:09, всего редактировалось 1 раз.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 фев 2007, 16:08

Никакого влияния на производительность перезагрузки не оказывают. Зато они оказывают влияние на появление разного рода сбоев логического характера и те самые пресловутые броски тока (к которым надо относиться весьма серьезно - диски-то не ноутбучные). Вы можете не верить - дело Ваше. Но у нас в производственной карте по поводу выходного контроля специально присутствует пункт "N раз холодные и горячие рестарты" - неужели Вы думаете, что мы от большой радости пошли на существенное увеличение нагрузки на наших производственников? Это опыт, сын ошибок. Очень болезненный опыт, надо сказать - особенно учитывая, что у нас не один массив - у нас около сотни в год, плюс две тысячи серверов.

Тезис про царапанье головок - извините конечно, но это просто полный бред. Любой профессиональный аппарат, тем более дисковый массив, РАСЧИТАН производителем на круглосуточную работу. Тут обсуждать просто нечего.

MADivan
Junior member
Сообщения: 7
Зарегистрирован: 02 фев 2007, 11:55
Откуда: Ukraine

Сообщение MADivan » 02 фев 2007, 17:54

Тезис был не о "царапаньи головок" (хотя, возможно стоит задуматься и об этом, деталь-то движущаяся) а о "царапаньи дисков", которое вам хорошо должно быть известно, разбери вы их в своё время хоть один. И тезис этот, если вы заметили, был взят в кавычки, что подразумевает большее чем прямая речь. Присовокупьте к нему ещё например смазку двигателей, износ подшипников и пр. весёлости, которые более чем реальны, и далеко не нужно ходить с примером, а достаточно сказать например, что было у нас ещё месяц назад, - из шести вентиляторов охлаждения, два вышли из строя, их нам чуть ли не из Ирландии грозились привезти, но оказалось что никто в Украине а это взяться е может, уж больно космические наверное. И все сисадмины ходят спокойно, даже не кидая взгляда на панель собщений, котоая уже переполнилась от алертов.

И пришлось неспециалисту-технарю останавливать всё и всех, разбирать массив, вентиляторы, смазывать их реанимировать, и миллионный раз рассказывать персоналу что 2+2=4. Но это очень сложно, особенно если персонал верит вашим уже тезисам про "логический сбой".
Вы вот про него сказали, а мне переводить пиходится, что это означает сбой во время инициализации, который практически 100% будет отображён собщением или посто еработой усройства.

Но персонал понял этот "логический сбой" при включении как накапливающуюся с момента включения нестабильность, от которой "падает скрость работы" и монтажёры (не самом деле завесив свою операционку на монтажной станции винампами, сложныи проектаи и пр. лабудой) убеждают его что "сетка висит" (свичи навеное имеется ввиду) :))))

Итожим. Вы ничего не прояснили мне (и себе навеное тоже), кроме того что "логический сбой", коорый я вам сам и заявлял как единственный аргуент, потому что следующее за ним это - выход из строя устройства, а этот сбой, ЕСЛИ ОН НЕ ПРОИСХОДИТ ЗА ВСЁ ЭТО ВРЕМЯ, ну не случается такая вероятность пока, хоть она и абсолютно реальна в таких устройствах, как в любой сложной аппаратуе, ЭТОТ ВЕРОЯТНОСТНЫЙ СБОЙ, ЗНАЧИТЕЛЬНО МЕНЬШЕ ВРЕДИТ РЕСУРСУ УСТРОСТВА, НЕЖЕЛИ ЕЖЕСУТОЧНАЯ РАБОТА ЕГО (впустую) В ТЕЧЕНИИ 12 ЧАСОВ.

Ничего не могу ещё присовокупить в расходованию моторесурса усройства в процессе включения, разве что тепловое расирение его, о и оно плавное, с омента включения, в помещении где выдержаны условия по влажости и температуре.

Не убедили вы меня, что ежедневное включение (только оно а не и выключение!) массива для него вреднее чем 12 часов ежедневной работы вхолостую. Про то же, что такого рода оборудоваие производитель конструирует с рассчётом на круглосуточный режим работы, как вы поимаете, я знаю. Только я ещё знаю, что рассчёт на круглосуточный режим не означает необходимую обязательность этой круглосуточности. Ещё я знаю, что опыт действительно, сын ошибок трудных, и многое в работе можно найти такое, что производители-сборщики-продавцы в упор не хотели и замечать, и уж тем более не заитересованны в этом, т.к. заинтересованы в получении прибыли от продажи покупателям железа и обслуживания его. А для нас, небольшого городского телеканала, такие ресурсы очень дорогостоящи.

(только прошу, не нужо про "скупой платит дважды", это понятно, выйдет из сроя вещь от частых включений, сами посыплем голову пеплом в отчаянии, и так вещь поработала 4 года, уже и комплектующих не неё нет в природе)

Спасибо. Удачи!

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 фев 2007, 17:59

Слишком много букв, эмоций и самоуверенности.
Не верите - Ваши проблемы. Мне вообще-то это по барабану, если честно.

З.Ы. Подавляющее большинство продаваемых нами аппаратов не выключаются НИКОГДА, за исключением случаев техобслуживания и т.п. И не ломаются. Зато большая часть ситуаций по поводу развала массива начинается так - "перезагрузили и часть дисков offline...".

Grachik
Junior member
Сообщения: 13
Зарегистрирован: 02 сен 2006, 01:23
Контактная информация:

Сообщение Grachik » 02 фев 2007, 21:01

MADivan писал(а):КАКОГО ХРЕНА СИСТЕМА ВПУСТУЮ "ЦАРАПАЛА" ВИНЧЕСТЕРЫ 2 ГОДА ИЗ 4-ЁХ?
Что Вы вкладываете в понятие "царапала"? Если дисковая система в простое, то и нагрузка на нее существенно меньше. Да и головки не имеют физического контакта с пластинами. Лично мне термин "царапала" совершенно не понятен.

В случае постоянно включенного массива вы рискуете только механической частью, потому что постоянно крутятся диски. Если Вы постоянно включаете/выключаете систему - то рискуете еще и электрически. Любой электромеханик Вам подтвердит, что подавляющее большинство выходящего из строя оборудования помирает в момент пиковых нагрузок/перегрузок. Именно таким моментом является холодный старт системы. Ресурс же механической части гораздо больше.

Послушайтесь вашего сотрудника.

MADivan
Junior member
Сообщения: 7
Зарегистрирован: 02 фев 2007, 11:55
Откуда: Ukraine

Сообщение MADivan » 11 ноя 2007, 18:03

Grachik писал(а):Послушайтесь вашего сотрудника.
Пишет "сотрудник"
Не послушался. Массив "слетел" (Array is dead) еще в мае. Купили новый массив, возникли новые проблемы, но я уже не сисадмин (Слава Богу!) по собственной инициативе и этот человек уже не мой начальник. Поздравьте меня! :twisted:  :twisted:  :twisted:  :twisted:

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 12 ноя 2007, 13:26

Поздравляю. Без шуток.

Ответить

Вернуться в «Массивы - RAID технологии.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 21 гость