Вероятность отказа RAID от количества дисков.

Конфигурирование, планирование RAID систем, возможности, технологии, теория. Qlogic, LSI Logic, Adaptec ...

Модераторы: Trinity admin`s, Free-lance moderator`s

Vilor
member
Сообщения: 29
Зарегистрирован: 01 окт 2002, 12:19

Вероятность отказа RAID от количества дисков.

Сообщение Vilor » 09 апр 2003, 10:57

Вопрос к знатокам-математикам. :)

Как посчитать вероятность отказа массива RAID0 (нулевой) от количества дисков в этом самом RAID0.

Например я имею отдельный диск без RAID, так называемый JBOD. Вероятность отказа этого диска 5%.

А если я буду использовать 2 таких диска в RAID0, затем 3 диска, потом 4?

А если эти диски попарно раскидаю по 2-м каналам контроллера?

И как посчитать вероятность отказа RAID 5 массива?

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 09 апр 2003, 12:55

Vilor
Все имхо.
Простите, а откуда Вы взяли 5% ?
Мне очень нравится цитата из одного весьма уважаемого эксперта по серверам: "Винты бывают еще не рухнувшими и уже рухнувшими" (за точность цитирования, правда, не ручаюсь). Т.е. безопаснее всего для серверов исходить из вероятности отказа винта (в JBOD) в 50% (или живой, или нет) ;)
В результате вероятность отказа RAID0 прямо пропорциональна количеству дисков в нем.
Вероятность отказа RAID5: массив из 3-х винтов умрет при убиении любых двух... Для общего случая - надо считать.
Насчет разброса по каналам: если расположить диски на каналах контроллера так, чтобы при отключении любого одного канала массив оставался в живых, то - да, имеет смысл.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 09 апр 2003, 12:58

Теорию вероятности уже не помню (стыжусь). Но она есть в любом институтском учебнике математики.
Но на самом деле таким образом считать будет неправильно. (Вернее правильно для больших систем с десятками и сотнями дисков, где начинают работать законы статистики). На практике же, когда дисков всего несколько штук, работает не закон больших чисел, а закон подлости. При малой выборке вероятность отказа - повезет-не повезет. К тому же часто проблемы возникают по причине внешних воздействий (типа электропитания или действий пользователя), что прогнозировать невозможно (а можно и нужно предупреждать :!: ).

Так что просто не надо использовать RAID0. При его сбое вероятность потери информации близка к 100%. А R5 часто можно поднять даже при вылете нескольких дисков.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 09 апр 2003, 13:01

С точки зрения надежности, разносить диски по каналам имеет смысл, если это RAID1 или 0+1 (10). В этом случае вылет канала (обрыв кабеля, сгорание шинного буфера) не приведет к катастрофе. RAID5 вылетит все равно.

Vilor
member
Сообщения: 29
Зарегистрирован: 01 окт 2002, 12:19

Сообщение Vilor » 09 апр 2003, 14:19

Не господа, так теоретически и я могу, законы подлости вообще вне понимания.
Мне циферки нужны. Конкретные. Исходя из настоящих формул статистики привязанных к теории RAID. :)

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 09 апр 2003, 14:44

Насколько я помню статистику, любая теория разумно работает начиная с некоторого объема выборки. В данном случае объем явно недостаточен (скрытые дефекты дисков - единицы процентов (а то и меньше) от общего количества).
Так что потеоретизировать можно, но толку от этого не будет. Так что лучше спросите математика :)

Аватара пользователя
Nikel
member
Сообщения: 23
Зарегистрирован: 08 окт 2002, 16:48

Сообщение Nikel » 09 апр 2003, 15:53

Я конечно не матиматик, но мне кажется, что на RAID 0 вероятность отказа увеличивается пропорционально количеству используемых дисков. Хотя тогда не понятно. Если дисков 20 штук, то массив RAID 0 на 100% развалится. А ведь мы в полиграфии часто используем именно RAID0. Чего то я запутался. :(

Vilor
member
Сообщения: 29
Зарегистрирован: 01 окт 2002, 12:19

Сообщение Vilor » 09 апр 2003, 16:04

to a_shats
Простите, а откуда Вы взяли 5% ?
Простое допущение. Из ста HDD за время гарантии вылетает минимум 5 шт. А это 5%.
to Nikel
Согласен, с пропорциональностью чего-то не сходится...

Аватара пользователя
Nikel
member
Сообщения: 23
Зарегистрирован: 08 окт 2002, 16:48

Сообщение Nikel » 10 апр 2003, 16:53

Кое-чего надыбал в инете. Только не пойму...
Пусть в дисковой подсистеме установлено N одинаковых накопителей, среднее время наработки на отказ каждого - Mtbf. Тогда среднее время наработки на отказ всей системы MTBF вычисляется по формуле MTBF=1/(1/Mbtf1 + 1/Mbtf2-)=Mbtf / N, т.е. чем больше накопителей, тем меньше время наработки на отказ всей системы из N дисков, т.е. выше вероятность отказа всей системы.

Аватара пользователя
Igo®
member
Сообщения: 25
Зарегистрирован: 23 авг 2002, 11:08
Откуда: Saint-Petersburg
Контактная информация:

Сообщение Igo® » 11 апр 2003, 15:23

вероятность отказа одного диска P. тогда вероятность выхода 2-х дисков P*P. вероятность выхода 2-х дисков из N будет равна числу сочетаний из N по 2, уможенному на P*P (блин, не знаю, как написать, короче Пэ квадрат на Сэ из N по 2), что равно P*P*N!/(2*(N-2)!). Это для рейда 5 для произвольного количества дисков. Для RAID 1 это про100 P*P, для 0-го не знаю.. :)
Bye, I'll be back.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 12 апр 2003, 13:19

Ну, если сильно нужна теория... Их есть (не у меня, правда ;) ):
Оценка надежности дисковых накопителей
И прочая информация там же.

ap
Power member
Сообщения: 45
Зарегистрирован: 08 апр 2003, 11:27
Откуда: Санкт-Петербург

Сообщение ap » 12 апр 2003, 16:24

Тогда возникает резонный вопрос подобрать оптимально надежную и недорогую конфигурация.Raid0 - ненадежно, Raid1 - надежно, но возникает вопрос скорости.Какие еще будут варианты ?

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 14 апр 2003, 10:13

Ых...
"Надежно+быстро" и "недорого" - антонимы ;)
А вообще - у RAID 1 вопрос с производительностью только на запись.
По скорости чтения (аппаратный RAID) RAID1 = RAID0.
А так - если хочется надежно+быстро, то RAID10, если при этом еще и не слишком дорого, то 0+1. Все имхо.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 14 апр 2003, 11:55

to a_shats: не вижу разницы в цене между рэйд 10 и 0+1. И там и там двойная избыточность по винтам. К тому же их оба вроде бы только майлекс поддерживает - остальные или то или то. А вообще-то тут постоянная терминологическая путаница.

По сути же вопроса что-то определенное сказать трудно. Опишите задачу - попробуем подсказать. Разные уровни рэйда на разных задачах ведут себя по разному.

udofun
Advanced member
Сообщения: 54
Зарегистрирован: 05 май 2006, 23:35
Откуда: Москва
Контактная информация:

Сообщение udofun » 11 май 2006, 02:01

gs писал(а):Так что просто не надо использовать RAID0. При его сбое вероятность потери информации близка к 100%. А R5 часто можно поднять даже при вылете нескольких дисков.
по поводу RAID0 мои коментарии:

1. если причина выхода носителя - любые проблемы не связанные с повехностью винта, то тут шансы равные что у RAID0 что у RAID1 что у RAID5
2. если начался сыпаться один из винтов (появились плохие сектора по каким-то причинам и remapping не проходит (резервные кончились)) то просто сливаем сектор в сектор начавший сыпаться винт на аналогичный и включаем его обратно в массив. Имеем: незанчительную потерю, но все же потерю в файлах.
3. RAID5 (а лучше 6) хорош тем что воткнул и забыл. уборщица может винты сгоревший вытащить и с полки новый вставить. По любому лучше, но нужно определится с контроллером и хорошими драйверами для него.

Как совет по любому надо мониторить SMART чтобы при подходе к критическому моменту быть готовым и его предотвратить.

Ответить

Вернуться в «Массивы - RAID технологии.»