Вероятность отказа RAID от количества дисков.
Модераторы: Trinity admin`s, Free-lance moderator`s
Вероятность отказа RAID от количества дисков.
Вопрос к знатокам-математикам.
Как посчитать вероятность отказа массива RAID0 (нулевой) от количества дисков в этом самом RAID0.
Например я имею отдельный диск без RAID, так называемый JBOD. Вероятность отказа этого диска 5%.
А если я буду использовать 2 таких диска в RAID0, затем 3 диска, потом 4?
А если эти диски попарно раскидаю по 2-м каналам контроллера?
И как посчитать вероятность отказа RAID 5 массива?
Как посчитать вероятность отказа массива RAID0 (нулевой) от количества дисков в этом самом RAID0.
Например я имею отдельный диск без RAID, так называемый JBOD. Вероятность отказа этого диска 5%.
А если я буду использовать 2 таких диска в RAID0, затем 3 диска, потом 4?
А если эти диски попарно раскидаю по 2-м каналам контроллера?
И как посчитать вероятность отказа RAID 5 массива?
- a_shats
- Advanced member
- Сообщения: 5010
- Зарегистрирован: 27 авг 2002, 10:55
- Откуда: Москва
- Контактная информация:
Vilor
Все имхо.
Простите, а откуда Вы взяли 5% ?
Мне очень нравится цитата из одного весьма уважаемого эксперта по серверам: "Винты бывают еще не рухнувшими и уже рухнувшими" (за точность цитирования, правда, не ручаюсь). Т.е. безопаснее всего для серверов исходить из вероятности отказа винта (в JBOD) в 50% (или живой, или нет)
В результате вероятность отказа RAID0 прямо пропорциональна количеству дисков в нем.
Вероятность отказа RAID5: массив из 3-х винтов умрет при убиении любых двух... Для общего случая - надо считать.
Насчет разброса по каналам: если расположить диски на каналах контроллера так, чтобы при отключении любого одного канала массив оставался в живых, то - да, имеет смысл.
Все имхо.
Простите, а откуда Вы взяли 5% ?
Мне очень нравится цитата из одного весьма уважаемого эксперта по серверам: "Винты бывают еще не рухнувшими и уже рухнувшими" (за точность цитирования, правда, не ручаюсь). Т.е. безопаснее всего для серверов исходить из вероятности отказа винта (в JBOD) в 50% (или живой, или нет)
В результате вероятность отказа RAID0 прямо пропорциональна количеству дисков в нем.
Вероятность отказа RAID5: массив из 3-х винтов умрет при убиении любых двух... Для общего случая - надо считать.
Насчет разброса по каналам: если расположить диски на каналах контроллера так, чтобы при отключении любого одного канала массив оставался в живых, то - да, имеет смысл.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Теорию вероятности уже не помню (стыжусь). Но она есть в любом институтском учебнике математики.
Но на самом деле таким образом считать будет неправильно. (Вернее правильно для больших систем с десятками и сотнями дисков, где начинают работать законы статистики). На практике же, когда дисков всего несколько штук, работает не закон больших чисел, а закон подлости. При малой выборке вероятность отказа - повезет-не повезет. К тому же часто проблемы возникают по причине внешних воздействий (типа электропитания или действий пользователя), что прогнозировать невозможно (а можно и нужно предупреждать ).
Так что просто не надо использовать RAID0. При его сбое вероятность потери информации близка к 100%. А R5 часто можно поднять даже при вылете нескольких дисков.
Но на самом деле таким образом считать будет неправильно. (Вернее правильно для больших систем с десятками и сотнями дисков, где начинают работать законы статистики). На практике же, когда дисков всего несколько штук, работает не закон больших чисел, а закон подлости. При малой выборке вероятность отказа - повезет-не повезет. К тому же часто проблемы возникают по причине внешних воздействий (типа электропитания или действий пользователя), что прогнозировать невозможно (а можно и нужно предупреждать ).
Так что просто не надо использовать RAID0. При его сбое вероятность потери информации близка к 100%. А R5 часто можно поднять даже при вылете нескольких дисков.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Насколько я помню статистику, любая теория разумно работает начиная с некоторого объема выборки. В данном случае объем явно недостаточен (скрытые дефекты дисков - единицы процентов (а то и меньше) от общего количества).
Так что потеоретизировать можно, но толку от этого не будет. Так что лучше спросите математика
Так что потеоретизировать можно, но толку от этого не будет. Так что лучше спросите математика
Кое-чего надыбал в инете. Только не пойму...
Пусть в дисковой подсистеме установлено N одинаковых накопителей, среднее время наработки на отказ каждого - Mtbf. Тогда среднее время наработки на отказ всей системы MTBF вычисляется по формуле MTBF=1/(1/Mbtf1 + 1/Mbtf2-)=Mbtf / N, т.е. чем больше накопителей, тем меньше время наработки на отказ всей системы из N дисков, т.е. выше вероятность отказа всей системы.
- Igo®
- member
- Сообщения: 25
- Зарегистрирован: 23 авг 2002, 11:08
- Откуда: Saint-Petersburg
- Контактная информация:
вероятность отказа одного диска P. тогда вероятность выхода 2-х дисков P*P. вероятность выхода 2-х дисков из N будет равна числу сочетаний из N по 2, уможенному на P*P (блин, не знаю, как написать, короче Пэ квадрат на Сэ из N по 2), что равно P*P*N!/(2*(N-2)!). Это для рейда 5 для произвольного количества дисков. Для RAID 1 это про100 P*P, для 0-го не знаю..
Bye, I'll be back.
- a_shats
- Advanced member
- Сообщения: 5010
- Зарегистрирован: 27 авг 2002, 10:55
- Откуда: Москва
- Контактная информация:
Ну, если сильно нужна теория... Их есть (не у меня, правда ):
Оценка надежности дисковых накопителей
И прочая информация там же.
Оценка надежности дисковых накопителей
И прочая информация там же.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
to a_shats: не вижу разницы в цене между рэйд 10 и 0+1. И там и там двойная избыточность по винтам. К тому же их оба вроде бы только майлекс поддерживает - остальные или то или то. А вообще-то тут постоянная терминологическая путаница.
По сути же вопроса что-то определенное сказать трудно. Опишите задачу - попробуем подсказать. Разные уровни рэйда на разных задачах ведут себя по разному.
По сути же вопроса что-то определенное сказать трудно. Опишите задачу - попробуем подсказать. Разные уровни рэйда на разных задачах ведут себя по разному.
-
- Advanced member
- Сообщения: 54
- Зарегистрирован: 05 май 2006, 23:35
- Откуда: Москва
- Контактная информация:
по поводу RAID0 мои коментарии:gs писал(а):Так что просто не надо использовать RAID0. При его сбое вероятность потери информации близка к 100%. А R5 часто можно поднять даже при вылете нескольких дисков.
1. если причина выхода носителя - любые проблемы не связанные с повехностью винта, то тут шансы равные что у RAID0 что у RAID1 что у RAID5
2. если начался сыпаться один из винтов (появились плохие сектора по каким-то причинам и remapping не проходит (резервные кончились)) то просто сливаем сектор в сектор начавший сыпаться винт на аналогичный и включаем его обратно в массив. Имеем: незанчительную потерю, но все же потерю в файлах.
3. RAID5 (а лучше 6) хорош тем что воткнул и забыл. уборщица может винты сгоревший вытащить и с полки новый вставить. По любому лучше, но нужно определится с контроллером и хорошими драйверами для него.
Как совет по любому надо мониторить SMART чтобы при подходе к критическому моменту быть готовым и его предотвратить.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей