Sauron_zombie писал(а):конечно, WP(=6) на R6/60 может несколько пугать относительно такового (=2) на R10, но если увеличение к-ва дисков способно покрыть потребность в Write I/O (дать не ниже нужной по ТЗ), то пуркуа бы и не па?
Таки пугает
Write Penalty = 6.
RAID6 не готов использовать: и по скорости ребилдов, и по пенальти, и по + ещё один диск на вычисления, и по IOPS.
Блин, ща кусаться начну!
Какая разница, что у R6 WP=6, если он даст скорость ВЫШЕ минимально приемлемой/допустимой для Ваших задач.
Я как-то уже иллюстрировал - R6 из 7 дисков SATA 7k2 на стареньком 3Ware 9650 даёт ~200MB/s (мегаБАЙТ/с.) на sustained записи (на протяжении пары-тройки часов - это была реальная задача на архивирование быкапов)!
Т.е. не нужно просто так пугаться высокого WP - если и при таковом производительности R6 на запись достаточно для требуемых задач.
Sauron_zombie писал(а):RAID60 - это, конечно, круто, но такое надо для уж совсем критичных приложений/данных, да и
N-4 дисков - это как у меня с RAID10 сейчас. Наверное, это нужно для массива из дешёвых десктопных SATA большого объёма и несильно критичных данных.
Окончание тезиса несколько противоречит его началу, ну да ладно, я не буквоед.
Просто R60 - не круто, в смысле, не круче того же R6: там не качественная разница в пар-рах и свойствах, а количественная, да и та не сказать чтоб очень велика.
Sauron_zombie писал(а):RAID5 и рассматривать не хочу - не ругаю, но и не хочу я его.
И, кстати, поделом - сейчас общим местом стало уже использование вместо R5 либо R6/60, либо R10/
Sauron_zombie писал(а):не факт, что вылет диска и последующий ребилд (про HSD не забываем!) придутся чОтко на 10.00-19.00 и/или на будни - а тогда часть ребилда пройдёт в нерабочий промежуток и завершится ощутимо скорее.
Но и не забываем про Законы Мерфи )))
А при чём тут "законы Мерфи"??? Вероятность вылета диска (при нормальных условиях) - штука стохастическая.
И, скажем, вылет диска в выходные дни или ночью между буднями у ординарной лавки, которая в это время не нагружает работой массив, приведёт к тому, что (авто)ребилд в эти периоды завершится быстрее, если rebuild rate будет выставлен в пользу ребилда, а не I/O.
Sauron_zombie писал(а):А Hot Spare имеется. Стоит, мигает. Думаю иной раз вытащить его, чтоб не мигал и не крутился попусту, но с другой стороны.
... с другой стороны при наличии HSD минимизируется время пребывания массива в деградированном состоянии.
Просто представьте себе, что HSD нет, диск вылетел, скажем, числа 1-2 января, дежурного админа нет (или нет в шкафу харда на замену), пока с каникул вернётся админ и/или поставщик хардов, пока счёт, пока проплата, пока получение - N суток... не, N мало, пусть будет P или даже Q суток... в течении которых всё будет висеть на волоске.
Sauron_zombie писал(а):С другой стороны
Интересно, сколько могут служить энтерпрайзные диски SAS 15K? У меня лет 5 им.
У меня некоторые десктопные SATA в хранилке "третьей линии" столько отходили, а уж SAS-ам ентерпрайзным, да в хорошем охлаждении... думаю, ещё пол-столька они просто обязаны отслужить с хорошей вероятностью.
Хотя вывести их при возможности на "вторую линию" было бы уместным.
И да - это я про "боевые" диски: HSD же в таком же режиме снашивается меньше, как по мне.
Sauron_zombie писал(а):через рейд-контроллер, временно перешитый из IR в IT
- ну не было у него HBA
У меня была мысль попробовать это сделать в момент, когда ув.тов.
LevT с ru-board'a хвалил своё СХД на ZFS под Solaris. Но жЫсть бьёт ключом - газовым и по голове - и не нашлось у меня времени и сил попробовать это всё. А самое главное - нет у меня опыта со всеми этими невыньдосями.
Я весьма уважаю тов.
LevT и во многих вещах он, бесспорно прав, но...
Его СХД на Солярке (с ZFS) - штука тонкая: её надо уметь "готовить". Собственно, он сам заявлял:
"я не ставлю в продакшен то, что я не умею саппортить и траблшутить".
Во-первых, хотя ZFS суть есть LVM, mdadm и FS в одном флаконе, умная, быстрая и мощная до безобразия штука, но основы никто не отменял: raid-z - это функциональный аналог R5, а raid-z2 - R6. И при всей "интеллектуёвости" и прошаренности, ZFS точно так же уязвима в плане отдельных дисков.
Я встречал бытующее мнение, что благодаря своей умности, ZFS`у всё равно, что "жрать" - хоть из говна и палок собери, будет работать, как надо. Но коли чахлый диск выпадет из того же raid-z, то это всё равно, что остаться с деградировавшим R5. И ребилд что там, что там, будет идти сравнимое время.
Ну а во-вторых не нужно впадать в крайности и замахиваться на "элиту" (типа Соляры и ZFS) - есть работающие решения, не требующие сверхусилий по их пониманию и внедрению. Сам я, например, спокойно использую OpenFiler уже лет пять как - а его развернуть и настроить сможет даже неглупый эникей. И что характерно, будучи раз развёрнута, эта шняга пашет годами, не требуя вмешательства. Да, это не дорогущие брендовые хранилки, но такие entry level решения, будучи адекватными решаемым задачам, ощутимо понижают порог вхождения в тему (в хорошем смысле).
Sauron_zombie писал(а):А ещё я живу на контроллерах с Write Back без BBU, надеясь на On-line UPS (
Innova RT 3K). Безумие?
Отчасти.
UPS страхует от пропадания напруги в линии - но есть ещё ненулевая вероятность вылета питальника (вот уверен, что он у Вас не редундантный
), мамки, проца, памяти. И вот в этом случае BBU позволить с`flush`ить на диски кеш рейд-контроллера - чего не позволит UPS.