Очень часто ломается массив!
Модераторы: Trinity admin`s, Free-lance moderator`s
Очень часто ломается массив!
Всем привет. Ситуация следующая.
Есть массив из 8 дисков RAID 10.
Контроллер LSI 9341-8i, backplane SAS825TQ. Соединены кабелем minisas на sata
Частенько замечаю запись следующего типа перед тем как массив падает, и диск начинает ребилдиться.
1Power on, reset, or bus device reset occurred, CDB = 0x4d 0x00 0x50 0x00 0x00 0x00 0x00 0x00 0x18 0x00 , Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x29 0x00 0x00 0x00 0x00 0x00
За 2 недели уже 2 диска падало. Сервер новый, где то 6 месяцев.
Подозрения что бэкплейн глючный, так как 3 месяца без проблем отработал.
Дисков hot spare нет. После смены диска начал писать, чего раньше не было
Reminder: Potential non-optimal configuration due, PD commissioned as Emergency Spare
Кто что может сказать по данному случаю.
Есть массив из 8 дисков RAID 10.
Контроллер LSI 9341-8i, backplane SAS825TQ. Соединены кабелем minisas на sata
Частенько замечаю запись следующего типа перед тем как массив падает, и диск начинает ребилдиться.
1Power on, reset, or bus device reset occurred, CDB = 0x4d 0x00 0x50 0x00 0x00 0x00 0x00 0x00 0x18 0x00 , Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x29 0x00 0x00 0x00 0x00 0x00
За 2 недели уже 2 диска падало. Сервер новый, где то 6 месяцев.
Подозрения что бэкплейн глючный, так как 3 месяца без проблем отработал.
Дисков hot spare нет. После смены диска начал писать, чего раньше не было
Reminder: Potential non-optimal configuration due, PD commissioned as Emergency Spare
Кто что может сказать по данному случаю.
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Очень часто ломается массив!
Alick
Проверьте, выставлены ли джамперы на бекплейне в режим SGPIO.
Также проверьте, включен или нет режим Write Back на локальных кешах дисков (его включение допустимо только на SSD и дисках с защитой кеша от сбоев питания).
Ну и проверяйте кабели от контроллера к бекплейну.
Проверьте, выставлены ли джамперы на бекплейне в режим SGPIO.
Также проверьте, включен или нет режим Write Back на локальных кешах дисков (его включение допустимо только на SSD и дисках с защитой кеша от сбоев питания).
Ну и проверяйте кабели от контроллера к бекплейну.
Re: Очень часто ломается массив!
Можно с разъяснением так как не сталкивался никогда с понятием джампер и SGIPO
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Очень часто ломается массив!
Alick
Вот здесь в приложении все написано.
Вот здесь в приложении все написано.
Re: Очень часто ломается массив!
Джампер раньше назывался перемычкой проще говоря. Все нормально там стоит с завода режим SGIPO. Write Back нужен только для скорости записи и SSD диски тут не причем, у самого стоит все нормально пашет на адаптеке.
Write Back - данные записываются сначала в кэш, и только потом (либо по мере заполнения кэш-а, либо в моменты минимальной загрузки дисковой системы) из кэш-а на диски. При этом, сигнал о завершении операции записи передается управляющей ОС сразу же по получении данных кэш-ем контроллера.
Write Back работает быстрее, но при этом надо помнить, что в случае сбоя питания все данные, которые находились в этот момент в кэш-е, будут потеряны. Причем, управляющая ОС (а следовательно и приложение, записывавшее эти данные) ничего об этом "не узнают", так как они уже получили сообщение от контроллера об успешном завершении записи. Например, если в кэше находились данные транзакции сервера СУБД, то СУБД будет уверенна, что с данными все хорошо, хотя на самом деле это не так.
Write Back - данные записываются сначала в кэш, и только потом (либо по мере заполнения кэш-а, либо в моменты минимальной загрузки дисковой системы) из кэш-а на диски. При этом, сигнал о завершении операции записи передается управляющей ОС сразу же по получении данных кэш-ем контроллера.
Write Back работает быстрее, но при этом надо помнить, что в случае сбоя питания все данные, которые находились в этот момент в кэш-е, будут потеряны. Причем, управляющая ОС (а следовательно и приложение, записывавшее эти данные) ничего об этом "не узнают", так как они уже получили сообщение от контроллера об успешном завершении записи. Например, если в кэше находились данные транзакции сервера СУБД, то СУБД будет уверенна, что с данными все хорошо, хотя на самом деле это не так.
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Очень часто ломается массив!
Alick
Я имел ввиду кеширование записи в кеше самих дисков. На обычных SAS/SATA дисках эта опция должна быть выключена, т.к. при ее включении высока вероятность проблем с массивами при внезапной перезагрузке, сбоях и т.п.
Сообщение о диске с падениями не связано. Попробуйте обновить прошивку на контроллере. На некоторых контроллерах LSI были похожие сообщения, которые исправлялись в новой прошивке.
Я имел ввиду кеширование записи в кеше самих дисков. На обычных SAS/SATA дисках эта опция должна быть выключена, т.к. при ее включении высока вероятность проблем с массивами при внезапной перезагрузке, сбоях и т.п.
Сообщение о диске с падениями не связано. Попробуйте обновить прошивку на контроллере. На некоторых контроллерах LSI были похожие сообщения, которые исправлялись в новой прошивке.
Re: Очень часто ломается массив!
Обновлять через родную утилиту MEGARAID?
И как на счет сохранности данных, после обновления массив не разрушиться?
И как на счет сохранности данных, после обновления массив не разрушиться?
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Очень часто ломается массив!
Нет, не разрушится, но на всякий случай сделайте бекап.Alick писал(а):И как на счет сохранности данных, после обновления массив не разрушиться?
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя